llamar - ¿Cómo recupero una URL de un sitio web usando Java?
index jsp (5)
He usado JTidy en un proyecto y funcionó bastante bien. Una lista de otros analizadores está aquí , pero además de JTidy no conozco ninguno de ellos.
Quiero usar los comandos HTTP GET y POST para recuperar URL de un sitio web y analizar el HTML. ¿Cómo hago esto?
La respuesta ticked / aprobada para esto es de robhruska, gracias. Esto muestra la forma más básica de hacerlo, es simple con una comprensión de lo que es necesario para hacer una conexión de URL simple. Sin embargo, la estrategia a más largo plazo sería usar HTTP Client para formas más avanzadas y completas de características para completar esta tarea.
Gracias a todos, aquí está la respuesta rápida de nuevo:
URL url = new URL("http://example.com");
HttpURLConnection connection = (HttpURLConnection)url.openConnection();
connection.setRequestMethod("GET");
connection.connect();
InputStream stream = connection.getInputStream();
// read the contents using an InputStreamReader
La forma más fácil de hacer un GET es usar el built in java.net.URL. Sin embargo, como se mencionó, httpclient es la forma correcta de hacerlo, ya que le permitirá, entre otros, gestionar los redireccionamientos.
Para analizar el html, puede usar el analizador html .
Puede usar HttpURLConnection en combinación con URL .
URL url = new URL("http://example.com");
HttpURLConnection connection = (HttpURLConnection)url.openConnection();
connection.setRequestMethod("GET");
connection.connect();
InputStream stream = connection.getInputStream();
// read the contents using an InputStreamReader