rendered parameter name bean java html screen-scraping

java - parameter - selectbooleancheckbox rendered



Cómo recuperar HTML en Java (4)

Actualmente estoy usando esto:

String content = null; URLConnection connection = null; try { connection = new URL("http://www.google.com").openConnection(); Scanner scanner = new Scanner(connection.getInputStream()); scanner.useDelimiter("//Z"); content = scanner.next(); }catch ( Exception ex ) { ex.printStackTrace(); } System.out.println(content);

Pero no estoy seguro si hay una mejor manera.

Sin el uso de ninguna biblioteca externa, ¿cuál es la forma más sencilla de obtener el contenido HTML de un sitio web en un String?


Esto ha funcionado bien para mí:

URL url = new URL(theURL); InputStream is = url.openStream(); int ptr = 0; StringBuffer buffer = new StringBuffer(); while ((ptr = is.read()) != -1) { buffer.append((char)ptr); }

No estoy seguro de si la (s) otra (s) solución (es) proporcionada (s) son más eficientes o no.


Si bien no vainilla-Java, voy a ofrecer una solución más simple. Use Groovy ;-)

String siteContent = new URL("http://www.google.com").text


Acabo de dejar esta publicación en tu otro hilo , aunque lo que tienes arriba podría funcionar también. No creo que ninguno sea más fácil que el otro. Se puede acceder a los paquetes de Apache simplemente usando import org.apache.commons.HttpClient en la parte superior de su código.

Editar: Olvidé el enlace;)