tag - jsoup java netbeans
¿Cómo convierto un documento hecho en Jsoup(el analizador HTML de Java) en una cadena? (3)
- Elementos post = d.select ("div.post-content");
- Cadena dd = post.toString ();
- Documento ddd = Jsoup.parse (dd);
Después de analizar la cadena para documentar, puede usar en ella las funciones de documento
- Elementos scriptTag = ddd.getElementsByTag ("script");
- System.out.println (scriptTag);
Tengo un documento que se hizo en jsoup que se ve así
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
¿Cómo puedo convertir ese doc
en una cadena.
Has probado:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();
A medida que Document extiende Element , también tiene el método html () que "Recupera el HTML interno del elemento" de acuerdo con la API . Así que eso debería funcionar:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();
Información adicional:
Cada objeto de documento tiene una referencia a una instancia de la clase interna Document.OutputSettings, a la que se puede acceder a través del método outputSettings () del documento. Allí puede habilitar / deshabilitar la impresión bonita utilizando el configurador prettyPrint (verdadero / falso) . Consulte la API para Document and Document.OutputSettings para obtener más información.
doc.toString()
funciona, al igual que doc.outerHtml()
.