with tag example div content attribute java html-parsing jsoup html-parser

tag - jsoup java netbeans



¿Cómo convierto un documento hecho en Jsoup(el analizador HTML de Java) en una cadena? (3)

  1. Elementos post = d.select ("div.post-content");
  2. Cadena dd = post.toString ();
  3. Documento ddd = Jsoup.parse (dd);

Después de analizar la cadena para documentar, puede usar en ella las funciones de documento

  1. Elementos scriptTag = ddd.getElementsByTag ("script");
  2. System.out.println (scriptTag);

Tengo un documento que se hizo en jsoup que se ve así

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

¿Cómo puedo convertir ese doc en una cadena.


Has probado:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); String htmlString = doc.toString();

A medida que Document extiende Element , también tiene el método html () que "Recupera el HTML interno del elemento" de acuerdo con la API . Así que eso debería funcionar:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); String htmlString = doc.html();

Información adicional:

Cada objeto de documento tiene una referencia a una instancia de la clase interna Document.OutputSettings, a la que se puede acceder a través del método outputSettings () del documento. Allí puede habilitar / deshabilitar la impresión bonita utilizando el configurador prettyPrint (verdadero / falso) . Consulte la API para Document and Document.OutputSettings para obtener más información.


doc.toString() funciona, al igual que doc.outerHtml() .