parser example español crawl python html parsing dom scrapy

python - example - Cómo seleccionar el siguiente nodo usando scrapy



scrapy selector (1)

Tengo html se ve así:

<h1>Text 1</h1> <div>Some info</div> <h1>Text 2</h1> <div>...</div>

Entiendo cómo extraer el uso de la información de scrapy de h1:

content.select("//h1[contains(text(),''Text 1'')]/text()").extract()

Pero mi objetivo es extraer contenido de <div>Some info</div>

Mi problema es que no tengo información específica sobre div. Todo lo que sé es que va exactamente después de <h1>Text 1</h1> . ¿Puedo, usando selectores, obtener el elemento SIGUIENTE en el árbol? Elemento, que se encuentra en el mismo nivel en el árbol DOM?

Algo como:

a = content.select("//h1[contains(text(),''Text 1'')]/text()") a.next("//div/text()").extract() Some info


Prueba este xpath :

//h1[contains(text(), ''Text 1'')]/following-sibling::div[1]/text()