tutorial example espaƱol crawler crawl python xpath scrapy web-crawler

python - example - scrapy selector



paginaciĆ³n-xpath para un rastreador en python (1)

Prueba la siguiente expresión:

//div[@class="pagination toolbarbloc"]/ul/li[@class="active"]/following-sibling::li/a/@href

Tenga en cuenta que omitió @ en [class="pagination toolbarbloc"] y li no es un hermano de ul

En realidad, estoy trabajando en un rastreador usando scrapy en Python, y casi termino, solo tengo un pequeño problema. El sitio web usa una paginación como esa:

<div class="pagination toolbarbloc"> <ul> <li class="active"><span>1</span></li> <li><a href="...">2</a></li> <li><a href="...">3</a></li> <li><a href="...">4</a></li> <li><a href="...">5</a></li> <li><a class="end" href="...">>></li> </ul> </div>

Así que trato de atrapar el "href" al balise li justo después de li con la clase "activa".

Intento algo así:

next_page_url_xpath = ''//div[@class="pagination toolbarbloc"]/ul/following-sibling::li[@class="active"]/a/@href''

pero no funcionó: IndexError: lista el índice fuera de rango

Acabo de comenzar con xpath y sé que es simple, pero después de leer mucho doc '', no tengo éxito con eso.

¡Muchas gracias a los que me ayudan!