with tag soup scraping real page info how for find_all businesses beautiful and php python beautifulsoup mechanize

php - tag - scraper web python



¿Mecanizar y BeautifulSoup para PHP? (2)

SimpleTest le proporciona una funcionalidad similar:

http://www.simpletest.org/en/browser_documentation.html

Me preguntaba si había algo similar como Mechanize o BeautifulSoup para PHP?


No sé cuán poderoso es BeautifulSoup, así que quizás esto no sea tan bueno; pero puedes intentar usar DOMDocument::loadHTML :

La función analiza el HTML contenido en la fuente de la cadena. A diferencia de cargar XML, HTML no tiene que estar bien formado para cargar.

Después de usar esto, debería poder acceder al documento HTML utilizando métodos DOM, incluidas las consultas XPath.