ruby - method - nokogiri usage
extraer enlaces(URL), con nokogiri en ruby, desde un href etiquetas html? (2)
Puedes hacerlo así:
doc = Nokogiri::HTML.parse(<<-HTML_END)
<div class="heat">
<a href=''http://example.org/site/1/''>site 1</a>
<a href=''http://example.org/site/2/''>site 2</a>
<a href=''http://example.org/site/3/''>site 3</a>
</div>
<div class="wave">
<a href=''http://example.org/site/4/''>site 4</a>
<a href=''http://example.org/site/5/''>site 5</a>
<a href=''http://example.org/site/6/''>site 6</a>
</div>
HTML_END
l = doc.css(''div.heat a'').map { |link| link[''href''] }
Esta solución encuentra todos los elementos de anclaje utilizando un selector css y recopila sus atributos href.
Quiero extraer de una página web todas las URL, ¿cómo puedo hacer eso con nokogiri?
ejemplo:
<div class="heat"> <a href=''http://example.org/site/1/''>site 1</a> <a href=''http://example.org/site/2/''>site 2</a> <a href=''http://example.org/site/3/''>site 3</a> </diV>
resultado debe ser una lista:
l = [''http://example.org/site/1/'', ''http://example.org/site/2/'', ''http://example.org/site/3/''
vale este código funciona perfecto para mí, gracias a Sris
p doc.xpath(''//div[@class="heat"]/a'').map { |link| link[''href''] }