section - Método para analizar el documento HTML en Ruby?
tag html script (4)
al igual que la clase DOMDocument en PHP, ¿hay alguna clase en RUBY (es decir, el núcleo RUBY) para analizar y obtener el valor de los elementos del nodo a partir de un documento HTML.
No hay un analizador de HTML incorporado (todavía), pero algunos muy buenos están disponibles, en particular Nokogiri .
Meta-respuesta: para necesidades comunes como estas, recomendaría visitar el sitio de Ruby Toolbox . Notarás que Nokogiri es la principal recomendación para los analizadores de HTML
Ruby Cheerio: un analizador HTML de estilo jQuery en ruby. Una versión simplificada de Nokogiri para rastreadores. Esta es la versión ruby de la cheerio del paquete NodeJS más popular.
Siga el enlace para un ejemplo simple de rastreador.
joya instalar ruby-cheerio
require ''ruby-cheerio''
jQuery = RubyCheerio.new("<html><body><h1 class=''one''>h1_1</h1><h1>h1_2</h1></body></html>")
jQuery.find(''h1'').each do |head_one|
p head_one.text
end
# getting attribute values like jQuery.
p jQuery.find(''h1.one'')[0].prop(''h1'',''class'')
# function chaining similar to jQuery.
p jQuery.find(''body'').find(''h1'').first.text
También puedes probar Oga por Yorick Peterse.
Es un analizador XML / HTML escrito en Ruby que no requiere bibliotecas de sistema como libxml. Lo puedes encontrar aquí. https://github.com/YorickPeterse/oga