tag section script schools samp rails ruby html-parser

section - Método para analizar el documento HTML en Ruby?



tag html script (4)

al igual que la clase DOMDocument en PHP, ¿hay alguna clase en RUBY (es decir, el núcleo RUBY) para analizar y obtener el valor de los elementos del nodo a partir de un documento HTML.


Deberías hpricot un vistazo a hpricot . Es extremadamente bueno. No es rubí "central", pero es una gema de uso común.


No hay un analizador de HTML incorporado (todavía), pero algunos muy buenos están disponibles, en particular Nokogiri .

Meta-respuesta: para necesidades comunes como estas, recomendaría visitar el sitio de Ruby Toolbox . Notarás que Nokogiri es la principal recomendación para los analizadores de HTML


Ruby Cheerio: un analizador HTML de estilo jQuery en ruby. Una versión simplificada de Nokogiri para rastreadores. Esta es la versión ruby ​​de la cheerio del paquete NodeJS más popular.

Siga el enlace para un ejemplo simple de rastreador.

joya instalar ruby-cheerio

require ''ruby-cheerio'' jQuery = RubyCheerio.new("<html><body><h1 class=''one''>h1_1</h1><h1>h1_2</h1></body></html>") jQuery.find(''h1'').each do |head_one| p head_one.text end # getting attribute values like jQuery. p jQuery.find(''h1.one'')[0].prop(''h1'',''class'') # function chaining similar to jQuery. p jQuery.find(''body'').find(''h1'').first.text


También puedes probar Oga por Yorick Peterse.

Es un analizador XML / HTML escrito en Ruby que no requiere bibliotecas de sistema como libxml. Lo puedes encontrar aquí. https://github.com/YorickPeterse/oga