xml ruby hash nokogiri libxml-ruby

xml - Convierta un documento de Nokogiri en un Ruby Hash



libxml-ruby (8)

¿Existe una manera fácil de convertir un documento de Nokogiri XML a Hash?

Algo así como Hash.from_xml Rails.


Aquí hay una versión mucho más simple que crea un hash robusto que incluye información de espacio de nombres, tanto para elementos como para atributos:

require ''nokogiri'' class Nokogiri::XML::Node TYPENAMES = {1=>''element'',2=>''attribute'',3=>''text'',4=>''cdata'',8=>''comment''} def to_hash {kind:TYPENAMES[node_type],name:name}.tap do |h| h.merge! nshref:namespace.href, nsprefix:namespace.prefix if namespace h.merge! text:text h.merge! attr:attribute_nodes.map(&:to_hash) if element? h.merge! kids:children.map(&:to_hash) if element? end end end class Nokogiri::XML::Document def to_hash; root.to_hash; end end

Visto en acción:

xml = ''<r a="b" xmlns:z="foo"><z:a>Hello <b z:m="n" x="y">World</b>!</z:a></r>'' doc = Nokogiri::XML(xml) p doc.to_hash #=> { #=> :kind=>"element", #=> :name=>"r", #=> :text=>"Hello World!", #=> :attr=>[ #=> { #=> :kind=>"attribute", #=> :name=>"a", #=> :text=>"b" #=> } #=> ], #=> :kids=>[ #=> { #=> :kind=>"element", #=> :name=>"a", #=> :nshref=>"foo", #=> :nsprefix=>"z", #=> :text=>"Hello World!", #=> :attr=>[], #=> :kids=>[ #=> { #=> :kind=>"text", #=> :name=>"text", #=> :text=>"Hello " #=> }, #=> { #=> :kind=>"element", #=> :name=>"b", #=> :text=>"World", #=> :attr=>[ #=> { #=> :kind=>"attribute", #=> :name=>"m", #=> :nshref=>"foo", #=> :nsprefix=>"z", #=> :text=>"n" #=> }, #=> { #=> :kind=>"attribute", #=> :name=>"x", #=> :text=>"y" #=> } #=> ], #=> :kids=>[ #=> { #=> :kind=>"text", #=> :name=>"text", #=> :text=>"World" #=> } #=> ] #=> }, #=> { #=> :kind=>"text", #=> :name=>"text", #=> :text=>"!" #=> } #=> ] #=> } #=> ] #=> }


Eche un vistazo a la mezcla simple que hice para el Nodo XML Nokogiri.

http://github.com/kuroir/Nokogiri-to-Hash

Aquí hay un ejemplo de uso:

require ''rubygems'' require ''nokogiri'' require ''nokogiri_to_hash'' html = '' <div id="hello" class="container"> <p>Hello! visit my site <a href="http://kuroir.com">Kuroir.com</a></p> </div> '' p Nokogiri.HTML(html).to_hash => [{:div=>{:class=>["container"], :children=>[{:p=>{:children=>[{:a=>{:href=>["http://kuroir.com"], :children=>[]}}]}}], :id=>["hello"]}}]


Encontré esto al intentar simplemente convertir XML a Hash (no en Rails). Pensaba que usaría Nokogiri, pero terminé yendo con Nori .

Entonces mi código era trival:

response_hash = Nori.parse(response)

Otros usuarios han señalado que esto no funciona. No he verificado, pero parece que el método de análisis se ha movido de la clase a la instancia. Mi código anterior funcionó en algún momento. El nuevo código (no verificado) sería:

response_hash = Nori.new.parse(response)


Si define algo como esto en su configuración:

ActiveSupport::XmlMini.backend = ''Nokogiri''

incluye un módulo en Nokogiri y to_hash método to_hash .


Si el nodo que ha seleccionado en Nokogiri consta de una sola etiqueta, puede extraer las claves, valores y comprimirlos en un hash, de esta forma:

@doc ||= Nokogiri::XML(File.read("myxmldoc.xml")) @node = @doc.at(''#uniqueID'') # this works if this selects only one node nodeHash = Hash[*@node.keys().zip(@node.values()).flatten]

Consulte http://www.ruby-forum.com/topic/125944 para obtener más información sobre la combinación de matrices de Ruby.


Si quiere convertir un documento de Nokogiri XML a un hash, solo haga lo siguiente:

require ''active_support/core_ext/hash/conversions'' hash = Hash.from_xml(nokogiri_document.to_s)


Use Nokogiri para analizar la respuesta XML al hash de ruby. Es bastante rápido.

doc = Nokogiri::XML(response_body) Hash.from_xml(doc.to_s)


Uso este código con libxml-ruby (1.1.3). No he usado nokogiri, pero entiendo que usa libxml-ruby de todos modos. También te animo a mirar ROXML ( http://github.com/Empact/roxml/tree ) que asigna elementos xml a objetos ruby; está construido encima de libxml.

# USAGE: Hash.from_libxml(YOUR_XML_STRING) require ''xml/libxml'' # adapted from # http://movesonrails.com/articles/2008/02/25/libxml-for-active-resource-2-0 class Hash class << self def from_libxml(xml, strict=true) begin XML.default_load_external_dtd = false XML.default_pedantic_parser = strict result = XML::Parser.string(xml).parse return { result.root.name.to_s => xml_node_to_hash(result.root)} rescue Exception => e # raise your custom exception here end end def xml_node_to_hash(node) # If we are at the root of the document, start the hash if node.element? if node.children? result_hash = {} node.each_child do |child| result = xml_node_to_hash(child) if child.name == "text" if !child.next? and !child.prev? return result end elsif result_hash[child.name.to_sym] if result_hash[child.name.to_sym].is_a?(Object::Array) result_hash[child.name.to_sym] << result else result_hash[child.name.to_sym] = [result_hash[child.name.to_sym]] << result end else result_hash[child.name.to_sym] = result end end return result_hash else return nil end else return node.content.to_s end end end end