ruby nokogiri html-parsing hpricot

ruby - ¿Nokogiri vs Hpricot?



html-parsing (3)

¿Cuál elegirías? Mis atributos importantes son (no en orden):

  1. Soporte y futuras mejoras.
  2. Base comunitaria y de conocimientos generales (en internet).
  3. Integral (IE, probado para analizar una amplia gama de páginas *. * Ml).
  4. Actuación.
  5. Huella de memoria (tiempo de ejecución, no el código base).

El caso en el que he encontrado que Hpricot es útil para tratar con HTML roto es necesario que permanezca roto después del procesamiento. Hpricot es bueno para modificar solo la parte de un documento que ha actualizado. A menos que esto sea necesario, Nokogiri es el camino a seguir.


Elija Nokogiri, para todos los puntos y especialmente el punto uno: Hpricot ya no se mantiene .

Meta respuesta: vea ruby-toolbox para tener una idea de la popularidad de diferentes herramientas en un área determinada.


Solo elija Hpricot si no tiene, o no puede instalar, LibXML en la computadora que está usando. Si este no es el caso, elija Nokogiri, es mejor en los cinco atributos mencionados que en Hpricot.