search - buscador - lucene
Xapian vs Apache Solr (1)
Xapian se parece más a Lucene, una biblioteca que integra con su aplicación. Si tienes una aplicación C ++, entonces Xapian podría ser una mejor combinación. Si tienes una aplicación Java, Lucene es casi seguramente la mejor opción.
Si desea un servidor de búsqueda, entonces compare Omega (construido en Xapian) con Solr (basado en Lucene). No he usado Omega o Xapian, pero Solr tiene algunas características de las que he llegado a depender, especialmente las cadenas de análisis por campo. Esa es una idea brillante, y una que me hubiera gustado haber pensado cuando estaba trabajando en Ultraseek.
Es bastante fácil ampliar la cadena de análisis Solr con su propia clase Java. Espero que sea más difícil en C ++ con Omega / Xapian.
Los dos motores usan diferentes modelos de relevancia subyacentes. Xapian es un motor probabilístico, Lucene es un motor espacial vectorial. He visto a ambos modelos sintonizados para un buen rendimiento, por lo que podría no ser una razón para decidir.
La comunidad Solr / Lucene es grande y muy útil.
Estoy tratando de obtener una buena búsqueda del lenguaje natural en un sitio web, y tratar de entender las ventajas de Apache Solr vs Xapian. Xapian parece más fácil de configurar. ¿Ambos ofrecen buenas búsquedas de lenguaje natural? Cualquier idea apreciada.