comparison - lucene vs solr puntuación
scoring (2)
¿Puede alguien explicar (o citar una referencia) para comparar el mecanismo de puntuación utilizado por SOLR y LUCENE en palabras más simples. ¿Hay alguna diferencia en ellos?
No soy tan bueno en Solr / Lucene pero mi hallazgo se mostró como si fueran diferentes.
PD: solo intento una consulta simple como "+ Contenido: riesgo" y no utilicé ningún otro filtro.
La fórmula real se puede encontrar en la similitud javadocs .
Aquí hay un resumen de los parámetros involucrados y una breve descripción de lo que significan.
Solr usa Lucene bajo el capó y, por defecto, Solr usa el algoritmo de similitud de Lucene predeterminado .
Lucene usa conceptos del modelo de espacio vectorial para calcular el puntaje de los documentos. En resumen, las consultas y los documentos se pueden ver como vectores. Para calcular el puntaje de un documento para una consulta en particular, Lucene calcula cuán cerca del vector de cada documento están del vector de la consulta. Cuanto más cerca esté un documento de la consulta en VSM, mayor será el puntaje. Puede obtener más detalles observando la clase de Similitud de Lucene y el documento de Puntuación de Lucene.