solr edismax dismax

solr - ¿Cuál es la diferencia entre dismax y EdisMax?



(2)

Me gusta saber cuál es la diferencia entre DisMax y EDisMax ..? ¿Hay alguna referencia útil para saber sobre eso? Además, me gustaría saber cuáles son las consultas a las que DisMax no produjo el resultado por lo que EDisMax es capaz de producir el resultado ...

EDisMax tiene algunos parámetros de consulta como el parámetro boost, ps Parameter, The pf2 Parameter; Pero aparte de este parámetro de consulta, EDisMax es mejor que DisMax ; cómo se procesan las consultas entre estos dos. ¿ Qué factores hacen que EDisMax funcione mejor que DisMax?

Algunas consultas no dieron resultado en DisMax pero EDisMax dio resultado para esas consultas.

Busqué en Google la diferencia entre DisMax y EDisMax. He descubierto que los parámetros que se han utilizado en EDisMax son solo la diferencia entre DisMax y EDisMax; pero estoy esperando algo técnicamente para explicar a otros en la presentación.

http://ip:8983/solr/C73/select/?defType=edismax&q=ipod O video & fl = nombre de archivo, puntaje y hl = verdadero & hl.fl = contenido contentenstem nombre de archivo & hl.zetaContentField = contenido

Para la consulta anterior, EDisMax produce alrededor de 238 resultados; pero DisMax produce 0 resultado. Entonces, ¿cuál es la diferencia entre el manejo de esta consulta mediante este analizador dos? ¿Qué hace que EDisMax produzca resultados? Eso es lo que me gusta saber ...


Como Dismax tenía muchas limitaciones, se agregó el analizador de consultas EDismax.

Echa un vistazo a SOLR-1553

Para empezar (como en la documentación):

El analizador dismax extendido se basó en el analizador dismax de Solr original.

  • Admite la sintaxis de consulta completa de Lucene en ausencia de errores de sintaxis
  • admite "y" / "o" ​​para significar "AND" / "OR" en el modo de sintaxis de Lucene
  • Cuando hay errores de sintaxis, se mejora el escape parcial inteligente de caracteres especiales para evitarlos ... en este modo, las consultas de campo, +/- y las consultas de frase aún son compatibles.
  • Mejora de la proximidad a través de palabras bigramas ... esto evita el problema de necesitar el 100% de las palabras en el documento para obtener cualquier impulso, así como tener todas las palabras en un solo campo.
  • manejo avanzado de palabras de parada ... las palabras de parada no son necesarias en la parte obligatoria de la consulta, pero aún se usan (si están indexadas) en la parte de aumento de proximidad. Si una consulta consta de todas las palabras clave (por ejemplo, ser o no ser), todo será requerido.
  • Admite el parámetro "boost" ... como el parámetro dismax bf, pero multiplica la consulta de la función en lugar de agregarla.
  • Admite consultas anidadas negativas puras ... por lo que una consulta como + foo (-foo) coincidirá con todos los documentos

Sin embargo, como lo haría con muchos JIRA asociados para mejorar la capacidad de análisis de consultas y el soporte para más funciones.

Leer a través de JIRA puede ser realmente perspicaz :)