lucene hebrew stemming

Analizador hebreo lucene



hebrew stemming (2)

dtsearch tiene un plugin de origen hebreo llamado "pensim". Parece ser desarrollado por "wizcomtech.com".

¿Alguien sabe si existe?

He estado buscando en Google por meses ...

Gracias


Actualizar
HebMorph

Por curiosidad provocada por su pregunta, me puse en contacto con Itamar Syn-Hershko, que estaba activa en las listas de correo de Lucene hace aproximadamente un año cuando estaba trabajando en un analizador hebreo para Lucene. Le pregunté si había completado su analizador. Aquí hay algunos fragmentos relevantes de su respuesta:

Para hacer una larga historia corta, no lo hice. No hay un analizador de hebreo libre / de código abierto decente para Lucene, lo que puedo decir con seguridad. No estoy seguro de cuáles son sus antecedentes sobre el tema, pero créanme cuando digo que no hay una manera fácil de hacer esto; También podría ser que Lucene no está diseñado para búsquedas en hebreo, pero estoy de acuerdo en que se debe dar una solución. Por supuesto, la forma más segura de indexar y buscar textos en hebreo es usar un stemmer especializado, y la integración con Lucene no es la más fácil, incluso después de haber hecho esto. Hay algunas soluciones muy buenas para la búsqueda de hebreo en el mercado, solo una que conozco es usar a Lucene en su núcleo; Recientemente he intentado contactarlos, todavía no hay respuesta ...

El producto comercial basado en Lucene que se menciona se llama ATTIVIO y el sitio web de ATTIVIO afirma tener soporte en hebreo. En SIGTRS (grupo de interés de recuperación de texto en hebreo) , ha habido cierta discusión con respecto a ATTIVIO que afirma que está basada en Lucene.

Entonces, aparentemente, es posible crear un analizador hebreo decente para Lucene, pero no hay un analizador gratuito disponible en este momento.