tutorial query example lucene

query - lucene vs elasticsearch



Comprender los segmentos lucene (1)

Tengo estos 3 archivos en una carpeta y todos están relacionados con un índice creado por Lucene:

  • _0.cfs
  • segmentos_2
  • segments.gen

¿Para qué se usan? ¿Es posible convertir alguno de ellos a un formato legible por humanos para discernir un poco más sobre cómo lucene funciona con sus índices?


Los dos archivos de segmentos almacenan información sobre los segmentos, y .cfs es un archivo compuesto que consiste en otros archivos de índice (como archivos de índice, almacenamiento, eliminación, etc.).

Para ver la documentación de los diferentes tipos de archivos utilizados para crear un índice Lucene, consulte este resumen de extensiones de archivos

Generalmente, no, los archivos Lucene no son legibles por humanos. Están diseñados más para la eficiencia y la velocidad que la legibilidad humana. La forma de obtener un formato legible para las personas es acceder a ellas a través de la API Lucene (a través de Luke, o Solr, o algo así).

Si desea una comprensión completa de los formatos de archivo en uso, el paquete de códecs sería el lugar para buscar.