type terms not_analyzed fields exact elasticsearch lucene hdfs

terms - elasticsearch type text not_analyzed



Posible almacenar imágenes en Elasticsearch? (1)

Almacenar imágenes completas en Elasticsearch no será muy beneficioso, ya que si la imagen se escala / recorta y luego se utiliza como una consulta, dará resultados incorrectos. Lo que necesita depende del motivo por el que desea indexar estas imágenes.

En mi caso, necesito encontrar si una imagen después de escalar o recortar tiene una coincidencia cercana en mi base de datos. Estoy extrayendo descriptores locales (SIFT / SURF) de imágenes y usándolos para construir un índice Elasticsearch. Esto reducirá el tamaño del índice de imagen, ya que en lugar de almacenar toda la imagen, solo se almacenan algunas características. Voy a almacenar todas estas imágenes en S3 por el momento y Elasticsearch almacenará identificadores para estas imágenes junto con las características extraídas de ellas.

En cuanto a elasticsearch-image: este complemento no se ha actualizado en un tiempo y las respuestas más recientes a los problemas fueron del año pasado. Este complemento integra LIRE con Elasticsearch , donde LIRE proporciona la funcionalidad de un extractor de huellas dactilares de múltiples imágenes.

Soluciones posibles:

  1. Integre la biblioteca OpenCv ( para calcular vectores de características para una imagen ) y Elasticsearch y cree su propio índice utilizando estas características de imagen en lugar de almacenar una imagen completa. Para la arquitectura del producto, puede obtener algunos consejos aquí .

  2. Utilice una versión anterior de Elasticsearch con una versión compatible de elasticsearch-image.

  3. Actualice elasticsearch-image para que funcione con la última versión de Elasticsearch.

  4. También puede usar SOLR junto con el complemento LireSolr para integrarse con la biblioteca LireSolr.

¿Es posible almacenar imágenes en los clústeres de Elasticsearch? En caso afirmativo, ¿hay algún recurso sobre el flujo de trabajo? Revisé el siguiente enlace: https://github.com/kzwang/elasticsearch-image

Como tenemos que manejar archivos de imágenes grandes (más de 500 GB), estamos planeando usar HDFS.