features solr solr4

features - solr xls



Consultar campos binarios en Solr (1)

La respuesta corta no puede ser resuelta.

Cuando lee en la documentación de referencia de Solr , encuentra que hay muy poca información sobre el tipo BinaryField

Clase: BinaryField

Descripción: datos binarios.

El estado actual es que este BinaryField está destinado solo para el almacenamiento de datos binarios. Nada más y nada menos. Sin embargo, hay un problema para cambiar esto , pero aún no ha llamado demasiado la atención.

Mi suposición personal es que detrás de esto radica el hecho de que los datos binarios no son simplemente datos binarios simples. La mayoría de las veces es un formato de archivo elaborado que requiere una interpretación especial. Para esta tarea existe un Proyecto Apache por separado, Apache Tika .

Para domesticar a esta bestia, varios buenos artículos y tutoriales se extienden por toda la web. Un buen punto de partida sobre cómo integrar esto con Solr también se encuentra en la documentación de referencia ( 1 , 2 ).

Estoy usando Solr para indexar registros que consisten en campos binarios. He especificado los campos en schema.xml como tal:

<field name="id" type="binary" indexed="true" stored="true" required="true" multiValued="false" />

Puedo agregar registros al índice a través de una solicitud POST, codificando y enviando los campos como cadenas Base64. El tamaño del directorio de datos de la colección está creciendo, así que sé que está almacenando algo; sin embargo, al hacer una coincidencia, todas las consultas (q = *: *) Obtuve de manera extraña algunos documentos encontrados pero ninguno devuelto, por ejemplo:

"response": { "numFound": 364047, "start": 0, "maxScore": 1, "docs": [] }

¿Alguien tiene idea de lo que está causando esto o cómo se puede resolver?
Gracias