tutorial - Las palabras vacías de Solr aparecen en los resultados de búsqueda de facetas
solr tutorial (1)
Las palabras vacías se aplican a las facetas. En otras palabras: si solicita una faceta de un campo que ha sido indexado con palabras vacías, no debería ver ninguna palabra prohibida en la faceta.
Supongo que no está indexando de la forma en que piensa: o su schema.xml es incorrecto o está indexando en un campo diferente de lo que cree.
Estoy usando facetas en este campo y funciona bien:
<fieldType name="text_ws_stop" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true"
words="stopwords_spanish.txt"
enablePositionIncrements="true"
/>
</analyzer>
</fieldType>
...
<field name="phrases" type="text_ws_stop" indexed="true" stored="true" required="false"/>
Actualmente estoy probando búsquedas facetarias en un campo de texto en mi esquema de Solr y notando que obtengo una cantidad significativa de resultados que están en mi archivo stopwords.txt.
Mi esquema usa actualmente la configuración predeterminada para el tipo de datos de texto, y tenía la impresión de que las palabras vacías no se indexaban si el filtro "solr.StopFilterFactory" estaba en uso.
Espero que alguien pueda arrojar algo de luz sobre esto y a) ayúdeme a entender por qué las palabras vacías no se aplican a las facetas y cómo vivir con ellas, ob) me señalan en la dirección correcta para que mis consultas de facetas no vuelvan palabras de stopwords.
¡Gracias!