WordNet integrado con ElasticSearch-Cómo agregar nuevos sinónimos
synonym (1)
Si vas a modificar activamente tu base de datos de sinónimos, probablemente solo debes transformar los synsets en la base de datos de wordnet en el archivo delimitado por comas básico en este formato.
"british,english",
"queen,monarch"
Luego use y edite este archivo como su recurso de sinónimos.
Yo trabajo con ElasticSearch versión 1.2.3
He integrado WordNet 3.0 como una base de datos de sinónimos para el Analizador de sinónimos ElasticSearch. (Instalación completa de WordNet: configure, make, make install)
He agregado el siguiente código a la configuración del índice ElasticSearch (el nombre del índice es local_es )
curl -XPUT ''localhost:9200/local_es/_settings'' -d ''{
"settings" : {
"analysis" : {
"analyzer" : {
"synonym" : {
"tokenizer" : "lowercase",
"filter" : ["synonym"]
}
},
"filter" : {
"synonym" : {
"type" : "synonym",
"format": "wordnet",
"synonyms_path": "analysis/wn_s.pl"
}
}
}
}
}''
También he actualizado la asignación con el siguiente código:
enter code here
curl -XPUT ''localhost:9200/local_es/shadowpage/_mapping'' -d ''{
"shadowpage" : {
"shadowPageName" : {
"enabled" : true,
"analyzer" : "synonym"
},
"properties" : {
"name" : { "type" : "string", "index" : "analyzed", "analyzer" : "synonym" }
}
}
}''
Todo está funcionando como se esperaba.
Como puede ver, ElasticSearch toma sus datos de la ruta del archivo de análisis / wn_s.pl
El archivo wn_s.pl es un archivo prólogo de WordNet que contiene todos los sinónimos de la base de datos.
¿Cómo puedo agregar nuevos sinónimos a la base de datos? ¿Lo agrego directamente a la base de datos de WordNet? ¿O en el archivo wn_s.pl ?