recorrer - Módulo de Python con acceso a diccionarios de inglés, incluidas definiciones de palabras
lista de diccionarios python (5)
¿Qué pasa con this ? Tendrá que escribir su propio analizador, pero eso debería ser bastante trivial dado el formato de los datos.
Estoy buscando un módulo de Python que me ayude a obtener las definiciones de un diccionario de inglés para una palabra.
Por supuesto, está enchant
, lo que me ayuda a comprobar si la palabra existe en el idioma inglés, pero no proporciona definiciones de ellos (al menos no veo nada de eso en los documentos)
También hay WordNet, que es accesible con NLTK. Tiene definiciones e incluso frases de ejemplo, pero WordNet no contiene todas las palabras en inglés. Las palabras comunes como "cómo", "Yo", "Usted", "debería", "podrían" ... no forman parte de WordNet.
¿Hay algún módulo de Python que le dé acceso a un diccionario de inglés completo que incluya definiciones de palabras?
En lugar de un módulo, puede confiar en otras fuentes fuera de línea / en línea como xml, json, api, etc.
https://github.com/adambom/dictionary [archivo json]
http://dictionary-api.cambridge.org [REST api]
http://glosbe.com/a-api [REST api]
http://www.ibiblio.org/webster/ [XML, código abierto]
Python NLTK
tiene una interfaz de WordNet
que es exactamente lo que estás buscando. http://www.nltk.org/howto/wordnet.html
Edit: OP no especificó su solicitud de palabras comunes, descartando así WordNet, hasta después de que publiqué esta respuesta. Ya que esta respuesta tiene upvotes de todos modos, la dejaré aquí.
Tenga en cuenta que si bien WordNet no tiene todas las palabras en inglés, ¿qué pasa con el Oxford English Dictionary? ( http://developer.oxforddictionaries.com/ ). Dependiendo del alcance de su proyecto, podría ser una API asesina.
¿Has intentado mirar Grady Ward''s Moby? [enlace] ( http://icon.shef.ac.uk/Moby/ ).
Puede agregarlo como un léxico en NLTK (vea las notas en "Cargar su propio corpus" en la Sección 2.1).
from nltk.corpus import PlaintextCorpusReader
corpus_root = ''/usr/share/dict''
wordlists = PlaintextCorpusReader(corpus_root, ''.*'')
O:
from nltk.corpus import BracketParseCorpusReader
corpus_root = r"C:/corpora/penntreebank/parsed/mrg/wsj"
file_pattern = r".*/wsj_.*/.mrg"
ptb = BracketParseCorpusReader(corpus_root, file_pattern)
Wordnik parece tener una API bastante agradable, y también un módulo Python de aspecto agradable . Tiene definiciones, oraciones de ejemplo, etc., por lo que debe estar cubierto. También tiene palabras comunes como "cómo", "debería" y "podría".