tutorial stopwords graphs functions espaƱol ejemplo python nlp nltk

python - graphs - nltk stopwords



NLTK no pudo encontrar el archivo gs (2)

Encontré este error también.

gs significa ghostscript. Obtienes el error porque tu chunker está tratando de usar ghostscript para dibujar un árbol de análisis sintáctico de la oración, algo como esto:

Estaba usando IPython; para depurar el problema, establecí la verbosidad de rastreo en verbose con el comando %xmode verbose , que imprime las variables locales de cada marco de pila. (ver la trazabilidad completa a continuación) Los nombres de archivo son:

file_names=[''gs'', ''gswin32c.exe'', ''gswin64c.exe'']

Una pequeña búsqueda de Google para gswin32c.exe me dijo que era ghostscript.

/Users/jasonwirth/anaconda/lib/python3.4/site-packages/nltk/__init__.py in find_file_iter(filename=''gs'', env_vars=[''PATH''], searchpath=(), file_names=[''gs'', ''gswin32c.exe'', ''gswin64c.exe''], url=None, verbose=False) 517 (filename, url)) 518 div = ''=''*75 --> 519 raise LookupError(''/n/n%s/n%s/n%s'' % (div, msg, div)) 520 521 def find_file(filename, env_vars=(), searchpath=(), LookupError: =========================================================================== NLTK was unable to find the gs file! Use software specific configuration paramaters or set the PATH environment variable. ===========================================================================

Estoy tratando de usar NLTK, el kit de herramientas de lenguaje natural de stanford. Después de instalar los archivos necesarios, empiezo a ejecutar el código de demostración: http://www.nltk.org/index.html

>>> import nltk >>> sentence = """At eight o''clock on Thursday morning ... Arthur didn''t feel very good.""" >>> tokens = nltk.word_tokenize(sentence) >>> tokens [''At'', ''eight'', "o''clock", ''on'', ''Thursday'', ''morning'',

''Arthur'', ''did'', ''not'', ''feel'', ''muy'', ''bueno'', ''.'']

>>> tagged = nltk.pos_tag(tokens) >>> tagged[0:6] [(''At'', ''IN''), (''eight'', ''CD''), ("o''clock", ''JJ''), (''on'', ''IN''),

(''Jueves'', ''NNP''), (''mañana'', ''NN'')]

>>> entities = nltk.chunk.ne_chunk(tagged) >>> entities

Entonces recibo un mensaje:

LookupError: =========================================================================== NLTK was unable to find the gs file! Use software specific configuration paramaters or set the PATH environment variable.

Intenté google, pero nadie dice cuál es el archivo gs que falta.


Un poco adicional a la respuesta de Jason Wirth. En Windows, esta línea de código buscará "gswin64c.exe" en la variable de entorno PATH, sin embargo, el instalador de ghostscript no agrega el binario a PATH, por lo que para que esto funcione, deberá encontrar dónde está instalado ghostscript. y agregue la subcarpeta / bin a PATH.

Por ejemplo, en mi caso agregué C: / Program Files / gs / gs9.19 / bin a PATH.