python 2.7 - sklearn - Scikit Learn and Count Vectorizer Error
tf idf python scikit learn (1)
¿Alguien sabe de dónde se origina este ImportError y cómo solucionarlo? Estoy trabajando desde un archivo CSV para hacer algo de minería de texto. En este punto, simplemente estoy tratando de convertir las palabras en algunas descripciones de trabajo en el archivo y luego vectorizar y contar las dimensiones. Sin embargo, estoy recibiendo este error. El código original sigue a este mensaje de error para que lo vea. Intenté desinstalar Anaconda y volver a instalarlo, así como todos los paquetes. Este código funciona absolutamente bien en mi PC (un antiguo Gateway) pero no se ejecuta en mi Mac (2012) con Lion OSX.
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
<ipython-input-49-7fcd55a48eba> in <module>()
----> 1 from sklearn.feature_extraction.text import CountVectorizer
2 cv = CountVectorizer(lowercase=True)
3 vector = cv.fit_transform(words).toarray()
4 print vector.shape
//anaconda/lib/python2.7/site-packages/sklearn/__init__.py in <module>()
35 # process, as it may not be compiled yet
36 else:
---> 37 from . import __check_build
38 from .base import clone
39 __check_build # avoid flakes unused variable error
ImportError: cannot import name __check_build
from nltk.tokenize import word_tokenize
crear una lista de palabras para todas las publicaciones
words = []
for p in postList[:100]:
temp = word_tokenize(p[2])
temp2 = [w.lower() for w in temp]
string = ''''
for w in temp2:
string += w + '', ''
string = string[:-1]
words.append(string)
print words
from sklearn.feature_extraction.text import CountVectorizer
cv = CountVectorizer(lowercase=True)
vector = cv.fit_transform(words).toarray()
print vector.shape
El scikit-learn que está importando no se ha compilado correctamente. Verifica tu ruta de búsqueda:
python -c "import sys; print(sys.path)"
y sklearn.__path__
(no estoy seguro si esto es posible si falla la importación de sklearn). Reconstruya la versión de sklearn que está intentando importar ahora (cómo hacerlo depende de cómo se instaló, lo más probable es que python setup.py build_ext -i
o python setup.py install
) o la elimine de la ruta de búsqueda.