vectorizer sklearn scikit learn idf feature engineering python-2.7 scikit-learn vectorization

python 2.7 - sklearn - Scikit Learn and Count Vectorizer Error



tf idf python scikit learn (1)

¿Alguien sabe de dónde se origina este ImportError y cómo solucionarlo? Estoy trabajando desde un archivo CSV para hacer algo de minería de texto. En este punto, simplemente estoy tratando de convertir las palabras en algunas descripciones de trabajo en el archivo y luego vectorizar y contar las dimensiones. Sin embargo, estoy recibiendo este error. El código original sigue a este mensaje de error para que lo vea. Intenté desinstalar Anaconda y volver a instalarlo, así como todos los paquetes. Este código funciona absolutamente bien en mi PC (un antiguo Gateway) pero no se ejecuta en mi Mac (2012) con Lion OSX.

--------------------------------------------------------------------------- ImportError Traceback (most recent call last) <ipython-input-49-7fcd55a48eba> in <module>() ----> 1 from sklearn.feature_extraction.text import CountVectorizer 2 cv = CountVectorizer(lowercase=True) 3 vector = cv.fit_transform(words).toarray() 4 print vector.shape //anaconda/lib/python2.7/site-packages/sklearn/__init__.py in <module>() 35 # process, as it may not be compiled yet 36 else: ---> 37 from . import __check_build 38 from .base import clone 39 __check_build # avoid flakes unused variable error ImportError: cannot import name __check_build from nltk.tokenize import word_tokenize

crear una lista de palabras para todas las publicaciones

words = [] for p in postList[:100]: temp = word_tokenize(p[2]) temp2 = [w.lower() for w in temp] string = '''' for w in temp2: string += w + '', '' string = string[:-1] words.append(string) print words from sklearn.feature_extraction.text import CountVectorizer cv = CountVectorizer(lowercase=True) vector = cv.fit_transform(words).toarray() print vector.shape


El scikit-learn que está importando no se ha compilado correctamente. Verifica tu ruta de búsqueda:

python -c "import sys; print(sys.path)"

y sklearn.__path__ (no estoy seguro si esto es posible si falla la importación de sklearn). Reconstruya la versión de sklearn que está intentando importar ahora (cómo hacerlo depende de cómo se instaló, lo más probable es que python setup.py build_ext -i o python setup.py install ) o la elimine de la ruta de búsqueda.