python - sentence2vec - gensim word2vec: Encuentra el número de palabras en el vocabulario
python doc2vec (1)
Después de entrenar un modelo word2vec usando python gensim , ¿cómo encuentra el número de palabras en el vocabulario del modelo?
El vocabulario se encuentra en el campo de vocab
de la propiedad wv
del modelo Word2Vec, como un diccionario, con las claves en cada token (palabra). Así que es solo el Python habitual para obtener la longitud de un diccionario:
len(w2v_model.wv.vocab)
(En versiones anteriores de gensim anteriores a 0.13, el vocab
aparecía directamente en el modelo. Por lo tanto, usaría w2v_model.vocab
lugar de w2v_model.wv.vocab
).