sentence2vec python gensim word2vec

python - sentence2vec - gensim word2vec: Encuentra el número de palabras en el vocabulario



python doc2vec (1)

Después de entrenar un modelo word2vec usando python gensim , ¿cómo encuentra el número de palabras en el vocabulario del modelo?


El vocabulario se encuentra en el campo de vocab de la propiedad wv del modelo Word2Vec, como un diccionario, con las claves en cada token (palabra). Así que es solo el Python habitual para obtener la longitud de un diccionario:

len(w2v_model.wv.vocab)

(En versiones anteriores de gensim anteriores a 0.13, el vocab aparecía directamente en el modelo. Por lo tanto, usaría w2v_model.vocab lugar de w2v_model.wv.vocab ).