google español machine-learning nlp artificial-intelligence word2vec

machine learning - español - ¿Cómo obtener vectores para una lista de palabras con Word2Vec?



word2vec google (1)

Quiero crear un archivo de texto que sea esencialmente un diccionario, emparejándose cada palabra con su representación vectorial a través de word2vec. Supongo que el proceso sería primero entrenar word2vec y luego buscar cada palabra de mi lista y encontrar su representación (y luego guardarla en un nuevo archivo de texto).

Soy nuevo en word2vec y no sé cómo hacer esto. He leído en varios de los sitios principales y varias de las preguntas en Stack, y aún no he encontrado un buen tutorial.


El tutorial de Gensim lo explica muy claramente.

En primer lugar, debe crear el modelo word2vec, ya sea entrenando en texto, por ejemplo

model = Word2Vec(sentences, size=100, window=5, min_count=5, workers=4)

o cargando un modelo pre-entrenado (puede encontrarlos aquí , por ejemplo).

Luego itere sobre todas sus palabras y verifique sus vectores en el modelo:

for word in words: vector = model[word]

Al tener eso, solo escribe la palabra y el vector formateados como quieras.