Dopo aver addestrato un modello word2vec usando python gensim, come trovi il numero di parole nel vocabolario del modello?gensim word2vec: trova il numero di parole nel vocabolario
9
A
risposta
25
Il vocabolario si trova nel campo vocab
della proprietà wv
del modello Word2Vec, come dizionario, con le chiavi di ciascun token (parola). Quindi è solo il solito Python per ottenere la lunghezza di un dizionario: (. Nelle versioni più vecchie gensim prima 0,13, vocab
apparso direttamente sul modello in modo che si usa al posto di w2v_model.vocab
w2v_model.wv.vocab
.)
len(w2v_model.wv.vocab)