Sto usando il pacchetto gensim word2vec in python. So come ottenere il vocabolario dal modello addestrato. Ma come ottenere il conteggio delle parole per ogni parola nel vocabolario?Come ottenere il conteggio delle parole del vocabolario da gensim word2vec?
6
A
risposta
14
Ogni parola nel vocabolario ha un oggetto di vocabolario associato, che contiene un indice e un conteggio.
vocab_obj = w2v.vocab["word"]
vocab_obj.count
Uscita per google il modello notizie W2V: 2998437
Quindi, per ottenere il conteggio per ogni parola, si dovrebbe iterare su tutte le parole e gli oggetti vocab nel vocabolario.
for word, vocab_obj in w2v.vocab.items():
#Do something with vocab_obj.count
A partire dal [ 'gensim' 1.0.0] (https://github.com/RaRe-Technologies/gensim/releases/tag/1.0.0), è necessario fare' w2v.wv.vocab ["word"]. count' invece di 'w2v.vocab [" word "]. count'. –