Ho cercato di trovare un'alternativa per due giorni consecutivi ora e non ho trovato nulla di rilevante. Fondamentalmente sto cercando di ottenere un punteggio probabilistico di una frase sintetizzata (sintetizzata sostituendo alcune parole di una frase originale prelevata dai corpora).C'è un sostituto per il modulo ora rimosso 'nltk.model.NGramModel'?
Ho provato le Collocazioni, ma i punteggi che ottengo non sono molto utili. Così ho provato a utilizzare il concetto di modello linguistico, solo per scoprire che il "modello" del modulo apparentemente utile è stato rimosso da NLTK a causa di alcuni bug.
Sarebbe davvero bello se qualcuno potesse farmi sapere qualche altro modo alternativo per ottenere l'implementazione del modello ngram in python, o meglio ancora, suggerirmi un altro modo per risolvere il problema di 'segnare' la frase.
Ho scaricato manualmente la versione 3.0a1 (l'ultima contenente il modello) e la sto usando, non senza dolore. La "raccomandazione ufficiale" è di usare le ultime versioni nel ramo 'model'. Tuttavia, non ho idea di come usarlo, tutte le informazioni online per fare le cose si riferiscono al vecchio pacchetto del modello nella versione 3.0a1, quindi ho deciso di usarlo. Non ho usato molto Python né nltk, ma la mia impressione era che entrambi fossero più maturi e avessero un supporto più forte per la comunità. – Trylks