C'è un sostituto per il modulo ora rimosso 'nltk.model.NGramModel'?

Ho cercato di trovare un'alternativa per due giorni consecutivi ora e non ho trovato nulla di rilevante. Fondamentalmente sto cercando di ottenere un punteggio probabilistico di una frase sintetizzata (sintetizzata sostituendo alcune parole di una frase originale prelevata dai corpora).C'è un sostituto per il modulo ora rimosso 'nltk.model.NGramModel'?

Ho provato le Collocazioni, ma i punteggi che ottengo non sono molto utili. Così ho provato a utilizzare il concetto di modello linguistico, solo per scoprire che il "modello" del modulo apparentemente utile è stato rimosso da NLTK a causa di alcuni bug.

Sarebbe davvero bello se qualcuno potesse farmi sapere qualche altro modo alternativo per ottenere l'implementazione del modello ngram in python, o meglio ancora, suggerirmi un altro modo per risolvere il problema di 'segnare' la frase.

fonte

2014-10-18 Ketan

Ho scaricato manualmente la versione 3.0a1 (l'ultima contenente il modello) e la sto usando, non senza dolore. La "raccomandazione ufficiale" è di usare le ultime versioni nel ramo 'model'. Tuttavia, non ho idea di come usarlo, tutte le informazioni online per fare le cose si riferiscono al vecchio pacchetto del modello nella versione 3.0a1, quindi ho deciso di usarlo. Non ho usato molto Python né nltk, ma la mia impressione era che entrambi fossero più maturi e avessero un supporto più forte per la comunità. – Trylks

Secondo this open issue on the nltk repo, NGramModel non è attualmente in fase di master a causa di alcuni bug. La loro soluzione attuale è installare il codice dal ramo del modello. Sono circa 8 mesi indietro rispetto al master, quindi potresti perdere altre funzionalità e correzioni di bug.

pip install https://github.com/nltk/nltk/tarball/model

Il codice rilevante è here in the model branch. È possibile copiare questo codice locale se non si desidera utilizzare il ramo obsoleto. Se ti interessa davvero usare questo puoi provare a correggere the outstanding bugs su di esso e inviare una richiesta di pull.

fonte

2014-10-18 18:32:03 davidism

C'è un sostituto per il modulo ora rimosso 'nltk.model.NGramModel'?

risposta

Problemi correlati