2011-12-31 10 views
10

Sto cercando di capire come usare sphinx4 o pocketphinx con il modello inglese voxforge ma non riesco a farlo funzionare. Ho provato a leggere le pagine del documento (come questo http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html) ma non mi aiuta.Come usare CMU Sphinx 4 per la sintesi vocale con i modelli inglesi voxforge

Quello che voglio è un file eseguibile in cui è possibile specificare quale modello utilizzare e quale file audio utilizzare come sorgente e stampare il file eseguibile è meglio immaginare quale sia la voce della registrazione.

ho Hade po 'di fortuna con: pocketsphinx_continuous recording.wav -infile 2>/dev/null

Ma interrompe prima che il file audio completo viene trascritto e il modello di default ha waay a poche parole per creare un leggibile testo dall'audio.

Ho compilato e testato le demo nel pacchetto sorgente sphinx4 ma tutti gli esempi sembrano avere poche parole e ha bisogno di un modello che si adatti a voxforge per essere utile a me.

Come posso configurarlo?

+1

Sono stato in grado di modificare Sfinge per trascrivere usando i modelli Voxforge. La cattiva notizia è che, anche con Voxforge, l'accuratezza di Sphinx è imbarazzantemente negativa. Non perderei il tuo tempo con Sfinge. Non è usabile affatto. – Cerin

+0

@Cerin cosa consiglieresti come alternativa? –

+0

Sono anche interessato alle alternative. Potresti darci qualcosa di meglio? Preferibile gratis? – Simon

risposta

10

È molto semplice collegare il modello acustico Voxforge. Il documento principale che copre l'API è esercitazione cmusphinx:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

Si consiglia di leggerlo prima di iniziare. Si prega di notare che si consiglia di utilizzare En_US English modello acustico generico, è più preciso di Voxforge.

Passo dopo passo è necessario effettuare le seguenti operazioni:

  • Scarica voxforge model da sourceforge e scompattarlo in una cartella
  • Checkout sphinx4 da github e costruire con Gradle
  • Run TranscriberDemo
  • Vai alla cartella sphinx4-samples/src/main/java/edu/cmu/sphinx/demo/trascrizione, apri la demo Transcriber e modifica il percorso del modello acustico come di seguito.
  • Modificare la posizione del file audio in fonti, se avete bisogno di un altro file audio di nuovo
  • Esegui demo e godere

Questo sarebbe lo

// Load model from the folder in your project 
    configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000"); 
+1

risposta molto bella ... ho anche problemi simili ho scaricato voxforge-en-0.3 da SourceForge, la cartella etc ha così tanti vasi, non riesco a capire quale percorso dovrebbe essere dato ... per favore aiuto e visita http: // StackOverflow.it/questions/8727389/dictation-application-using-sphinx4 – aProgrammer

+0

Non sono sicuro di cosa stai parlando. Quali barattoli in ecc? Non ci sono affatto barattoli. Per quanto riguarda questa domanda, non hai indicato chiaramente il problema da risolvere, non hai idea di quale problema hai lì. –

+0

Ho seguito la tua risposta e scaricato VoxForge da sourceforge, ma non ho potuto configurarlo per essere usato con Sphinx4. Hai detto '', tuttavia ciò non ha funzionato per me. Così ho sfogliato la cartella VoxForge, ma ho provato varie combinazioni ... ma nulla sta funzionando finora ... aiuto! vedere la risposta modificata .... – aProgrammer