2009-12-05 6 views
6

Ho una sordità da grave a profonda sin dalla tenera età, ma per fortuna posso parlare come una persona normale. La comunicazione verbale è sempre stata difficile per me a causa delle mie capacità di riconoscimento vocale compromesse anche con la lettura labiale. Ho frequentato la scuola e l'università leggendo tavole, diapositive powerpoint, libri e internet. Sto facendo abbastanza bene al mio attuale lavoro di ingegneria del software, ma ultimamente sento che devo fare uno sforzo per migliorare la mia situazione.Come fare una conversione vocale in un convertitore di testo?

I sottotitoli sono il mio salvagente in questo paese per capire i film/spettacoli in TV e mi sono divertito solo negli ultimi 7 anni (ho 31 anni).

Sento fortemente la necessità di poter vedere i sottotitoli nella vita reale ogni volta che parlo con qualcuno, anche con estranei. Voglio sviluppare un discorso non finalizzato al convertitore di testo e, per cominciare, non ha nemmeno bisogno di comporre parole esatte per me, solo gli spunti su sillabe/fonetica andranno bene.

Ho cercato su Google per un po 'di tempo, ma la maggior parte dei risultati sono sia sintesi vocale che tentativi di riconoscimento vocale per mezzo di comandi vocali a un computer. Mi piacerebbe davvero avere alcune indicazioni su come iniziare questo progetto. Nello specifico ho bisogno di passaggi come il trattamento dei file audio e il tipo di elaborazione che devo fare per ottenere circa la fonetica il più velocemente possibile.

+1

Coppia di ottimi collegamenti già. Grazie ragazzi. Devo prima capire alcuni programmi semplici, poi pensare a fare un'app per iphone in modo da poter avere uno strumento per sottotitoli in tempo reale. Campo lungo, ma vale la pena provare. –

+1

Sono felice di poterti aiutare, Joy. –

+0

Saluto, signore, per la vostra vita coraggiosa e la decisione di fare qualcosa da soli. –

risposta

3

Si potrebbe voler guardare CMU's Sphinx project che fa il discorso al testo in tempo reale. Hanno un po 'di demos per provarlo.

+0

C'è un corso su questo: puoi ottenere del materiale da studiare qui http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-ricecognition-spring- 2003/download-corso-materiali / – saurabheights

1

Dai uno sguardo allo DSP guide, si tratta più di cose di basso livello ma tecniche come trasformazioni e filtri di Fourier sono di grande importanza per l'elaborazione audio. Anche se non si inizia da zero, può essere utile apprezzare i principi e le applicazioni.

Detto questo, scommetto che a partire da zero, si potrebbe creare qualcosa che possa distinguere un set di base di suoni con il lavoro di qualche giorno ...