Mi piacerebbe creare un'app che utilizzi il riconoscimento vocale. Ho visto grandi aziende come Google, ecc, implementare questa funzione, ma sono curioso di farlo a livello di start-up. Qualcuno ha esaminato questo? Ci sono strumenti là fuori per noi per fare questo?App per iPhone> Aggiungi riconoscimento vocale?
risposta
L'approccio migliore sarà probabilmente a:
- Registra la voce al telefono
- inviare la registrazione a un server che esegue il software di riconoscimento vocale
- Poi restituire qualcosa al telefono per indicare quello che dovrebbe fare
Sono molti i dati da inviare. Potrei provare sull'iPhone stesso. Dopo tutto, i PC potrebbero fare un buon lavoro di questo 10 anni fa, quindi forse gli iPhone dovrebbero essere in grado di farlo adesso. – Nosredna
Questa è in realtà la tecnica utilizzata dall'app Ricerca Google – bgw
Google codifica la voce in un modo speciale, non solo inviano i dati audio non elaborati esattamente per la ragione che Nosredna ha dato. –
Se si inizia qui su Wikipedia, si otterrà un buon motori lista (http://en.wikipedia.org/wiki/Speech_recognition#Commercial_software.2Fmiddleware)
Mentre scrivo (24 giugno 2009) Sembra a me che sono due soluzioni open source praticabili
- Pocket Sfinge (http://www.speech.cs.cmu.edu/pocketsphinx)
- Giulio (http://en.wikipedia.org/wiki/Julius_(software))
Entrambi hanno stato utilizzato nelle app per iphone, ma la fonte di iPhone friendly non è facilmente disponibile.
Come faccio a modificare questo (8 luglio 2009) Recentemente ho appreso che Loquendo (http://www.loquendo.com/en/) dispone di riconoscimento vocale e sintesi vocale (ASR & TTS) per l'iphone.
@Rohrer, Apple approverà questo se aggiungiamo motori esterni per il riconoscimento vocale – smakstr
@Shibin - Non ho mai sentito di tali app rifiutate, e non mi aspetterei che lo siano, ma il tuo chilometraggio potrebbe variare . Puoi sempre cercare gli utenti di un particolare sdk e assicurarti che le loro app siano effettivamente pubblicate. Questo sarebbe particolarmente facile con gli sdks commerciali. –
OpenEars sembra promettente ... http://www.politepix.com/openears/
Sulla base di Pocket Sfinge.
L'SDK di Dragon Mobile di Nuance fa ciò che è richiesto. È necessaria una connessione Internet per poter inviare l'audio al server di Nuance e ottenere un elenco di risposte testuali. Puoi quindi decidere cosa fare con le risposte del testo (ad es. Chiedere all'utente di scegliere quello che intendeva o eseguire un'azione). Ecco il link:
penso che è necessario fornire ulteriori dettagli - ciò che si desidera l'applicazione per fare, ecc ... – zpesk
Se stai cercando di annuncio vocale in testo di controllo per il tuo iPhone quindi leggere questo thread http://www.surreystore.com/cms/technology/7-apple/16-how-to-add-voice-to-text-for-iphone.html – iMacker