5

Mi è venuta in mente un'idea che voglio sviluppare in un'applicazione per distinguere/rilevare automaticamente le voci di persone diverse.Esistono ricerche in Voice Recognition in grado di distinguere la voce da persone diverse?

caso d'uso

Esempio: Dopo l'allenamento con i dati di Obama e Romney, l'applicazione sarebbe in grado di rilevare ogni volta che uno dei due parlare di nuovo (non è necessario lo stesso contenuto sulla base dei dati di formazione)

mi chiedo se ci sono ricerca esistente su questo. (Non so come cercare questo. Ho provato un paio di parole chiave e non ho ottenuto risultati significativi.)

In caso negativo, quale è un buon modo per iniziare? Come scegliere funzionalità, rappresentazione dei dati, modelli, ecc.

Grazie!

risposta

5

Ho trovato Speaker recognition su Wikipedia, a sua volta collegato a An overview of text-independent speaker recognition: From features to supervectors (Kinnunen, Li, 2010).

Dal astratta della carta:

Questo documento offre una panoramica della tecnologia di riconoscimento automatico degli altoparlanti, con un'enfasi sul riconoscimento del testo-indipendente. Il riconoscimento degli altoparlanti è stato studiato attivamente per diversi decenni. Diamo una panoramica di entrambi i metodi classici e all'avanguardia.