Mi è venuta in mente un'idea che voglio sviluppare in un'applicazione per distinguere/rilevare automaticamente le voci di persone diverse.Esistono ricerche in Voice Recognition in grado di distinguere la voce da persone diverse?
caso d'usoEsempio: Dopo l'allenamento con i dati di Obama e Romney, l'applicazione sarebbe in grado di rilevare ogni volta che uno dei due parlare di nuovo (non è necessario lo stesso contenuto sulla base dei dati di formazione)
mi chiedo se ci sono ricerca esistente su questo. (Non so come cercare questo. Ho provato un paio di parole chiave e non ho ottenuto risultati significativi.)
In caso negativo, quale è un buon modo per iniziare? Come scegliere funzionalità, rappresentazione dei dati, modelli, ecc.
Grazie!