Ho un flusso audio e vorrei estrarre parole (parole) da esso. Quindi, per esempio avendo audio.wav vorrei ottenere 001.wav, 002.wav, 003.wav, ecc dove ogni XXX.wav è una parola. Sto cercando una libre
Ho problemi a determinare da this research paper esattamente come è possibile riprodurre l'algoritmo di Quantizzazione vettoriale standard per determinare la lingua di un input vocale non identificato
Esiste comunque un modo per incorporare Dragon NaturallySpeaking in un programma basato su eventi? Il mio capo mi piacerebbe molto se usassi il DNS per registrare l'input vocale dell'utente senza scri
Quali codec audio devo scegliere per il mio progetto di sviluppo software C# in cui l'audio grezzo da transcodifica/trasportato/utilizzato si basa sui seguenti punti: Per la codifica vocale solo audio