Dove è possibile trovare la documentazione sul formato del modello di lingua ARPA?Documentazione sul modello di lingua ARPA
Sto sviluppando una semplice app di riconoscimento vocale con motore STT tascabile. L'ARPA è raccomandato lì per motivi di prestazioni. Voglio capire quanto posso fare per adattare il mio modello di linguaggio alle mie esigenze personalizzate.
Tutto quello che ho trovato è alcune brevissime ARPA descrizioni formato:
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
io sono principiante a STT e ho difficoltà ad avvolgere la testa intorno a questo (n-grammi, ecc.). Sto cercando documenti più dettagliati. Qualcosa di simile documentazione su JSGF grammatica qui:
dare un'occhiata a questo collegamento msdn .. il formato arpa e args sono ben spiegati [Compile Grammatic Input e Output File Format] (https://msdn.microsoft.com/en-us/library/office/hh378460 (v = office.14) .aspx) –