Cilj i ishod predmeta
Razumevanje principa i algoritama računarskog prepoznavanja govora. Implementacija rešenja za prepoznavanje govora na različitim platformama. Na kraju kursa, studenti će moći da definišu različita svojstva govornog signala, da upotrebe dobijena svojstva za treniranje odgovarajućeg modela i da upotrebe trenirani model za prepoznavanje govora. Moći će da implementiraju softver za prepoznavanje govora u različitim sistemskim okruženjima (personalni računari, namenski računarski sistemi i sl.).
Teorijska nastava
Modelovanje govora. Obrada akustičkog signala. Odabiranje, A/D konverzija i uokviravanje. Filtriranje i upotreba prozorske funkcije. Furijeova transformacija i spektar snage ulaznog signala. Promena frekventne ose i filtriranje po mel skali. Prelaz u logaritamski domen. Inverzna kosinusna transformacija, kepstralni koeficijenti i njihovi vremenski parametri. Vektori svojstava akustičkog signala. Markovljevi modeli. Skriveni Markovljevi modeli (HMM). Mešavine Gausovih raspodela. Akustički modeli. Fonetsko modelovanje. Robusnost u odnosu na okolinu (buka, šum, eho). Polukontinualni HMM, vezivanje stanja i klasterovanje. Treniranje HMM-a. Baum-Welch i Forward- Backward algoritmi. Normalizacija govora. Jezički modeli. N-gram usrednjavanje. Osnovna pretraživanja. Vremenski sinhrono Viterbi Beam pretraživanje. Stack i A* pretraživanje. Rad sa velikim rečnikom. Pretraživanje po stablu sa jezičkim modelima. Pretraživanje na osnovu gramatike. N-multipass pretraživačke strategije. Upotreba neuralnih mreža i dubokih neuralnih mreža. Hibridni sistemi dubokih neuralnih mreža i HMM.
Praktična nastava
Analiza spektrograma pomoću softvera za rad sa zvučnim signalom. Implementacija softvera koji može da snima govor. Algoritmi kompresije zvučnog signala. Obrada dobijenog signala, odsecanje, filtriranje i sl. Implementacija i primena (brze) Furijeove transformacije. Implementacija sistema za prepoznavanje govora koji jeste / nije vezan za govornika i formiranje testova za pokazivanje korektnosti rada sistema. Implementacija i testiranje HMM sistema, kao i pretraživačkih algoritama. Rad sa dubokim neuralnim mrežama i njihovo kombinovanje sa klasičnim sistemima za prepoznavanje govora.