Препознавање говора: како рачунари разумеју људски језик

Предмет Препознавање говора, који се реализује на четвртој години студија на Рачунарском факултету, студентима пружа дубинско разумевање начина на који рачунари анализирају, моделују и препознају људски говор. Настава је осмишљена тако да повеже класичне теоријске основе са савременим приступима, уз посебан фокус на реалне системе и истраживачки рад.

Током предмета студенти пролазе кроз комплетан ланац обраде говора – од физичког звучног сигнала до његове лингвистичке интерпретације. Програм обухвата основе акустике и перцепције говора, израчунавање акустичких карактеристика (MFCC, LPC), алгоритме за поравнање секвенци (DTW), статистичке моделе говора (HMM), као и препознавање континуалног говора уз употребу језичких модела и великих речника. Посебан акценат стављен је на савремене неуралне и Transformer ASR приступе.

У оквиру наставе студенти се упознају и са алатима и технологијама који се користе у савременим системима за препознавање говора. Рад се одвија у програмским језицима Python и C/C++, уз анализу и обраду аудио сигнала, као и разумевање концепта система попут Kaldi и Whisper, као и експерименталних неуралних модела.

Значајан део предмета чини пројектни рад. Један од реализованих пројеката односи се на развој система за препознавање континуалног говора на српском језику. Систем је модуларно конципиран и заснива се на фонемском акустичком моделу, док је језички модел имплементиран коришћењем детерминистичке неуралне мреже која се ослања на структурно моделовање језика. Овакав приступ је редак у наставним програмима и студентима пружа увид у алтернативне правце развоја AI система.

Кроз домаће задатке и пројекте студенти имплементирају кључне компоненте ASR система, анализирају грешке и понашање модела, упоређују класичне и савремене приступе и развијају истраживачки начин размишљања. Пројекти често представљају основу за завршне и мастер радове, као и за даље истраживање у области вештачке интелигенције, обраде сигнала и обраде природног језика (NLP).

Предмет Препознавање говора издваја се по дубини теоријског приступа, снажној повезаности са савременим истраживањима, раду на српском језику, примени експерименталних неуралних модела и уравнотеженом односу теорије и праксе. Намењен је студентима које интересују вештачка интелигенција, разумевање људског језика и развој интелигентних система, а стечена знања представљају снажну основу за даљи академски и професионални развој.

77ag AMANAHTOTO xgo88 AMANAHTOTO