Студент Теодор Јаковљевић одбранио је дипломски рад на тему „Reinforcement Learning и примена AI агента у видео играма“

Студент Рачунарског факултета Теодор Јаковљевић је у среду, 6. августа 2025. године одбранио дипломски рад на тему Reinforcement Learning и примена AI агента у видео играма пред комисијом коју су чинили ментор др Јелена Васиљевић и члан др Милош Јовановић.

У апстракту свог рада Теодор је истакао:

Учење поткрепљивањем (Reinforcement learning) представља област машинског учења у којој агент учи да доноси одлуке кроз интеракцију са окружењем, с циљем максимизације кумулативне награде. Ова метода је посебно погодна за сложене проблеме где експлицитно програмирање понашања није практично, што је чест случај у развоју вештачких агената у видео играма.
У овом раду се примењују и анализирају различити алгоритми учења поткрепљивањем на примерима конкретних видео игара – Deep Q Network (DQN) се користи за обучавање агента у платформерском окружењу Super Mario Bros, док се Proximal Policy Optimization (PPO) примењује на пуцњаву из првог лица Doom. Сваки алгоритам је одабран у складу са структуром задатка и природом акционог простора саме игре. Кроз визуелизацију понашања
агената и анализу метрика перформанси, рад приказује способност сваког алгоритма да научи ефикасну стратегију учења у свом домену, са посебним освртом на адаптивност, стабилност и брзину конвергенције током тренирања.

На крају, иако су постигнути резултати охрабрујући, развој општих RL агената који функционишу у непознатим, динамичним и реалистичним окружењима остаје изазов и активно истраживачко поље. – закључио је Теодор.