Student Teodor Jakovljević odbranio je diplomski rad na temu „Reinforcement Learning i primena AI agenta u video igrama“

Student Računarskog fakulteta Teodor Jakovljević je u sredu, 6. avgusta 2025. godine odbranio diplomski rad na temu Reinforcement Learning i primena AI agenta u video igrama pred komisijom koju su činili mentor dr Jelena Vasiljević i član dr Miloš Jovanović.

U apstraktu svog rada Teodor je istakao:

Učenje potkrepljivanjem (Reinforcement learning) predstavlja oblast mašinskog učenja u kojoj agent uči da donosi odluke kroz interakciju sa okruženjem, s ciljem maksimizacije kumulativne nagrade. Ova metoda je posebno pogodna za složene probleme gde eksplicitno programiranje ponašanja nije praktično, što je čest slučaj u razvoju veštačkih agenata u video igrama.
U ovom radu se primenjuju i analiziraju različiti algoritmi učenja potkrepljivanjem na primerima konkretnih video igara – Deep Q Network (DQN) se koristi za obučavanje agenta u platformerskom okruženju Super Mario Bros, dok se Proximal Policy Optimization (PPO) primenjuje na pucnjavu iz prvog lica Doom. Svaki algoritam je odabran u skladu sa strukturom zadatka i prirodom akcionog prostora same igre. Kroz vizuelizaciju ponašanja
agenata i analizu metrika performansi, rad prikazuje sposobnost svakog algoritma da nauči efikasnu strategiju učenja u svom domenu, sa posebnim osvrtom na adaptivnost, stabilnost i brzinu konvergencije tokom treniranja.

Na kraju, iako su postignuti rezultati ohrabrujući, razvoj opštih RL agenata koji funkcionišu u nepoznatim, dinamičnim i realističnim okruženjima ostaje izazov i aktivno istraživačko polje. – zaključio je Teodor.