Студент Рачунарског факултета Срђан Обрадовић је 08. марта 2021. године одбранио дипломски рад на тему „BSuite као алат за евалуацију перформанси алгоритама учења са подстицајем“ пред комисијом коју су чинили: ментор др Немања Илић и члан др Јелена Васиљевић.
„Учење са подстицајем је популарна парадигма за секвенцијално доношење одлука при одређеним неизвесностима унутар поставки које укључују интеракцију између делујућег магента и окружења. Ово поље је скоро доживело нову ренесансу у заједници која се бави машинским учењем, великим делом захваљујући успесима DeepMind тима чији су алгоритми побеђивали људе и друге алгоритме у популарним играма Го, шах, као и у бројним Atari играма. Поред играња игрица, учење са подстицајем има бројне друге примене. Неке од најутицајнијих укључују алгоритме за самосталну вожњу аутомобила, аутоматизацију у прехрамбреној индустрији, медицини, финансијском сектору и другим“.
Фотографије са одбране налазе се у галерији.