Студенткиња Рачунарског факултета Елена Дрпа одбранила је дипломски рад на тему Велики језички модели пред комисијом коју су чинили ментор др јелена Васиљевић и члан др Немања Радосављевић.
У уводу свог рада Елена је истакла следеће:
У уводу, разматрају се основне карактеристике ЛЛМ-а и њихов значај у модерној вештачкој интелигенцији. Детаљно су описане архитектура и механизми ЛЛМ-а, укључујући основе неуронских мрежа, трансформатор архитектуру и механизме пажње. Технике обуке и оптимизације модела су детаљно размотрене, са нагласком на различите фазе тренирања, као што су самонадзорно учење, надзорено учење, и појачано учење. Посебна пажња је посвећена параметарски ефикасном фино подешавању (ПЕФТ) и специјализацији модела.
…
На основу анализе, неколико кључних праваца даљег развоја може се идентификовати. Први правац укључује побољшање ефикасности модела кроз оптимизацију ресурса и развој мањих, али учинковитијих модела. Други правац је персонализација, која ће омогућити боље прилагођавање индивидуалним потребама корисника и специфичним апликацијама. Трећи правац односи се на одговорну вештачку интелигенцију, где ће се развој модела фокусирати на смањење пристрасности и повећање транспарентности. На крају, мултимодални системи и континуирано учење представљају узбудљиве могућности за будући развој, нудећи ширу примену и адаптивност модела.
Фотографије са одбране доступне су у галерији.