Студент Давид Илић одбранио је дипломски рад на тему "Имплементација напада закључивања о чланству на језичке моделе усклађене методом директне оптимизације преференција"

Student Računarskog fakulteta David Ilić je u četvrtak, 15. januara 2026. godine odbranio diplomski rad na temu Implementacija napada zaključivanja o članstvu na jezičke modele usklađene metodom direktne optimizacije preferencija pred komisijom koju su činili mentor dr Nemanja Ilić i član dr Jelena Vasiljević.

U uvodu svog rada David je istakao:

Ovaj rad predstavlja implementaciju i evaluaciju napada zaključivanja o članstvu (Membership Inference Attacks, MIA) na jezičke modele usklađene metodom direktne optimizacije preferencija (Direct Preference Optimization, DPO). Implementacija je realizovana u programskom jeziku Python uz biblioteke Transformers i PyTorch. Implementirane su dve metode napada: PREMIA [1], koja je specifično dizajnirana za DPO modele, i SPV-MIA [2], koja je originalno razvijena za standardne jezičke modele i u okviru ovog rada je adaptirana za DPO kontekst.

Veliki jezički modeli danas čine osnovu mnogih sistema veštačke inteligencije. Nakon inicijalnog treniranja na korpusima teksta, ovi modeli prolaze kroz fazu usklađivanja sa ljudskim preferencijama kako bi generisali odgovore koji su korisni i bezbedni. DPO algoritam [3] predstavlja jednu od popularnih metoda usklađivanja koja direktno optimizuje model na parovima preferiranih i nepreferiranih odgovora, bez potrebe za zasebnim modelom nagrade.

…

Napadi zaključivanja o članstvu na DPO modele predstavljaju rastuću oblast istraživanja sa značajnim implikacijama za privatnost. Ovaj rad doprinosi razumevanju ove oblasti demonstrirajući važnost korišćenja metoda specifičnih za ciljnu paradigmu treniranja i pružajući empirijsku evidenciju o granicama prenosivosti postojećih tehnika.

Kako jezički modeli postaju sve prisutniji u svakodnevnim aplikacijama, razumevanje i smanjenje rizika po privatnost postaje sve važnije. Ovaj rad u tom smislu može poslužiti kao korisna referenca za istraživače i praktičare koji rade na bezbednosti i privatnosti sistema mašinskog učenja. – zaključio je David.

Student David Ilić odbranio je diplomski rad na temu „Implementacija napada zaključivanja o članstvu na jezičke modele usklađene metodom direktne optimizacije preferencija“

Važni datumi

ŠKOLSKA 2025/2026.

BESPLATNE MASTER I DOKTORSKE AKADEMSKE STUDIJE

Master akademske studije

Doktorske akademske studije

Prijemni ispit

septembar 2025.

Master strukovne studije

Pripremna nastava

Master strukovne studije

ŠKOLSKA 2026/2027.

Prijemni ispit

septembar 2026.

Osnovne studije

Strukovne studije

Pripremna nastava

Akademske studije

Strukovne studije

Prijemni ispit

jun 2026.

Osnovne akademske studije

Pripremna nastava

Stipendije na Računarskom fakultetu