Student Računarskog fakulteta Novak Živanić je u četvrtak, 7. decembra 2023. godine odbranio diplomski rad na temu Razvoj semantičkih sistema za pretragu podataka i njihovo obučavanje pred komisijom koju su činili mentor dr Nemanja Ilić i član dr Jelena Vasiljević.
U uvodu svog rada Novak je istakao sledeće:
Količina podataka koja se nalazi na internetu neprestalno raste, što dovodi do velikog broja prilika i izazova. Korisnici su dobili pristup neograničenom skupu znanja, ali pronalaženje potrebne informacije u moru veb sajtova postaje sve veći izazov.
Sistemi zasnovani na rečima bili su osnova pretraživanja velike količine tekstualnih podataka još od pojave interneta, zbog toga ih ubrajamo u tradicionalne metode pretrage. Međutim, uprkos svojoj popularnosti, oni se oslanjaju na tačna podudaranja između ključnih reči, sto ih čini manje efikasnim u određenim situacijama. Semantička sličnost, kao mera sličnosti u značenju dva teksta, biva totalno zanemarena u tradicionalnim sistemima. Takođe, limitirani su svojom nesposobnošću da razumeju kontekst upita korisnika. Kao odgovor na ove nedostatke, pojavili su se sistemi za prepoznavanje semantičke sličnosti između tekstova koji dopunjuju ili čak u potpunosti zamenjuju tradicionalne sisteme.
…
U ovom radu, upoznali smo i pokazali važnost problema pretrage podataka. Prošli smo kroz tradicionalne metode i ukazali na njihove prednosti i mane. Posle toga smo stekli neophodno znanje iz neuralnih mreža potrebno za razumevanje glavnog fokusa rada, tekstualnih embedera i semantičkih pretraživača.
Na praktičan način smo pokazali superiornost semantičkih metoda pretraživanja u odnosu na tradicionalne metode. Treba napomenuti, da su skupovi podataka kreirani za evaluaciju kreirani koristeći tradicionalne pretraživače (ekstrakcija guglovih rezultata). Samim tim, labelirani dokumenti daju prednost tradicionalnim metodama. Pokazali smo da treniranjem na ograničenim resursima možemo da postignemo rezultate svetske klase. – zaključio je Novak.
Fotografije sa odbrane dostupne su u galeriji.