Student Računarskog fakulteta Vanja Matović je u utorak, 25. oktobra 2022. godine odbranio diplomski rad na temu Prepoznavanje poze objekta pomoću modela dubokog učenja za računarsku viziju pred komisijom koju su činili mentor dr Nemanja Ilić i član dr Jelena Vasiljević.
U uvodu svog rada Vanja je istakao sledeće:
Mi prilično potcenjujemo koliko smo dobri u interpretiranju vizuelnih informacija. U trenutku možemo da prepoznamo objekat ili specifičnu osobu, možemo da zaključimo kako se osećaju na osnovu izraza lica, i možemo svašta da zaključimo o objektu na osnovu osenčenja, svetlosti, volumena, udaljenosti… Ako je to veoma lak zadatak za ljude zašto ne bi bio i za kompjutere? Nekada su naučnici smatrali da bi kompjuteri imali više poteškoća sa logičkim zaključivanjem nego sa slikama. Ispostavilo se da to nije tačno i da čak kompjuterima lakše ide logika nego interpretacija slika. Videćemo zašto taj problem nije trivijalan.
…
U ovom radu je ukratko predstavljena oblast kompjuterske vizije. Čak i kroz relativno jednostavan algoritam najbližih suseda smo opisali koncepte poput treniranja, podele slika na obučavajuće i testne skupove, hiperparametre, kros validacije… Zatim smo sa linearnim klasifikatorima bili korak bliže optimalnom rešenju gde smo mogli da vizuelizujemo parametre, opišemo pojmove optimizacije itd.
Kompozicija linearnih funkcija sa aktivacionim funkcijama predstavlja duboku neuralnu mrežu. Varijanta te mreže koja se uglavnom bavi slikama je konvoluciona neuralna mreža. Efikasnija je, a i hvata informacije na sličan način kao što bi mozak to uradio. AlexNet je prvi uspešan CNN, i svi njegovi sledbenici su dogradnje toga.
Kroz aplikaciju smo videli primenu CNN-a u vidu detekcije objekata i prepoznavanja poze. Oblast detekcije je izuzetno razvijena i primenjuje se u detektovanju maske, detektovanju pešaka ako se vozilo samo kreće i čak u detektovanju tumora. Ovde smo samo zagrebali površinu kompjuterske vizije, pošto mogu na primer da se koriste rekurentne neuralne mreže za izbacivanje deskripcije slike ili generativni modeli za generisanje slika ljudi koji ne postoje ili umetničkih slika zasnovani na upitu. – zaključio je Vanja.
Fotografije sa odbrane dostupne su u galeriji.