Циљ и исход предмета
Упознавање са модерним алгоритмима, техникама и моделима за прикупљање, индексирање и претраживање информација. На крају курса се очекује да студенти разумеју употребу модерних алгоритама, техника и модела проналажења информација, као и да су у стању да их имплементирају и евалуирају у широком спектру практичних апликација.
Теоријска настава
Увод у модерне системе проналажења информација и машине за претраживање. Буловски модел претраживања информација. Основне структуре података и алгоритми за индексирање информација. Метрике сличности текста и докумената и претраживање информација толерантно на грешке у корисничким упитима. Дистрибуирано индексирање. Технике за компресију индекса. Векторски модел претраживања информација. Рангирање резултата претраге. Евалуација система за претраживање. Релевантност резултата претраге, експанзија упита и интеракција са корисником. Пробабилистички модели проналажења информација. Језички модели за проналажење информација (LLM). Интелигентне технике за рангирање, класификацију, категоризацију и филтрирање резултата претраге. Архитектура система за претраживање веба и проналажење информација на вебу.
Практична настава
Практични програмски задаци који се односе на структуре података и алгоритме за индексирање и претраживање информација. Упознавање са модерним програмским библиотекама за претраживање информација (Apache Lucene). Ефикасно претраживање великих скупова података. Примери језичких модела за проналажење информација (Google LaMDA, Meta LlaMA, OpenAI GPT-3 и GPT-4). Основи претраживања на вебу. Веб пузачи и индексирање веб страница. Анализа линкова и рангирање страница. Имплементација претраживања мултимедијалног садржаја и проналажења одговарајућих информација.
1 thought on “Увод у проналажење информација”
Comments are closed.