Основи науке о подацима

Циљ и исход предмета

Оспособити студенте за примену препоручене праксе, метода, техника и алата у домену управљања конфигурацијом софтвера (УКС), са посебним Упознавање са модерним алгоритмима, техникама и моделима за прикупљање, индексирање и претраживање информација. На крају курса се очекује да студенти разумеју употребу модерних алгоритама, техника и модела проналажења информација, као и да су у стању да их имплементирају и евалуирају у широком спектру практичних апликација.

Теоријска настава

Увод у модерне системе проналажења информација и машине за претраживање. Буловски модел претраживања информација. Основне структуре података и алгоритми за индексирање информација. Метрике сличности текста и докумената и претраживање информација толерантно на грешке у корисничким упитима. Дистрибуирано индексирање. Технике за компресију индекса. Векторски модел претраживања информација. Рангирање резултата претраге. Евалуација система за претраживање. Релевантност резултата претраге, експанзија упита и интеракција са корисником. Пробабилистички модели проналажења информација. Језички модели за проналажење информација (LLM). Интелигентне технике за рангирање, класификацију, категоризацију и филтрирање резултата претраге. Архитектура система за претраживање веба и проналажење информација на вебу.

Практична настава

Практични програмски задаци који се односе на структуре података и алгоритме за индексирање и претраживање информација. Упознавање са модерним програмским библиотекама за претраживање информација (Apache Lucene). Ефикасно претраживање великих скупова података. Примери језичких модела за проналажење информација (Google LaMDA, Meta LlaMA, OpenAI GPT-3 и GPT-4). Основи претраживања на вебу. Веб пузачи и индексирање веб страница. Анализа линкова и рангирање страница. Имплементација претраживања мултимедијалног садржаја и проналажења одговарајућих информација.

1 thought on “Основи науке о подацима”

Comments are closed.