Cilj i ishod predmeta
Upoznavanje sa modernim algoritmima, tehnikama i modelima za prikupljanje, indeksiranje i pretraživanje informacija. Na kraju kursa se očekuje da studenti razumeju upotrebu modernih algoritama, tehnika i modela pronalaženja informacija, kao i da su u stanju da ih implementiraju i evaluiraju u širokom spektru praktičnih aplikacija.
Teorijska nastava
Uvod u moderne sisteme pronalaženja informacija i mašine za pretraživanje. Bulovski model pretraživanja informacija. Osnovne strukture podataka i algoritmi za indeksiranje informacija. Metrike sličnosti teksta i dokumenata i pretraživanje informacija tolerantno na greške u korisničkim upitima. Distribuirano indeksiranje. Tehnike za kompresiju indeksa. Vektorski model pretraživanja informacija. Rangiranje rezultata pretrage. Evaluacija sistema za pretraživanje. Relevantnost rezultata pretrage, ekspanzija upita i interakcija sa korisnikom. Probabilistički modeli pronalaženja informacija. Jezički modeli za pronalaženje informacija (LLM). Inteligentne tehnike za rangiranje, klasifikaciju, kategorizaciju i filtriranje rezultata pretrage. Arhitektura sistema za pretraživanje veba i pronalaženje informacija na vebu.
Praktična nastava
Praktični programski zadaci koji se odnose na strukture podataka i algoritme za indeksiranje i pretraživanje informacija. Upoznavanje sa modernim programskim bibliotekama za pretraživanje informacija (Apache Lucene). Efikasno pretraživanje velikih skupova podataka. Primeri jezičkih modela za pronalaženje informacija (Google LaMDA, Meta LlaMA, OpenAI GPT-3 i GPT-4). Osnovi pretraživanja na vebu. Veb puzači i indeksiranje veb stranica. Analiza linkova i rangiranje stranica. Implementacija pretraživanja multimedijalnog sadržaja i pronalaženja odgovarajućih informacija.
1 thought on “Uvod u pronalaženje informacija”
Comments are closed.