Pronalaženje informacija

Cilj i ishod predmeta

Razumevanje osnovnih aspekata projektovanja i implementacije sistema za prikupljanje, indeksiranje i pretraživanje dokumenata. Student razume teorijske osnove indeksiranja i pretraživanja podataka i ume da ih primeni u implementiciji konkretnog sistema za pronalaženje informacija.

Teorijska nastava

Pretraga teksta. Pretprocesiranje teksta. Bulov model pretraživanja – invertovani indeks, procesiranje upita, pointeri za preskakanje, upiti fraze. Vektorski model pretraživanja – ocena relevantnosti, frekvencija terma, frekvencija dokumenta, frekvencija kolekcije, TF-IDF, težina matrica. Probabilistički modeli pretraživanja. Fazi model i prošireni Bulov model pretraživanja. Pretraga strukturiranog teksta. Pretraga veba. Veb pretraživači i veb crawling. Analiza linkova. SEO – Search Engine Optimization. Pretraga multimedijalnog sadržaja – slike, zvuka, videa. Performanse pretraživanja. Relevantnost. Evaluacija performansi. Unapređenje sistema pretraživanja – prikaz rezulata pretrage, klasifikacija, klasterovanje rezultata pretrage, relevance feedback, globalno proširenje upita.

Praktična nastava

Pregled dostupnih alata i biblioteka za indeksiranje i pretraživanje podataka. Pretraživanje relacionih i nerelacionih baza podataka. Kreiranje indeksa za dati korpus podataka. Implementacija različitih tehnika pretraživanja nad kreiranim indeksom i poređenje kvaliteta rezultata. Poređenje performansi pretraživanja. Primena tehnika za unapređenje sistema pretraživanja. Automatsko preuzimanje podataka sa veba tehnikama data scraping i data crawling. Indeksiranje preuzetih podataka. Pretraživanje preuzetih podataka. Implementacija pretraživanja multimedijalnog sadržaja.

3003-pronalazenje-informacija