Osnovi nauke o podacima

Cilj i ishod predmeta

Savladane metode i tehnike osposobiće studenta za pripremu podataka za analizu, efikasno upravljanje podacima, istraživačku analizu podataka, postavljanje statističkih hipoteza i izvođenje zaključaka, predviđanje pomoću modela baziranih na podacima, prezentaciju rezultata kroz vizuelizaciju podataka i efektivne sumarne izveštaje.

Teorijska nastava

Uvod u moderne sisteme pronalaženja informacija i mašine za pretraživanje. Bulovski model pretraživanja informacija. Osnovne strukture podataka i algoritmi za indeksiranje informacija. Metrike sličnosti teksta i dokumenata i pretraživanje informacija tolerantno na greške u Kvalitet podataka. Specifikacija i razumevanje problema, priprema podataka za analizu (data wrangling), istraživačka analiza i evaluacija, modelovanje zasnovano na podacima, analiza rezultata, komunikacija rezultatima. Vizuelizacija podataka. Tipovi podataka. Tehnike dinamičke i interaktivne vizuelizacije podataka. Statističko razmišljanje i zaključivanje. Odabrani primeri raspodela (Binomial, Geometric, Poisson, Exponential, Gaussian, Student’s, Snedecor’s F distribution, Beta, Weibull). Testiranje hipoteza o parametrima osnovnih skupova i obliku raspodele; testovi normalnosti, analiza varijanse, neparametarski testovi. Redukcija dimenzionalnosti i faktorska analiza podataka. PCA – analiza glavnih komponenti. Modelovanje podataka. Regresije. Višestruka regresija (MLR). Stepwise regresije. Logistička regresija. Modelovanje pomoću veštačkih neuronskih mreža. Vrste rastojanja. Koncepti sličnosti. Koncepti klasifikacije i klasterizacije podataka. K-Means. K-Medoids. Hijerarhijska klasterizacija. Ostali pristupi klasterizaciji. Klasterizacija kategorijskih podataka. Ekstrakcija informacija iz tekstualnih podataka. Analiza sentimenta. Analiza velikih podataka dobijenih iz interneta stvari (IoT). Podaci zavisni od vremena. Vremenske serije. Estimacija parametara modela i predikcija kretanja dinamičkih sistema. Etički problemi.

Praktična nastava

Primena programskih jezika R, Python i njihovih biblioteka u nauci o podacima. Rad na vežbama podrazumeva primenu stečenog znanja na rešavanje konkretnih aktuelnih problema u različitim oblastima.

1 thought on “Osnovi nauke o podacima”

Comments are closed.