Циљ и исход предмета
Савладане методе и технике оспособиће студента за припрему података за анализу, ефикасно управљање подацима, истраживачку анализу података, постављање статистичких хипотеза и извођење закључака, предвиђање помоћу модела базираних на подацима, презентацију резултата кроз визуелизацију података и ефективне сумарне извештаје.
Теоријска настава
Увод у модерне системе проналажења информација и машине за претраживање. Буловски модел претраживања информација. Основне структуре података и алгоритми за индексирање информација. Метрике сличности текста и докумената и претраживање информација толерантно на грешке у Квалитет података. Спецификација и разумевање проблема, припрема података за анализу (data wrangling), истраживачка анализа и eвалуација, моделовање засновано на подацима, анализа резултата, комуникација резултатима. Визуелизација података. Типови података. Технике динамичке и интерактивне визуелизације података. Статистичко размишљање и закључивање. Одабрани примери расподела (Binomial, Geometric, Poisson, Exponential, Gaussian, Student’s, Snedecor’s F distribution, Beta, Weibull). Тестирање хипотеза о параметрима основних скупова и облику расподеле; тестови нормалности, анализа варијансе, непараметарски тестови. Редукција димензионалности и факторска анализа података. PCA – анализа главних компоненти. Моделовање података. Регресије. Вишеструка регресија (MLR). Stepwise регресије. Логистичка регресија. Моделовање помоћу вештачких неуронских мрежа. Врсте растојања. Концепти сличности. Концепти класификације и кластеризације података. K-Means. K-Medoids. Хијерархијска кластеризација. Остали приступи кластеризацији. Кластеризација категоријских података. Екстракција информација из текстуалних података. Анализа сентимента. Анализа великих података добијених из интернета ствари (IoT). Подаци зависни од времена. Временске серије. Естимација параметара модела и предикција кретања динамичких система. Етички проблеми.
Практична настава
Примена програмских језика R, Python и њихових библиотека у науци о подацима. Рад на вежбама подразумева примену стеченог знања на решавање конкретних актуелних проблема у различитим областима.
1 thought on “Основи науке о подацима”
Comments are closed.