Циљ предмета
Стицање модерних знања о фундаменталним процесима, техникама и методама које чине науку о подацима и могућностима њихове практичне примене.
Исход предмета
Савладане методе и технике оспособиће студента за припрему података за анализу, ефикасно управљање подацима, истраживачку анализу података, постављање статистичких хипотеза и извођење закључака, предвиђање помоћу модела базираних на подацима, презентацију резултата кроз визуелизацију података и ефективне сумарне извештаје.
Садржај предмета
Теоријска настава
Квалитет података. Спецификација и разумевање проблема, припрема података за анализу (data wrangling), истраживачка анализа и eвалуација, моделовање засновано на подацима, анализа резултата, комуникација резултатима. Визуелизација података. Типови података. Технике динамичке и интерактивне визуелизације података. Статистичко размишљање и закључивање. Одабрани примери расподела (Binomial, Geometric, Poisson, Exponential, Gaussian, Student’s, Snedecor’s F distribution, Beta, Weibull). Тестирање хипотеза о параметрима основних скупова и облику расподеле; тестови нормалности, анализа варијансе, непараметарски тестови. Редукција димензионалности и факторска анализа података. PCA – анализа главних компоненти. Моделовање података. Регресије. Вишеструка регресија (MLR). Stepwise регресије. Логистичка регресија. Моделовање помоћу вештачких неуронских мрежа. Врсте растојања. Концепти сличности. Концепти класификације и кластеризације података. K-Means. K-Medoids. Хијерархијска кластеризација. Остали приступи кластеризацији. Кластеризација категоријских података. Екстракција информација из текстуалних података. Анализа сентимента. Анализа великих података добијених из интернета ствари (IoT). Подаци зависни од времена. Временске серије. Естимација параметара модела и предикција кретања динамичких система. Етички проблеми.
Практична настава
Примена програмских језика R, Python и њихових библиотека у науци о подацима. Рад на вежбама подразумева примену стеченог знања на решавање конкретних актуелних проблема у различитим областима.