Велики подаци

Циљ и исход предмета

Основни циљ предмета је упознавање са савременим принципима управљања информацијама у системима који се заснивају на великим подацима. Студенти стичу напредна знања и вештине везане за управљање подацима, информацијама, пројектовање и развој информационих система у big data окружењу.

Теоријска настава

На предавањима се предочава разноврсност могућих очекивања од великих података и приказује се шта је то што омогућава брз одговор на та очекивања. Студенти се упућују у основе инфраструктуре која се користи у раду са великим подацима. Приказује се покрет NoSQL, те основни концепти, технике и обрасци потребни за дистрибуирани рад база података. Кроз анализу решења попут Amazon Dynamo уводи се концепт база података кључ-вредност. Представљају се документ-оријентисане базе података, са фокусом на MongoDB. Кроз осврт на имплементацију Google BigTable и кратак преглед технологије GFS/HDFS објашњава се функсионисање колонских база података.

Практична настава

На вежбама се доминантно користе технологије Dell EMC. Одговара се на питање када у обради великих података користити релационе, а када нерелационе базе података. Дефинише се шта подразумева решење на платформи Hadoop и разрађује се архитектура ХДФС. Пореде се софтверски базирана решења и наменска решења. Студенти на примерима у брижљиво осмишљеној лабораторијској вежби уче како да концепт архитектуре Dell EMC Isilon OneFS искористе за обраду великих података. При томе се упућују како да поставе и скалирају решење, како да управљају сториџима, те како да обезбеде поузданост. На још једној лабораторијској вежби студенти уче како да изврше интеграцију Hadoop и решења у претходно уведеној архитектури, при чему се, поред осталог, ради конфигурисање решења за HDFS, припрема се сервер Ambari и примењује се платформа Hortonworks Data.