Veliki podaci

Cilj i ishod predmeta

Osnovni cilj predmeta je upoznavanje sa savremenim principima upravljanja informacijama u sistemima koji se zasnivaju na velikim podacima. Studenti stiču napredna znanja i veštine vezane za upravljanje podacima, informacijama, projektovanje i razvoj informacionih sistema u big data okruženju.

Teorijska nastava

Na predavanjima se predočava raznovrsnost mogućih očekivanja od velikih podataka i prikazuje se šta je to što omogućava brz odgovor na ta očekivanja. Studenti se upućuju u osnove infrastrukture koja se koristi u radu sa velikim podacima. Prikazuje se pokret NoSQL, te osnovni koncepti, tehnike i obrasci potrebni za distribuirani rad baza podataka. Kroz analizu rešenja poput Amazon Dynamo uvodi se koncept baza podataka ključ-vrednost. Predstavljaju se dokument-orijentisane baze podataka, sa fokusom na MongoDB. Kroz osvrt na implementaciju Google BigTable i kratak pregled tehnologije GFS/HDFS objašnjava se funksionisanje kolonskih baza podataka.

Praktična nastava

Na vežbama se dominantno koriste tehnologije Dell EMC. Odgovara se na pitanje kada u obradi velikih podataka koristiti relacione, a kada nerelacione baze podataka. Definiše se šta podrazumeva rešenje na platformi Hadoop i razrađuje se arhitektura HDFS. Porede se softverski bazirana rešenja i namenska rešenja. Studenti na primerima u brižljivo osmišljenoj laboratorijskoj vežbi uče kako da koncept arhitekture Dell EMC Isilon OneFS iskoriste za obradu velikih podataka. Pri tome se upućuju kako da postave i skaliraju rešenje, kako da upravljaju storidžima, te kako da obezbede pouzdanost. Na još jednoj laboratorijskoj vežbi studenti uče kako da izvrše integraciju Hadoop i rešenja u prethodno uvedenoj arhitekturi, pri čemu se, pored ostalog, radi konfigurisanje rešenja za HDFS, priprema server Ambari i primenjuje se platforma Hortonworks Data.

4448-veliki-podaci