Uvod v velepodatke. Značilnosti velepodatkov,. Velepodatki in podatkovna znanost. Relacijske podatkovne baze in velepodatki. Porazdeljeni podatkovni sistemi. Hadoop ekosistem.
Upravljanje z velepodatki. Podatkovni modeli za strukturirane in delno strukturirane podatke. Nerelacijski (NoSQL) podatkovni modeli. Podatkovni modeli in sistemi za upravljanje z velepodatki.
Obdelava velepodatkov. Povpraševanje in pridobivanje podatkov. Paradigme za obdelavo velepodatkov. Procesni cevovodi in agregatorji. Osnovni gradniki in vzorci pisanja algoritmov. Hadoop in Spark.
Analitika velepodatkov. Orodja za podatkovno analitika. Osnovna statistika. Gručenje. Asociacije. Napovedno modeliranje. Knjižnica orodij za strojno učenje Spark MLib.
Velepodatki in analiza grafov. NoSQL grafne baze za delo z velepodatki. Neo4j grafna baza. Povpraševanje po grafih z jezikom CYPHER. Osnovna analiza grafov z Neo4j in CYPHER.
Praktični vidiki analize velepodatkov. Obdelava heterogenih podatkov. Obdelava podatkovnih tokov.