Objectifs
- Comprendre les origines et les défis du traitement des données massives.
- Étudier les fondements de l’architecture HADOOP et de MapReduce.
- Maitriser le concept des bases de données NoSQL.
- Introduire les algorithmes du Big Data Analytics.
Contenu
Introduction au Big Data
- Origines et Définitions
- Enjeux du Big Data
- Architecture Big Data
Analyse des Big Data
- Moteur de traitement SPARK
- Préparation des données (PreProcessing, Feature Selection)
- Analyse des données (Regression, Clustering, …)
- Indexation et recherche de données (Elasticsearch, Kibana)
- Visualisation des données (DataViz)
Ecosystème Big Data
- Architecture HADOOP et MapReduce
- Modes de stockage (NoSQL, HDFS)
- Collecte et transfert de données (SQOOP, FLUME)
- Base et entrepôt de données (HBase, Hive)