FORMATION CERTIFIANTE BIG DATA FOUNDATION

Cette formation est une initiation aux fondamentaux d’Hadoop. Elle donne aux participants une connaissance théorique et pratique de la plateforme, au travers de plusieurs exercices pratiques appliqués à des cas réels. A l’issue de la session, les participants seront en capacité d’utiliser les outils de l’écosystème Hadoop pour explorer des données stockées sur un entrepôt Big Data.

OBJECTIFS PÉDAGOGIQUES

Appréhender le fonctionnement d’Hadoop
Identifier l’écosystème : quels outils pour quels usages ?
Manipuler les principales commandes shell d’interaction avec Hadoop
Emettre des requêtes SQL avec Hive et HCatalog
Créer des traitements de données avec Pig

PUBLIC CIBLE

Analyste
Data scientist
Architecte
Développeur

PRÉ-REQUIS

Connaissances de base en programmation ou en scripting.

MÉTHODE PÉDAGOGIQUE

Apports théoriques préalables présentant la plateforme Hadoop, son fonctionnement et son écosystème.
Travaux pratiques pour une mise en application immédiate.
Les travaux pratiques s’effectueront sur un cluster Apache Hadoop 2.x.

PROFILS DES INTERVENANTS

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

MODALITÉS D’ÉVALUATION ET FORMALISATION À L’ISSUE DE LA FORMATION

L’évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l’action de formation ainsi que la formalisation des acquis.

PROGRAMME :

Jour 1

1 INTRODUCTION AU BIG DATA

Qu’est-ce que Big Data ?
Les grands enjeux métier
Paysage technologique : les architectures Big Data

2 INTRODUCTION À HADOOP

- Historique succinct
- Le cœur de la plateforme : HDFS et YARN
- L’écosystème Hadoop
  - Frameworks et algorithmes
  - Bases de données
  - Traitements des données
  - Intégration
- Hadoop et la sécurité des données

3 MANIPULER LA LIGNE DE COMMANDE HADOOP

Présentation des principales commandes
Mise en pratique “Manipulation et transfert de fichiers en ligne de commande

4 UNE INTERFACE UTILISATEUR POUR HADOOP : HUE

Présentation de Hue et de ses modules
Mise en pratique “Manipulation interactive de données”

5 INTERROGER HADOOP AVEC DU SQL : HIVE

Présentation de Hive
Mise en pratique “Manipulation de données avec SQL”
- Créer un modèle de données
- Importer des fichiers sources
- Requêter les données

Jour 2

Apache Hadoop et Amazon EMR
Atelier 3 : “Stockage et interrogation de données sur Amazon DynamoDB”
Utilisation d’Amazon EMR
Frameworks de programmation Hadoop
Atelier 4 : “Traitement des journaux du serveur avec Hive sur Amazon EMR”
Interfaces Web sur Amazon EMR
Atelier 5 : “Exécution de scripts Pig dans Hue sur Amazon EMR”
Apache Spark sur Amazon EMR
Atelier 6 : “Traitement des données de taxis new-yorkais avec Spark sur Amazon EMR”

Type : Stage pratique en présentiel ou en ligne (Formation certifiante EXIN)
Durée : 3 jours (21 heures)
Exposés : 50%
Cas pratiques : 40%
Échanges d’expérience : 10%

mai
septembre
décembre

En présentiel ou à distance
Français
4 à 10 participants

A noter : Formation éligible au FNE Formation pour les salariés en activité partielle.

Demander un devis

Tarif & dates intra-entreprise

Devis sur demande

Nous contacter