Cette formation est une initiation aux fondamentaux d’Hadoop. Elle donne aux participants une connaissance théorique et pratique de la plateforme, au travers de plusieurs exercices pratiques appliqués à des cas réels. A l’issue de la session, les participants seront en capacité d’utiliser les outils de l’écosystème Hadoop pour explorer des données stockées sur un entrepôt Big Data.
FORMATION CERTIFIANTE BIG DATA FOUNDATION
- Appréhender le fonctionnement d’Hadoop
- Identifier l’écosystème : quels outils pour quels usages ?
- Manipuler les principales commandes shell d’interaction avec Hadoop
- Emettre des requêtes SQL avec Hive et HCatalog
- Créer des traitements de données avec Pig
- Analyste
- Data scientist
- Architecte
- Développeur
- Connaissances de base en programmation ou en scripting.
- Apports théoriques préalables présentant la plateforme Hadoop, son fonctionnement et son écosystème.
Travaux pratiques pour une mise en application immédiate.
Les travaux pratiques s’effectueront sur un cluster Apache Hadoop 2.x.
PROFILS DES INTERVENANTS
Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.
MODALITÉS D’ÉVALUATION ET FORMALISATION À L’ISSUE DE LA FORMATION
L’évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l’action de formation ainsi que la formalisation des acquis.
PROGRAMME :
1 INTRODUCTION AU BIG DATA
- Qu’est-ce que Big Data ?
- Les grands enjeux métier
- Paysage technologique : les architectures Big Data
2 INTRODUCTION À HADOOP
-
- Historique succinct
- Le cœur de la plateforme : HDFS et YARN
- L’écosystème Hadoop
- Frameworks et algorithmes
- Bases de données
- Traitements des données
- Intégration
- Hadoop et la sécurité des données
3 MANIPULER LA LIGNE DE COMMANDE HADOOP
- Présentation des principales commandes
- Mise en pratique “Manipulation et transfert de fichiers en ligne de commande
4 UNE INTERFACE UTILISATEUR POUR HADOOP : HUE
- Présentation de Hue et de ses modules
- Mise en pratique “Manipulation interactive de données”
5 INTERROGER HADOOP AVEC DU SQL : HIVE
- Présentation de Hive
- Mise en pratique “Manipulation de données avec SQL”
- Créer un modèle de données
- Importer des fichiers sources
- Requêter les données
- Apache Hadoop et Amazon EMR
- Atelier 3 : “Stockage et interrogation de données sur Amazon DynamoDB”
- Utilisation d’Amazon EMR
- Frameworks de programmation Hadoop
- Atelier 4 : “Traitement des journaux du serveur avec Hive sur Amazon EMR”
- Interfaces Web sur Amazon EMR
- Atelier 5 : “Exécution de scripts Pig dans Hue sur Amazon EMR”
- Apache Spark sur Amazon EMR
- Atelier 6 : “Traitement des données de taxis new-yorkais avec Spark sur Amazon EMR”
- Type : Stage pratique en présentiel ou en ligne (Formation certifiante EXIN)
- Durée : 3 jours (21 heures)
- Exposés : 50%
- Cas pratiques : 40%
- Échanges d’expérience : 10%
- mai
septembre
décembre
- En présentiel ou à distance
- Français
- 4 à 10 participants
A noter : Formation éligible au FNE Formation pour les salariés en activité partielle.
- Tarif & dates intra-entreprise
Devis sur demande