Les distributions HADOOP
Hadoop – Cloudera pour développeurs
Reference : HAD02

Prochaines sessions

Objectifs
- Hadoop: les concepts de base
- Hadoop 2.0 et Hadoop Distributed File System
- Mettre en œuvre le nouveau Framework YARN dans Hadoop 2.0
- Rédiger un programme « MapReduce »
- Optimiser une tache MapReduce en suivant les meilleures pratiques
- L’écosystème Hadoop
- Intégrer Hadoop dans un « Workflow »
- Les algorithmes « MapReduce » communs
- Travailler avec Apache Hive et Pig
- Débugger des programmes « MapReduce »
- Le développement « MapReduce » avancé
- L’utilisation de Graph avec Hadoop
- Le nouvel API Hadoop
Pré requis
- Cette formation Hadoop – Cloudera pour développeurs nécessite une expérience dans le développement, si possible avec Java.
- Une compréhension des algorithmes est un plus.
Modalités pédagogiques
Cours dispensé en mode présentiel avec une alternance d’apports théoriques et méthodologiques, et de mises en situations pratiques
Public visé
Tout public
Inscription
Programmes de Hadoop – Cloudera pour développeurs
JOUR 1
- Les technologies Hadoop
- Comment fonctionne « Hadoop Distributed File System » et « MapReduce »
- Comment développer des applications « MapReduce »
JOUR 2
- Comment réaliser des tests unitaires d’applications MapReduce
- Comment utiliser des combinateurs MapReduce, des partitionners et des caches distribués
- Les meilleures pratiques pour développer et débugger des applications MapReduce
JOUR 3
- Comment mettre en œuvre l’entrée et la sortie des données dans les applications MapReduce
- Les algorithmes pour les principales tâches « MapReduce »
- Comment relier des ensembles de données dans MapReduce
- Comment Hadoop s’intègre dans le Data Center
- Comment utiliser les algorithmes d’apprentissage automatique de Mahout
- Comment Hive et Pig peuvent être utilisés pour développer rapidement des applications
- Comment créer des workflow important avec Oozie