Les distributions HADOOP
Hadoop – Cloudera pour architectes et administrateurs
Reference : HAD03

3
jours - 2 100 € € HT Télécharger la fiche
Prochaines sessions

Objectifs
- Comment définir la taille d’un cluster et comment le déployer
- Comment déployer un cluster pour la première fois
- Comment configurer Hadoop et les Framework associés
- Comment gérer en permanence la maintenance des nœuds dans le cluster
- Comment équilibrer et optimiser la performance d’un cluster
- Comment déplacer et gérer les données dans le cluster
- Comment intégrer des statuts et des états de santé dans l’outil de monitoring existant
- Comment ajouter et enlever des nœuds de données
- Comment mettre en place une haute solution de disponibilité
- Les meilleures pratiques pour déployer un cluster Hadoop
Pré requis
- Cette formation Hadoop – Cloudera pour architectes et administrateurs nécessite de savoir naviguer et modifier des fichiers dans Linux
- Une connaissance préliminaire d’Hadoop n’est pas exigée
Modalités et délais d’accès
Pré-inscription
Bulletin d'inscription à retourner complété
Programmes de Hadoop – Cloudera pour architectes et administrateurs
FONDEMENT, PLANIFICATION ET INSTALLATION
- Introduction à la plateforme de données Hadoop 2.0
- Stockage Hadoop : Architecture HDFS
- Prérequis pour l’installation
- Gestion HDP : Ambari
- Ambari et la ligne de commande
- Hadoop Operating System (YARN) & MapReduce
CONFIGURATION ET GESTION DE DONNEES
- Service de configuration
- Configuration HDFS
- Configuration de Hadoop Operating System (YARN) & MapReduce
- Configuration HBase
- Configuration ZooKeeper
- Configuration Schedulers
- Intégrité des données
- Extract-Load-Transform (ELT) Data Movement
- Copie de données entre les clusters
MANAGEMENT DES DONNÉES / HORTONWORKS DATA PLATFORM (HDP) 2.0 OPERATIONS
- HDFS service Web
- Apache Hive Data Warehouse
- Transfert de données aves Sqoop
- Mouvement de données log avec Flume
- HDFS NFS Gateway
- Workflow management : Oozie
- Management du cycle de vie des données avec Falcon
- Monitoring HDP 2.0 Services
- Mise en service ou hors service des nœuds et services
HORTONWORKS DATA PLATFORM (HDP) 2.0
- Rack Awareness and Topology
- NameNode Federation Architecture
- NameNode High-Availability (HA) Architecture
- Backup & Recovery
- Security