[wpms_breadcrumb reverse="0"]
Les distributions HADOOP

Hadoop – Cloudera pour architectes et administrateurs

Reference : HAD03

3

jours
- 2 100 €  € HT
Télécharger la fiche
Prochaines sessions
    Hadoop – Cloudera pour architectes et administrateurs
    Objectifs

    • Comment définir la taille d’un cluster et comment le déployer
    • Comment déployer un cluster pour la première fois
    • Comment configurer Hadoop et les Framework associés
    • Comment gérer en permanence la maintenance des nœuds dans le cluster
    • Comment équilibrer et optimiser la performance d’un cluster
    • Comment déplacer et gérer les données dans le cluster
    • Comment intégrer des statuts et des états de santé dans l’outil de monitoring existant
    • Comment ajouter et enlever des nœuds de données
    • Comment mettre en place une haute solution de disponibilité
    • Les meilleures pratiques pour déployer un cluster Hadoop

    Pré requis

    • Cette formation Hadoop – Cloudera pour architectes et administrateurs nécessite de savoir naviguer et modifier des fichiers dans Linux
    • Une connaissance préliminaire d’Hadoop n’est pas exigée

    Modalités et délais d’accès

    Bulletin d'inscription à retourner complété

    Pré-inscription

    Programmes de Hadoop – Cloudera pour architectes et administrateurs

    FONDEMENT, PLANIFICATION ET INSTALLATION

    • Introduction à la plateforme de données Hadoop 2.0
    • Stockage Hadoop : Architecture HDFS
    • Prérequis pour l’installation
    • Gestion HDP : Ambari
    • Ambari et la ligne de commande
    • Hadoop Operating System (YARN) & MapReduce

    CONFIGURATION ET GESTION DE DONNEES

    • Service de configuration
    • Configuration HDFS
    • Configuration de Hadoop Operating System (YARN) & MapReduce
    • Configuration HBase
    • Configuration ZooKeeper
    • Configuration Schedulers
    • Intégrité des données
    • Extract-Load-Transform (ELT) Data Movement
    • Copie de données entre les clusters

    MANAGEMENT DES DONNÉES / HORTONWORKS DATA PLATFORM (HDP) 2.0 OPERATIONS

    • HDFS service Web
    • Apache Hive Data Warehouse
    • Transfert de données aves Sqoop
    • Mouvement de données log avec Flume
    • HDFS NFS Gateway
    • Workflow management : Oozie
    • Management du cycle de vie des données avec Falcon
    • Monitoring HDP 2.0 Services
    • Mise en service ou hors service des nœuds et services

    HORTONWORKS DATA PLATFORM (HDP) 2.0

    • Rack Awareness and Topology
    • NameNode Federation Architecture
    • NameNode High-Availability (HA) Architecture
    • Backup & Recovery
    • Security