Plan du site  
français  English
pixel
pixel

Administration de Hadoop pour solutions Big Data

x 4px;">

Administration de Hadoop pour solutions Big Data

6 crédits ECTSÀ partir de la fin de la B.Sc.

Introduction

L'émergence de grands volumes de données représente de nouvelles opportunités et de nouveaux défis pour les entreprises de toute taille.

Au cours de cette option d'administration Big Data, vous allez acquérir les compétences pratiques nécessaires pour administrer la plate-forme Hadoop d'Apache.

Vous apprendrez à construire un cluster, à sauvegarder et sécuriser ses données et à intégrer des applications et des outils complémentaires.

Au cours de cette formation, vous apprendrez non seulement à installer, configurer et gérer la plateforme Hadoop d'Apache et son écosystème, mais aussi à surveiller des tâches Hadoop avec des fonctionnalités intégrées et des outils dédiés, comme par exemple Ganglia.

Vous apprendrez également à optimiser l'affectation des ressources en fonction du système de fichiers et de MapReduce. Cette formation présente aussi différentes techniques permettant de garantir la robustesse, l'efficacité et la haute disponibilité de vos clusters, comme par exemple la redondance des données et la fédération des nœuds de nommage.

Vous découvrirez les principales fonctions d'administration d'Hadoop, la gestion de Pig, Hive, ZooKeeper, Oozie et HBase et les difficultés liées à la mise en œuvre des stratégies de sauvegarde, de récupération et de sécurité. Vous utiliserez Sqoop et Flume pour migrer des données depuis et vers Hadoop.

Où se situe cette spécialisation dans les Cursus SUPINFO


Objectifs

Créer l'architecture d'une solution Hadoop pour répondre aux besoins de votre entreprise Installer et configurer un cluster Hadoop qui gère des ensembles de données volumineux Configurer et personnaliser un environnement Hadoop pour optimiser la disponibilité et le débit des données.


Contenu de la Spécialisation

  • 1. Stockage et traitement des données

    1.1. Installation du système de fichiers distribué Hadoop (HDFS)
    1.2. Préparer l'environnement pour MapReduce
  • 2. Définition des spécifications d'un cluster Hadoop

    2.1. Planification de l'architecture
    2.2. Développement du cluster
  • 3. Configuration du cluster

    3.1. Préparation du système HDFS
    3.2. Déploiement de MapReduce
  • 4. Optimiser la robustesse du système HDFS

    4.1. Créer un système de fichiers tolérant aux pannes
    4.2. Optimiser la fédération des nœuds de nommage
    4.3. Présentation de YARN
  • 5. Gestion des ressources et de l'intégrité du cluster

    5.1. Affectation des ressources
    5.2. Gestion de HDFS
    5.3. Ajouter et supprimer des nœuds de données
    5.4. Administration de MapReduce
    5.5. Gérer les tâches MapReduce, suivre l'avancement avec des outils d'analyse, mise en service et arrêt des nœuds de calcul
  • 6. Maintenance du cluster

    6.1. Utiliser les outils standards intégrés
    6.2. Utiliser des outils de personnalisation complémentaires
  • 7. Développement des fonctionnalités d'Hadoop

    7.1. Simplifier l'accès aux informations
    7.2. Intégrer des éléments supplémentaires de l'écosystème
  • 8. Définition de règles pour le trafic entrant et sortant

    8.1. Faciliter l'entrée / la sortie de données génériques
    8.2. Recueillir des données d'application
    8.3. Planification des stratégies de sauvegarde, de récupération et de sécurité

Ressources

Pour les Advanced Members (Inscrits à un cursus ou titulaires du statut)

Ces ressources sont une sélection utile d'un ensemble très riche de plus de 20.000 livres et vidéos de cours issus des plus grandes maisons d'édition et des meilleurs experts internationaux mis en accès illimité à la disposition des inscrits à SUPINFO International University disposant du statut "Advanced Member". Toute personne inscrite à un cursus SUPINFO dispose automatiquement de ce statut.Si vous n'êtes pas déjà authentifié sur les sites des bibliothèques de ressources SUPINFO, soit avec vos identifiants dédiés soit en passant par Open Campus, l'usage des liens ci-dessous ne vous donnera accès qu'à un aperçu des ouvrages. Devenez Advanced Member

Vous maitrisez le cours : Certifiez vous et obtenez des crédits ECTS

Suivez un Cursus SUPINFO

En vue d'obtenir un titre Bac+2 d'Associate of Science (A.Sc.) en fin de 2ème année, le titre A.Sc. peut être complété par une année de Bachelor of Science (titre B.Sc. Bac+3), puis par deux années de Master* Of Science (M.Sc. Bac+5)

Obtenez une certification et des crédits ECTS* à l'issue de cette spécialisation

Grâce à l'enseignement de SUPINFO que vous venez de suivre, vous aurez la possibilité de vous certifier en vous inscrivant à l'une de nos session d'évaluation.

Vous contribuez : publications remarquées de la communauté

Découvrez prochainement des articles, publications et vidéos des membres de la communauté SUPINFO. Ils vous permettront ainsi d'en apprendre d'avantage sur le cours et d'aller plus loin de votre apprentissage.

Vous souhaitez soumettre du contenu de qualité ?
N'hésitez pas à entrer en contact avec le full professor de la matière concernée pour lui faire part de votre demande.

A propos de SUPINFO | Contacts & adresses | Enseigner à SUPINFO | Presse | Conditions d'utilisation & Copyright | Respect de la vie privée | Investir
Logo de la société Learning Tree International, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Cisco, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société IBM, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Sun-Oracle, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Apple, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Intel, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Accenture, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société SAP, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Prometric, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Toeic, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo du IT Academy Program par Microsoft, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management

SUPINFO International University
Ecole d'Informatique - IT School
École Supérieure d'Informatique de Paris, leader en France
La Grande Ecole de l'informatique, du numérique et du management
Fondée en 1965, reconnue par l'État. Titre Bac+5 certifié au niveau I.
SUPINFO International University is globally operated by EDUCINVEST Belgium - Avenue Louise, 534 - 1050 Brussels