Les formations Hadoop

Les formations Hadoop

Apache Hadoop est un framework libre et open source inspiré de deux noyeaux de la gestion BigData de Google: GFS (Google File System) and MapReduce. C'est un framework complet destiné à stocker et traiter de grosses quantités de données. Hadoop est utilisé par la plupart des fournisseurs de service dont Yahoo, Facebook ou LinkedIn.

Nos Clients témoignent

★★★★★
★★★★★

Nos clients

Plans de cours Hadoop

Nom du Cours
Durée
Aperçu
Nom du Cours
Durée
Aperçu
21 hours
Python est un langage de programmation scalable, flexible et largement utilisé pour la science des données et l'apprentissage automatique. Spark est un moteur de traitement de données utilisé dans la recherche, l'analyse et la transformation de données grandes, tandis que Hadoop est un cadre de bibliothèque logicielle pour le stockage et le traitement de données à grande échelle.

Cette formation guidée par les instructeurs (online ou on-site) est destinée aux développeurs qui souhaitent utiliser et intégrer Spark, Hadoop, et Python pour traiter, analyser et transformer de grands et complexes ensembles de données.

À la fin de cette formation, les participants seront en mesure de :

Créez l’environnement nécessaire pour commencer à traiter les grandes données avec Spark, Hadoop, et Python. Comprendre les caractéristiques, les composants de base et l'architecture de Spark et Hadoop. Apprenez à intégrer Spark, Hadoop, et Python pour le traitement de données grandes. Explorez les outils dans l'écosystème Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, et Flume). Construisez des systèmes de recommandations de filtration collaboratives similaires à Netflix, YouTube, Amazon, Spotify et Google. Utilisez Apache Mahout pour échanger les algorithmes d’apprentissage automatique.

Le format du cours

Lecture et discussion interactives. Beaucoup d’exercices et de pratiques. La mise en œuvre dans un environnement de laboratoire en direct.

Options de personnalisation de cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
7 hours
Ce cours explique comment utiliser le SQL Hive SQL (AKA: Hive HQL, SQL sur Hive , Hive QL) pour les personnes qui extraient des données à partir de Hive
14 hours
Datameer est une plateforme de business intelligence et d'analyse basée sur Hadoop Il permet aux utilisateurs finaux d'accéder, d'explorer et de mettre en corrélation des données à grande échelle, structurées, semi-structurées et non structurées de manière simple Dans cette formation en ligne, les participants apprendront à utiliser Datameer pour surmonter la courbe d'apprentissage abrupte d'Hadoop à mesure qu'ils progressent dans la configuration et l'analyse d'une série de sources de données volumineuses À la fin de cette formation, les participants seront en mesure de: Créer, organiser et explorer de manière interactive un lac de données d'entreprise Accéder aux entrepôts de données de Business Intelligence, aux bases de données transactionnelles et aux autres magasins analytiques Utiliser une interface utilisateur de feuille de calcul pour concevoir des pipelines de traitement de données endtoend Accéder à des fonctions prédéfinies pour explorer des relations de données complexes Utilisez les assistants draganddrop pour visualiser les données et créer des tableaux de bord Utiliser des tableaux, des graphiques, des graphiques et des cartes pour analyser les résultats de la requête Public Analystes de données Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
21 hours
The course is dedicated to IT specialists that are looking for a solution to store and process large data sets in distributed system environment

Course goal:

Getting knowledge regarding Hadoop cluster administration
35 hours
Public:

Le cours est destiné aux informaticiens à la recherche d'une solution pour stocker et traiter de grands ensembles de données dans un environnement système distribué.

Go al:

Connaissance approfondie de l'administration de cluster Hadoop .
28 hours
Audience:

This course is intended to demystify big data/hadoop technology and to show it is not difficult to understand.
28 hours
Apache Hadoop is the most popular framework for processing Big Data on clusters of servers. This course will introduce a developer to various components (HDFS, MapReduce, Pig, Hive and HBase) Hadoop ecosystem.
21 hours
Apache Hadoop est l’un des frameworks les plus populaires pour le traitement du Big Data sur des clusters de serveurs. Ce cours aborde la gestion des données dans HDFS, Pig, Hive et HBase. Ces techniques de programmation avancées seront utiles aux développeurs expérimentés Hadoop .

Public : développeurs

Durée: trois jours

Format: cours magistraux (50%) et travaux pratiques (50%).
21 hours
This course introduces HBase – a NoSQL store on top of Hadoop. The course is intended for developers who will be using HBase to develop applications, and administrators who will manage HBase clusters.

We will walk a developer through HBase architecture and data modelling and application development on HBase. It will also discuss using MapReduce with HBase, and some administration topics, related to performance optimization. The course is very hands-on with lots of lab exercises.

Duration : 3 days

Audience : Developers & Administrators
21 hours
Apache Hadoop est le framework le plus répandu pour le traitement de Big Data sur des clusters de serveurs. Dans ce cours de trois (facultatif, quatre jours), les participants découvriront les avantages commerciaux et les cas d'utilisation de Hadoop et de son écosystème, comment planifier le déploiement et la croissance d'un cluster, comment installer, gérer, surveiller, dépanner et optimiser Hadoop . Ils s'exerceront également au chargement en bloc de données en grappe, se familiariseront avec les différentes distributions Hadoop et s'exerceront à installer et à gérer les outils écosystémiques Hadoop . Le cours se termine par une discussion sur la sécurisation d'un cluster avec Kerberos.

“… Les matériaux étaient très bien préparés et couverts à fond. Le laboratoire était très serviable et bien organisé ”
- Andrew Nguyen, ingénieur principal en intégration, Microsoft Online Advertising

Public

Administrateurs Hadoop

Format

Cours magistraux et ateliers pratiques, bilan approximatif: 60% cours magistraux, 40% laboratoires.
21 hours
Apache Hadoop is the most popular framework for processing Big Data. Hadoop provides rich and deep analytics capability, and it is making in-roads in to tradional BI analytics world. This course will introduce an analyst to the core components of Hadoop eco system and its analytics

Audience

Business Analysts

Duration

three days

Format

Lectures and hands on labs.
21 hours
Hadoop est le framework de traitement Big Data le plus populaire .
14 hours
Audience

- Developers

Format of the Course

- Lectures, hands-on practice, small tests along the way to gauge understanding
21 hours
Ce cours est destiné aux développeurs, architectes, scientifiques de données ou à tout profil nécessitant un accès intensif ou régulier aux données.

Le cours est axé sur la manipulation et la transformation des données.

Parmi les outils de l'écosystème Hadoop , ce cours comprend l'utilisation de Pig et Hive deux outils très utilisés pour la transformation et la manipulation de données.

Cette formation aborde également les métriques de performance et l'optimisation de la performance.

Le cours est entièrement pratique et est ponctué de présentations des aspects théoriques.
14 hours
In this instructor-led training in Quebec, participants will learn the core components of the Hadoop ecosystem and how these technologies can be used to solve large-scale problems. By learning these foundations, participants will improve their ability to communicate with the developers and implementers of these systems as well as the data scientists and analysts that many IT projects involve.

Audience

- Project Managers wishing to implement Hadoop into their existing development or IT infrastructure
- Project Managers needing to communicate with cross-functional teams that include big data engineers, data scientists and business analysts
14 hours
Apache Samza est un framework de calcul asynchrone open source quasi-temps réel pour le traitement de flux. Il utilise Apache Kafka pour la messagerie et Apache Hadoop YARN pour la tolérance aux pannes, l'isolation du processeur, la sécurité et la gestion des ressources.

Cette formation en direct, animée par un instructeur, présente les principes sous-jacents aux systèmes de messagerie et au traitement de flux distribué, tout en guidant les participants dans la création d'un exemple de projet et d'exécution de travaux basé sur Samza.

À la fin de cette formation, les participants seront en mesure de:

- Utilisez Samza pour simplifier le code nécessaire à la production et à la consommation de messages.
- Découpler le traitement des messages d'une application.
- Utilisez Samza pour implémenter un calcul asynchrone en temps quasi réel.
- Utilisez le traitement de flux pour fournir un niveau d'abstraction plus élevé sur les systèmes de messagerie.

Public

- Développeurs

Format du cours

- Partie de conférence, partie de discussion, exercices et exercices intensifs
7 hours
Alluxio est un système de stockage distribué virtuel à source ouverte qui unifie des systèmes de stockage différents et permet aux applications d’interagir avec les données à vitesse de mémoire. Il est utilisé par des entreprises telles que Intel, Baidu et Alibaba.

Dans cette formation guidée par l'instructeur, les participants apprendront comment utiliser Alluxio pour broyer différents cadres de calcul avec les systèmes de stockage et gérer efficacement les données d'échelle multi-pétabytes au fur et à mesure qu'ils traversent la création d'une application avec Alluxio.

À la fin de cette formation, les participants seront en mesure de :

Développer une application avec Alluxio Connectez les systèmes de données et les applications tout en conservant un seul espace de nom Extrait efficace de la valeur des grandes données dans n'importe quel format de stockage Améliorer la performance du travail Déployer et gérer Alluxio indépendamment ou cluster

Audience

scientifique des données Développeur Système administrateur

Format du cours

Lecture partielle, discussion partielle, exercices et pratiques lourdes
14 hours
Tigon est un framework de traitement de flux opensource, temps réel, lowlatency, highthroughput, native natif, qui se trouve au-dessus de HDFS et de HBase pour la persistance Les applications Tigon traitent des cas d'utilisation tels que la détection et l'analyse des intrusions sur le réseau, l'analyse des marchés des médias sociaux, l'analyse de l'emplacement et les recommandations en temps réel aux utilisateurs Cette formation en ligne, introduite par un instructeur, présente l'approche de Tigon qui consiste à mélanger le traitement en temps réel et le traitement par lots tout en guidant les participants à travers la création d'un exemple d'application À la fin de cette formation, les participants seront en mesure de: Créez de puissantes applications de traitement de flux pour gérer de gros volumes de données Traiter des sources de flux telles que Twitter et Webserver Logs Utilisez Tigon pour joindre, filtrer et agréger rapidement des flux Public Développeurs Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
21 hours
Apache NiFi (Hortonworks DataFlow) est une plate-forme simple de logistique des données et de traitement des événements intégrée permettant le déplacement, le suivi et l'automatisation des données entre systèmes. Il est écrit en utilisant la programmation basée sur les flux et fournit une interface utilisateur basée sur le Web pour gérer les flux de données en temps réel.

Au cours de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à déployer et à gérer Apache NiFi dans un environnement de laboratoire réel.

À la fin de cette formation, les participants seront en mesure de:

- Installez et configurez Apachi NiFi.
- Créez, transformez et gérez des données à partir de sources de données disparates et distribuées, y compris des bases de données et des grands lacs de données.
- Automatiser les flux de données.
- Activer l'analyse en streaming.
- Appliquez diverses approches pour l’ingestion de données.
- Transformez le Big Data en un aperçu des affaires.

Format du cours

- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.

Options de personnalisation du cours

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
7 hours
Apache NiFi (Hortonworks DataFlow) est une plate-forme simple de logistique des données et de traitement des événements intégrée permettant le déplacement, le suivi et l'automatisation des données entre systèmes. Il est écrit en utilisant la programmation basée sur les flux et fournit une interface utilisateur basée sur le Web pour gérer les flux de données en temps réel.

Lors de cette formation en direct animée par un instructeur, les participants apprendront les bases de la programmation basée sur les flux tout en développant un certain nombre d'extensions, de composants et de processeurs de démonstration utilisant Apache NiFi .

À la fin de cette formation, les participants seront en mesure de:

- Comprendre l'architecture et les concepts de flux de données de NiFi.
- Développez des extensions à l'aide d'API NiFi et tierces.
- Personnaliser développer leur propre processeur Apache Nifi.
- Acquérir et traiter des données en temps réel à partir de formats de fichiers et de sources de données disparates et peu communes.

Format du cours

- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.

Options de personnalisation du cours

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
28 hours
Hadoop est un cadre de traitement populaire Big Data Python est un langage de programmation de haut niveau célèbre pour sa syntaxe claire et sa lecture de code.

Dans cette formation guidée par l'instructeur, les participants apprendront comment travailler avec Hadoop, MapReduce, Pig, et Spark en utilisant Python alors qu'ils passent par plusieurs exemples et utilisent des cas.

À la fin de cette formation, les participants seront en mesure de :

Comprendre les concepts de base derrière Hadoop, MapReduce, Pig, et Spark Utiliser Python avec Hadoop Système de fichiers distribués (HDFS), MapReduce, Pig et Spark Utilisez Snakebite pour accéder programmatiquement à HDFS dans Python Utilisez mrjob pour écrire MapReduce emplois dans Python Écrire des programmes Spark avec Python Élargissez la fonctionnalité du porc en utilisant Python UDFs Gérer MapReduce des emplois et des scripts de porc en utilisant Luigi

Audience

Développeurs Les professionnels

Format du cours

Lecture partielle, discussion partielle, exercices et pratiques lourdes
14 hours
Sqoop est un outil logiciel open source permettant de transférer des données entre Hadoop et des bases de données relationnelles ou des mainframes. Il peut être utilisé pour importer des données à partir d'un système de gestion de base de données relationnelle (SGBDR) tel que My SQL ou Oracle ou d'un ordinateur central dans le système de fichiers distribués Hadoop (HDFS). Ensuite, les données peuvent être transformées dans Hadoop MapReduce, puis réexportées dans un SGBDR.

Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Sqoop pour importer des données d'une base de données relationnelle traditionnelle vers un stockage Hadoop tel que HDFS ou Hive et inversement.

À la fin de cette formation, les participants seront en mesure de:

- Installer et configurer Sqoop
- Importer des données de My SQL vers HDFS et Hive
- Importer des données depuis HDFS et Hive vers My SQL

Public

- Administrateurs système
- Ingénieurs de données

Format du cours

- Partie de conférence, partie de discussion, exercices et exercices intensifs

Remarque

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
21 hours
L'analyse de données volumineuses implique l'examen de grandes quantités d'ensembles de données variés afin de découvrir des corrélations, des modèles cachés et d'autres informations utiles.

L'industrie de la santé dispose de quantités massives de données médicales et cliniques hétérogènes complexes. L'application de l'analyse de données volumineuses sur les données de santé présente un potentiel énorme pour la compréhension de l'amélioration de la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis pour les analyses et les applications pratiques dans un environnement clinique.

Au cours de cette formation en direct animée par un instructeur (à distance), les participants apprendront à effectuer des analyses de données volumineuses dans le domaine de la santé tout en effectuant une série d'exercices pratiques en laboratoire.

À la fin de cette formation, les participants seront en mesure de:

- Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
- Comprendre les caractéristiques des données médicales
- Appliquer des techniques Big Data pour traiter des données médicales
- Etudiez les systèmes de données volumineuses et les algorithmes dans le contexte d'applications de santé

Public

- Développeurs
- Data Scientists

Format du cours

- Partie lecture, partie discussion, exercices et exercices intensifs.

Remarque

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
35 hours
Apache Hadoop est un cadre de traitement de données populaire pour le traitement de grands ensembles de données sur de nombreux ordinateurs.

Cette formation guidée par les instructeurs, en direct (online ou sur site) est destinée aux administrateurs de systèmes qui souhaitent apprendre à configurer, déployer et gérer Hadoop des clusters dans leur organisation.

À la fin de cette formation, les participants seront en mesure de :

Installer et configurer Apache Hadoop. Comprendre les quatre principaux composants de l'écosystème Hadoop : HDFS, MapReduce, YARN et Hadoop Common. Utilisez Hadoop Système de fichiers distribué (HDFS) pour échanger un cluster à des centaines ou des milliers de nœuds.   ; Configurez HDFS pour fonctionner en tant que moteur de stockage pour les déploiements Spark en prévision. Configurez Spark pour accéder à des solutions de stockage alternatives telles que les systèmes de base de données Amazon S3 et NoSQL telles que Redis, Elasticsearch, Couchbase, Aerospike, etc. Exécuter des tâches administratives telles que la fourniture, la gestion, le suivi et la sécurité d'un cluster Apache.

Le format du cours

Lecture et discussion interactives. Beaucoup d’exercices et de pratiques. La mise en œuvre dans un environnement de laboratoire en direct.

Options de personnalisation de cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
21 hours
Cloudera Impala est un moteur de recherche de traitement massivement parallèle open source (MPP) SQL pour les clusters Apache Hadoop.

Impala permet aux utilisateurs d’émettre des requêtes à faible latence SQL à des données stockées dans Hadoop Système de fichiers distribués et Apache Hbase sans nécessiter le mouvement ou la transformation des données.

Audience

Ce cours vise les analystes et les scientifiques de données qui effectuent des analyses sur les données stockées dans Hadoop viaBusiness Intelligence ou SQL outils.

Après cette formation, les délégués seront en mesure de

Écrivez des informations significatives de Hadoop clusters avec Impala. Écrivez des programmes spécifiques pour faciliter Business Intelligence dans Impala SQL Dialect. Le trouble Impala
21 hours
Apache Ambari est une plate-forme de gestion open source pour le provisionnement, la gestion, la surveillance et la sécurisation des clusters Apache Hadoop .

Dans cette formation en direct animée par un instructeur, les participants apprendront les outils et pratiques de gestion fournis par Ambari pour gérer avec succès les clusters Hadoop .

À la fin de cette formation, les participants seront en mesure de:

- Configurer un cluster Big Data en direct avec Ambari
- Appliquer les fonctionnalités avancées d'Ambari à divers cas d'utilisation
- Ajoutez et supprimez des nœuds de manière transparente, au besoin
- Améliorez les performances d'un cluster Hadoop le biais de réglages et d'ajustements

Public

- DevOps
- Administrateurs système
- DBA
- Professionnels de test Hadoop

Format du cours

- Partie de conférence, partie de discussion, exercices et exercices intensifs
21 hours
Hortonworks Data Platform (HDP) est une plateforme de support Apache Hadoop source ouverte qui fournit une base stable pour le développement de solutions Big Data sur l’écosystème Apache Hadoop .

Cette formation en direct animée par un instructeur (sur site ou à distance) présente Hortonworks Data Platform (HDP) et guide les participants dans le déploiement de la solution Spark + Hadoop .

À la fin de cette formation, les participants seront en mesure de:

- Utilisez Hortonworks pour exécuter Hadoop de manière fiable à grande échelle.
- Unifiez les capacités de sécurité, de gouvernance et d'exploitation de Hadoop avec les workflows d'analyse agiles de Spark.
- Utilisez Hortonworks pour étudier, valider, certifier et soutenir chacun des composants d’un projet Spark.
- Traitez différents types de données, y compris les données structurées, non structurées, en mouvement et au repos.

Format du cours

- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.

Options de personnalisation du cours

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.

Last Updated:

Weekend Apache Hadoop cours, Soir Hadoop formation, Hadoop stage d’entraînement, Apache Hadoop formateur à distance, Apache Hadoop formateur en ligne, Apache Hadoop formateur Online, Apache Hadoop cours en ligne, Apache Hadoop cours à distance, Hadoop professeur à distance, Apache Hadoop visioconférence, Apache Hadoop stage d’entraînement intensif, Apache Hadoop formation accélérée, Apache Hadoop formation intensive, Formation inter Hadoop, Formation intra Apache Hadoop, Formation intra Enteprise Apache Hadoop, Formation inter Entreprise Apache Hadoop, Weekend Hadoop formation, Soir Hadoop cours, Apache Hadoop coaching, Apache Hadoop entraînement, Apache Hadoop préparation, Apache Hadoop instructeur, Apache Hadoop professeur, Hadoop formateur, Apache Hadoop stage de formation, Apache Hadoop cours, Apache Hadoop sur place, Hadoop formations privées, Hadoop formation privée, Hadoop cours particulier, Hadoop cours particuliers

Réduction spéciale

No course discounts for now.

Newsletter offres spéciales

Nous respectons le caractère privé de votre adresse mail. Nous ne divulguerons ni ne vendrons votre adresse email à quiconque
Vous pouvez toujours modifier vos préférences ou vous désinscrire complètement.

This site in other countries/regions