
Apache Hadoop est un framework libre et open source inspiré de deux noyeaux de la gestion BigData de Google: GFS (Google File System) and MapReduce. C'est un framework complet destiné à stocker et traiter de grosses quantités de données. Hadoop est utilisé par la plupart des fournisseurs de service dont Yahoo, Facebook ou LinkedIn.
Nos Clients témoignent
Le fait que toutes les données et tous les logiciels étaient prêts à être utilisés sur une VM déjà préparée, fournie par le formateur sur des disques externes.
vyzVoice
Formation: Hadoop for Developers and Administrators
Machine Translated
J'ai surtout aimé le formateur en donnant des exemples réels.
Simon Hahn
Formation: Administrator Training for Apache Hadoop
Machine Translated
J'ai vraiment apprécié les grandes compétences du formateur.
Grzegorz Gorski
Formation: Administrator Training for Apache Hadoop
Machine Translated
J'ai vraiment apprécié les nombreuses sessions pratiques.
Jacek Pieczątka
Formation: Administrator Training for Apache Hadoop
Machine Translated
J'ai beaucoup aimé la façon interactive d'apprendre.
Luigi Loiacono
Formation: Data Analysis with Hive/HiveQL
Machine Translated
C'était une formation très pratique, j'ai aimé les exercices pratiques.
Proximus
Formation: Data Analysis with Hive/HiveQL
Machine Translated
J'ai bénéficié de la bonne vue d'ensemble, du bon équilibre entre la théorie et les exercices.
Proximus
Formation: Data Analysis with Hive/HiveQL
Machine Translated
J'ai apprécié l'interaction dynamique et la pratique du sujet, grâce à la machine virtuelle, très stimulante!
Philippe Job
Formation: Data Analysis with Hive/HiveQL
Machine Translated
J'ai bénéficié de la compétence et des connaissances du formateur.
Jonathan Puvilland
Formation: Data Analysis with Hive/HiveQL
Machine Translated
C'était très pratique, nous avons passé la moitié du temps à faire des choses dans Clouded / Hardtop, à exécuter différentes commandes, à vérifier le système, etc. Les matériaux supplémentaires (livres, sites Web, etc.) ont été très appréciés, nous devrons continuer à apprendre. Les installations étaient très amusantes et très pratiques, la configuration du cluster à partir de zéro était vraiment bonne.
Ericsson
Formation: Administrator Training for Apache Hadoop
Machine Translated
Le formateur était fantastique et connaissait vraiment ses affaires. J'ai beaucoup appris sur le logiciel que je ne connaissais pas auparavant, ce qui aidera beaucoup dans mon travail!
Steve McPhail - Alberta Health Services - Information Technology
Formation: Data Analysis with Hive/HiveQL
Machine Translated
Les principes de haut niveau concernant Hive, HDFS ...
Geert Suys - Proximus Group
Formation: Data Analysis with Hive/HiveQL
Machine Translated
Le handson. Le mix pratique / theroy
Proximus Group
Formation: Data Analysis with Hive/HiveQL
Machine Translated
Fulvio a été en mesure de comprendre le business de notre entreprise et a pu établir une corrélation avec le matériel de cours presque instantanément.
Samuel Peeters - Proximus Group
Formation: Data Analysis with Hive/HiveQL
Machine Translated
Beaucoup d'exercices pratiques.
Ericsson
Formation: Administrator Training for Apache Hadoop
Machine Translated
Outil de gestion Ambari. Capacité à discuter des expériences pratiques Hadoop partir d'une analyse de rentabilité autre que celle des télécommunications.
Ericsson
Formation: Administrator Training for Apache Hadoop
Machine Translated
J'ai pensé qu'il a fait un excellent travail d'adapter l'expérience à l'auditoire. Cette classe est principalement conçue pour couvrir l'analyse des données avec HIVE, mais moi et mon collègue faisons l'administration HIVE sans responsabilités réelles d'analyse de données.
ian reif - Franchise Tax Board
Formation: Data Analysis with Hive/HiveQL
Machine Translated
La VM que j'aimais beaucoup L'enseignant était très bien informé sur le sujet ainsi que d'autres sujets, il était très gentil et sympathique J'ai aimé l'installation à Dubaï.
Safar Alqahtani - Elm Information Security
Formation: Big Data Analytics in Health
Machine Translated
Thèmes de formation et engagement du formateur
Izba Administracji Skarbowej w Lublinie
Formation: Apache NiFi for Administrators
Machine Translated
Communication avec les personnes participant à la formation.
Andrzej Szewczuk - Izba Administracji Skarbowej w Lublinie
Formation: Apache NiFi for Administrators
Machine Translated
choses pratiques de faire, aussi la théorie a été bien servi par Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Formation: Hadoop Administration on MapR
Machine Translated
Des exercices
Capgemini Polska Sp. z o.o.
Formation: Hadoop Administration on MapR
Machine Translated
utilité des exercices
Algomine sp.z.o.o sp.k.
Formation: Apache NiFi for Administrators
Machine Translated
J'ai trouvé la formation bonne, très informative ... mais aurait pu être répartie sur 4 ou 5 jours, nous permettant d'entrer dans plus de détails sur différents aspects.
Veterans Affairs Canada
Formation: Hadoop Administration
Machine Translated
J'ai vraiment apprécié l'entraînement. Anton a beaucoup de connaissances et a présenté la théorie nécessaire de manière très accessible. C’est formidable que la formation comprenne de nombreux exercices intéressants. Nous avons donc été en contact avec la technologie que nous connaissons depuis le tout début.
Szymon Dybczak - Algomine sp.z.o.o sp.k.
Formation: Apache NiFi for Administrators
Machine Translated
J'ai trouvé que ce cours donnait un bon aperçu et touchait rapidement certains domaines que je n'avais même pas envisagés.
Veterans Affairs Canada
Formation: Hadoop Administration
Machine Translated
J'ai vraiment aimé les exercices avec cluster pour voir les performances des nœuds à travers le cluster et les fonctionnalités étendues.
CACI Ltd
Formation: Apache NiFi for Developers
Machine Translated
Ajay était un consultant très expérimenté et a été en mesure de répondre à toutes nos questions et même de faire des suggestions sur les meilleures pratiques pour le projet sur lequel nous sommes actuellement engagés.
CACI Ltd
Formation: Apache NiFi for Administrators
Machine Translated
Partie pratique. Les tâches ont été bien choisies pour les questions discutées.
Rossmann SDP
Formation: HBase for Developers
Machine Translated
Nos clients









.png)




























_ireland.gif)




.jpg)






Sous-catégories Hadoop
Plans de cours Hadoop
Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Alluxio pour relier différents cadres de calcul à des systèmes de stockage et à gérer efficacement les données à l'échelle de plusieurs pétaoctets lors de la création d'une application avec Alluxio .
À la fin de cette formation, les participants seront en mesure de:
- Développer une application avec Alluxio
- Connectez des systèmes Big Data et des applications tout en préservant un seul espace de noms
- Extraire efficacement la valeur des mégadonnées dans n'importe quel format de stockage
- Améliorer les performances de la charge de travail
- Déployer et gérer Alluxio autonome ou en cluster
Public
- Data Scientist
- Développeur
- Administrateur du système
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Ce cours a pour but de démystifier la technologie Big Data / Hadoop et de montrer qu’elle n’est pas difficile à comprendre.
Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Sqoop pour importer des données d'une base de données relationnelle traditionnelle vers un stockage Hadoop tel que HDFS ou Hive et inversement.
À la fin de cette formation, les participants seront en mesure de:
- Installer et configurer Sqoop
- Importer des données de My SQL vers HDFS et Hive
- Importer des données depuis HDFS et Hive vers My SQL
Public
- Administrateurs système
- Ingénieurs de données
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Remarque
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Cette formation en direct, animée par un instructeur, présente les principes sous-jacents aux systèmes de messagerie et au traitement de flux distribué, tout en guidant les participants dans la création d'un exemple de projet et d'exécution de travaux basé sur Samza.
À la fin de cette formation, les participants seront en mesure de:
- Utilisez Samza pour simplifier le code nécessaire à la production et à la consommation de messages.
- Découpler le traitement des messages d'une application.
- Utilisez Samza pour implémenter un calcul asynchrone en temps quasi réel.
- Utilisez le traitement de flux pour fournir un niveau d'abstraction plus élevé sur les systèmes de messagerie.
Public
- Développeurs
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Lors de cette formation en direct animée par un instructeur, les participants apprendront les bases de la programmation basée sur les flux tout en développant un certain nombre d'extensions, de composants et de processeurs de démonstration utilisant Apache NiFi .
À la fin de cette formation, les participants seront en mesure de:
- Comprendre l'architecture et les concepts de flux de données de NiFi.
- Développez des extensions à l'aide d'API NiFi et tierces.
- Personnaliser développer leur propre processeur Apache Nifi.
- Acquérir et traiter des données en temps réel à partir de formats de fichiers et de sources de données disparates et peu communes.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Au cours de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à déployer et à gérer Apache NiFi dans un environnement de laboratoire réel.
À la fin de cette formation, les participants seront en mesure de:
- Installez et configurez Apachi NiFi.
- Créez, transformez et gérez des données à partir de sources de données disparates et distribuées, y compris des bases de données et des grands lacs de données.
- Automatiser les flux de données.
- Activer l'analyse en streaming.
- Appliquez diverses approches pour l’ingestion de données.
- Transformez le Big Data en un aperçu des affaires.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
- développeurs
format du cours
- conférences, pratique pratiques, petits tests le long du chemin pour évaluer la compréhension
Impala permet aux utilisateurs d'émettre des requêtes SQL faible temps de latence pour les données stockées dans Hadoop Distributed File System et Apache Hbase sans nécessiter de déplacement ou de transformation de données.
Public
Ce cours est destiné aux analystes et aux scientifiques qui effectuent des analyses sur les données stockées dans Hadoop via SQL outils de Business Intelligence ou SQL .
Après ce cours, les délégués seront en mesure de
- Extrayez des informations utiles à partir de clusters Hadoop avec Impala .
- Ecrivez des programmes spécifiques pour faciliter la Business Intelligence dans Impala SQL Dialect.
- Dépanner Impala .
Cette formation en direct animée par un instructeur (sur site ou à distance) présente Hortonworks Data Platform (HDP) et guide les participants dans le déploiement de la solution Spark + Hadoop .
À la fin de cette formation, les participants seront en mesure de:
- Utilisez Hortonworks pour exécuter Hadoop de manière fiable à grande échelle.
- Unifiez les capacités de sécurité, de gouvernance et d'exploitation de Hadoop avec les workflows d'analyse agiles de Spark.
- Utilisez Hortonworks pour étudier, valider, certifier et soutenir chacun des composants d’un projet Spark.
- Traitez différents types de données, y compris les données structurées, non structurées, en mouvement et au repos.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Nous guiderons un développeur à travers l'architecture HBase, la modélisation de données et le développement d'applications sur HBase. Il discutera également de l’utilisation de MapReduce avec HBase et de quelques sujets d’administration liés à l’optimisation des performances. Le cours est très pratique avec de nombreux exercices de laboratoire.
Durée : 3 jours
Audience : Développeurs et Administrateurs
In this instructor-led, live training, participants will learn how to work with Hadoop, MapReduce, Pig, and Spark using Python as they step through multiple examples and use cases.
By the end of this training, participants will be able to:
- Understand the basic concepts behind Hadoop, MapReduce, Pig, and Spark
- Use Python with Hadoop Distributed File System (HDFS), MapReduce, Pig, and Spark
- Use Snakebite to programmatically access HDFS within Python
- Use mrjob to write MapReduce jobs in Python
- Write Spark programs with Python
- Extend the functionality of pig using Python UDFs
- Manage MapReduce jobs and Pig scripts using Luigi
Audience
- Developers
- IT Professionals
Format of the course
- Part lecture, part discussion, exercises and heavy hands-on practice
Ce cours présente aux chefs de projet le framework de traitement de Big Data les plus populaires: Hadoop .
Au cours de cette formation dispensée par un instructeur, les participants apprendront les composants essentiels de l'écosystème Hadoop et comment utiliser ces technologies pour résoudre des problèmes à grande échelle. En apprenant ces bases, les participants amélioreront également leur capacité à communiquer avec les développeurs et les développeurs de ces systèmes, ainsi qu'avec les scientifiques et les analystes de données impliqués dans de nombreux projets informatiques.
Public
- Chefs de projet souhaitant implémenter Hadoop dans leur infrastructure de développement ou informatique existante
- Les gestionnaires de projet doivent communiquer avec des équipes interfonctionnelles comprenant des ingénieurs Big Data, des scientifiques de données et des analystes métier.
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Dans cette formation en direct animée par un instructeur, les participants apprendront les outils et pratiques de gestion fournis par Ambari pour gérer avec succès les clusters Hadoop .
À la fin de cette formation, les participants seront en mesure de:
- Configurer un cluster Big Data en direct avec Ambari
- Appliquer les fonctionnalités avancées d'Ambari à divers cas d'utilisation
- Ajoutez et supprimez des nœuds de manière transparente, au besoin
- Améliorez les performances d'un cluster Hadoop le biais de réglages et d'ajustements
Public
- DevOps
- Administrateurs système
- DBA
- Professionnels de test Hadoop
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Public : développeurs
Durée: trois jours
Format: cours magistraux (50%) et travaux pratiques (50%).
“… Les matériaux étaient très bien préparés et couverts à fond. Le laboratoire était très serviable et bien organisé ”
- Andrew Nguyen, ingénieur principal en intégration, Microsoft Online Advertising
Public
Administrateurs Hadoop
Format
Cours magistraux et ateliers pratiques, bilan approximatif: 60% cours magistraux, 40% laboratoires.
Objectif du cours:
Hadoop administration du cluster Hadoop
L'industrie de la santé dispose de quantités massives de données médicales et cliniques hétérogènes complexes. L'application de l'analyse de données volumineuses sur les données de santé présente un potentiel énorme pour la compréhension de l'amélioration de la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis pour les analyses et les applications pratiques dans un environnement clinique.
Au cours de cette formation en direct animée par un instructeur (à distance), les participants apprendront à effectuer des analyses de données volumineuses dans le domaine de la santé tout en effectuant une série d'exercices pratiques en laboratoire.
À la fin de cette formation, les participants seront en mesure de:
- Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
- Comprendre les caractéristiques des données médicales
- Appliquer des techniques Big Data pour traiter des données médicales
- Etudiez les systèmes de données volumineuses et les algorithmes dans le contexte d'applications de santé
Public
- Développeurs
- Data Scientists
Format du cours
- Partie lecture, partie discussion, exercices et exercices intensifs.
Remarque
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Le cours est axé sur la manipulation et la transformation des données.
Parmi les outils de l'écosystème Hadoop , ce cours comprend l'utilisation de Pig et Hive deux outils très utilisés pour la transformation et la manipulation de données.
Cette formation aborde également les métriques de performance et l'optimisation de la performance.
Le cours est entièrement pratique et est ponctué de présentations des aspects théoriques.
Le cours est destiné aux informaticiens à la recherche d'une solution pour stocker et traiter de grands ensembles de données dans un environnement système distribué.
Go al:
Connaissance approfondie de l'administration de cluster Hadoop .