
Formation Apache Spark - un moteur de traitement Big Data
Nos Clients témoignent
Richard est très calme et méthodique, avec un aperçu analytique - exactement les qualités nécessaires pour présenter ce type de cours.
Kieran Mac Kenna
Formation: Spark for Developers
Machine Translated
partager le diagramme de concept et aussi l'échantillon pour les mains sales
Mark Yang - FMR
Formation: Spark for Developers
Machine Translated
Scénarios et cas applicables
zhaopeng liu - Fmr
Formation: Spark for Developers
Machine Translated
Analyse de cas
国栋 张
Formation: Spark for Developers
Machine Translated
toutes les parties de cette session
Eric Han - Fmr
Formation: Spark for Developers
Machine Translated
Nous en savons beaucoup plus sur l’ensemble de l’environnement.
John Kidd
Formation: Spark for Developers
Machine Translated
Le formateur a rendu le cours intéressant et divertissant, ce qui aide un peu tout au long de la journée.
Ryan Speelman
Formation: Spark for Developers
Machine Translated
Je pense que le formateur avait un excellent style en combinant l'humour et des histoires réelles pour rendre les sujets abordables. Je recommande vivement ce professeur à l'avenir.
Formation: Spark for Developers
Machine Translated
Ernesto a fait un excellent travail en expliquant les concepts de haut niveau de l'utilisation de Spark et de ses différents modules.
Michael Nemerouf
Formation: Spark for Developers
Machine Translated
Il s’agit de l’un des meilleurs exercices pratiques de programmation que je connaisse.
Laura Kahn
Formation: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
C’est l’une des meilleures formations en ligne de qualité que j’ai jamais eues au cours de ma carrière de 13 ans. Continuez ce bon travail!.
Formation: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Richard était très disposé à faire une digression quand nous voulions poser des questions semi-liées sur des choses qui ne figuraient pas dans le programme. Les explications étaient claires et il était au premier plan des mises en garde dans tous les conseils qu'il nous donnait.
ARM Limited
Formation: Spark for Developers
Machine Translated
La VM que j'aimais beaucoup L'enseignant était très bien informé sur le sujet ainsi que d'autres sujets, il était très gentil et sympathique J'ai aimé l'installation à Dubaï.
Safar Alqahtani - Elm Information Security
Formation: Big Data Analytics in Health
Machine Translated
tâches de pratique
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Formation: Python and Spark for Big Data (PySpark)
Machine Translated
Ajay était très sympathique, serviable et connaissait bien le sujet dont il discutait.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Formation: Spark for Developers
Machine Translated
Les exercices de laboratoire. Appliquer la théorie à partir du premier jour des jours suivants.
Dell
Formation: A Practical Introduction to Stream Processing
Machine Translated
L'enseignant a adapté le programme de formation à nos besoins actuels.
EduBroker Sp. z o.o.
Formation: Python and Spark for Big Data (PySpark)
Machine Translated
Faire des exercices similaires de différentes manières aide vraiment à comprendre ce que chaque composant ( Hadoop / Spark, autonome / cluster) peut faire seul et ensemble. Cela m'a donné des idées sur la façon de tester mon application sur ma machine locale lorsque je développe vs lorsqu'elle est déployée sur un cluster.
Thomas Carcaud - IT Frankfurt GmbH
Formation: Spark for Developers
Machine Translated
l’attention individuelle.
ARCHANA ANILKUMAR - PPL
Formation: Python and Spark for Big Data (PySpark)
Machine Translated
C’était génial d’avoir une compréhension de ce qui se passe sous le capot de Spark. Savoir ce qui se passe sous le capot aide à mieux comprendre pourquoi votre code est ou ne fait pas ce que vous attendez qu’il fasse. Une grande partie de la formation a été mains sur ce qui est toujours génial et la section sur les optimisations a été exceptionnellement pertinent pour mon travail actuel qui était agréable.
Intelligent Medical Objects
Formation: Apache Spark in the Cloud
Machine Translated
Je pense que le formateur avait un excellent style en combinant l'humour et des histoires réelles pour rendre les sujets abordables. Je recommande vivement ce professeur à l'avenir.
Formation: Spark for Developers
Machine Translated
C’est l’une des meilleures formations en ligne de qualité que j’ai jamais eues au cours de ma carrière de 13 ans. Continuez ce bon travail!.
Formation: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Nos clients









.png)




























_ireland.gif)




.jpg)






Sous-catégories Apache Spark
Plans de cours Apache Spark
Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Alluxio pour relier différents cadres de calcul à des systèmes de stockage et à gérer efficacement les données à l'échelle de plusieurs pétaoctets lors de la création d'une application avec Alluxio .
À la fin de cette formation, les participants seront en mesure de:
- Développer une application avec Alluxio
- Connectez des systèmes Big Data et des applications tout en préservant un seul espace de noms
- Extraire efficacement la valeur des mégadonnées dans n'importe quel format de stockage
- Améliorer les performances de la charge de travail
- Déployer et gérer Alluxio autonome ou en cluster
Public
- Data Scientist
- Développeur
- Administrateur du système
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
L'industrie de la santé dispose de quantités massives de données médicales et cliniques hétérogènes complexes. L'application de l'analyse de données volumineuses sur les données de santé présente un potentiel énorme pour la compréhension de l'amélioration de la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis pour les analyses et les applications pratiques dans un environnement clinique.
Au cours de cette formation en direct animée par un instructeur (à distance), les participants apprendront à effectuer des analyses de données volumineuses dans le domaine de la santé tout en effectuant une série d'exercices pratiques en laboratoire.
À la fin de cette formation, les participants seront en mesure de:
- Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
- Comprendre les caractéristiques des données médicales
- Appliquer des techniques Big Data pour traiter des données médicales
- Etudiez les systèmes de données volumineuses et les algorithmes dans le contexte d'applications de santé
Public
- Développeurs
- Data Scientists
Format du cours
- Partie lecture, partie discussion, exercices et exercices intensifs.
Remarque
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Dans cette formation en direct animée par un instructeur, les participants découvriront les offres technologiques et les approches de mise en œuvre pour le traitement des données graphiques. Le but est d'identifier les objets du monde réel, leurs caractéristiques et leurs relations, puis de modéliser ces relations et de les traiter sous forme de données à l'aide d'une approche Graph Computing (également appelée Graph Analytics). Nous commençons par un aperçu général et nous concentrons sur des outils spécifiques lorsque nous abordons une série d’études de cas, d’exercices pratiques et de déploiements en direct.
À la fin de cette formation, les participants seront en mesure de:
- Comprendre comment les données de graphique sont persistées et parcourues.
- Sélectionnez le meilleur framework pour une tâche donnée (des bases de données graphiques aux frameworks de traitement par lots).
- Implémentez Hadoop , Spark, GraphX et Pregel pour effectuer des calculs graphiques sur plusieurs machines en parallèle.
- Affichez les problèmes de données volumineuses dans le monde réel en termes de graphiques, de processus et de parcours.
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Cette formation en direct animée par un instructeur (sur site ou à distance) présente Hortonworks Data Platform (HDP) et guide les participants dans le déploiement de la solution Spark + Hadoop .
À la fin de cette formation, les participants seront en mesure de:
- Utilisez Hortonworks pour exécuter Hadoop de manière fiable à grande échelle.
- Unifiez les capacités de sécurité, de gouvernance et d'exploitation de Hadoop avec les workflows d'analyse agiles de Spark.
- Utilisez Hortonworks pour étudier, valider, certifier et soutenir chacun des composants d’un projet Spark.
- Traitez différents types de données, y compris les données structurées, non structurées, en mouvement et au repos.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Au cours de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à configurer et à intégrer différents cadres de Stream Processing avec des systèmes de stockage de données volumineux existants ainsi que des applications logicielles et microservices connexes.
À la fin de cette formation, les participants seront en mesure de:
- Installez et configurez différents frameworks de Stream Processing , tels que Spark Streaming et Kafka Streaming.
- Comprendre et sélectionner le cadre le plus approprié pour le travail.
- Traitement des données en continu, simultanément et enregistrement par enregistrement.
- Intégrez les solutions de Stream Processing continu aux bases de données, aux entrepôts de données, aux lacs de données, etc. existants
- Intégrez la bibliothèque de traitement de flux la plus appropriée aux applications d'entreprise et aux microservices.
Public
- Les développeurs
- Architectes logiciels
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Remarques
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
This instructor-led, live training introduces the concepts and approaches for implementing geospacial analytics and walks participants through the creation of a predictive analysis application using Magellan on Spark.
By the end of this training, participants will be able to:
- Efficiently query, parse and join geospatial datasets at scale
- Implement geospatial data in business intelligence and predictive analytics applications
- Use spatial context to extend the capabilities of mobile devices, sensors, logs, and wearables
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
This instructor-led, live training (online or onsite) is aimed at developers who wish to carry out big data analysis using Apache Spark in their .NET applications.
By the end of this training, participants will be able to:
- Install and configure Apache Spark.
- Understand how .NET implements Spark APIs so that they can be accessed from a .NET application.
- Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes.
- Develop machine learning features for a .NET application using Apache Spark capabilities.
- Carry out exploratory analysis using SQL queries on big data sets.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
This instructor-led, live training (online or onsite) is aimed at data scientists who wish to use the SMACK stack to build data processing platforms for big data solutions.
By the end of this training, participants will be able to:
- Implement a data pipeline architecture for processing big data.
- Develop a cluster infrastructure with Apache Mesos and Docker.
- Analyze data with Spark and Scala.
- Manage unstructured data with Apache Cassandra.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
This instructor-led, live training (online or onsite) is aimed at engineers who wish to deploy Apache Spark system for processing very large amounts of data.
By the end of this training, participants will be able to:
- Install and configure Apache Spark.
- Understand the difference between Apache Spark and Hadoop MapReduce and when to use which.
- Quickly read in and analyze very large data sets.
- Integrate Apache Spark with other machine learning tools.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
PUBLIC:
Ingénieur de données, DevOps , Data Scientist
Ce cours présentera Apache Spark . Les étudiants apprendront comment Spark s'intègre dans l'écosystème du Big Data et comment utiliser Spark pour l'analyse de données. Le cours couvre le shell Spark pour l'analyse de données interactive, les composants internes de Spark, les API Spark, Spark SQL , le streaming Spark, ainsi que l'apprentissage automatique et graphX.
PUBLIC :
Développeurs / Analystes de données
Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Python et Spark ensemble pour analyser des données volumineuses au cours d’exercices pratiques.
À la fin de cette formation, les participants seront en mesure de:
- Apprenez à utiliser Spark avec Python pour analyser des Big Data .
- Travaillez sur des exercices qui imitent les circonstances réelles.
- Utilisez différents outils et techniques d'analyse de données PySpark aide de PySpark .
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Cette formation en direct, animée par un instructeur (sur site ou à distance), est destinée aux ingénieurs en logiciel qui souhaitent diffuser des données volumineuses avec Spark Streaming et Scala .
À la fin de cette formation, les participants seront en mesure de:
- Créez des applications Spark avec le langage de programmation Scala .
- Utilisez Spark Streaming pour traiter des flux de données continus.
- Traiter des flux de données en temps réel avec Spark Streaming.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
- pour exécuter SQL requêtes SQL .
- lire les données d'une installation Hive existante.
Lors de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à analyser divers types de jeux de données à l'aide de Spark SQL .
À la fin de cette formation, les participants seront en mesure de:
- Installez et configurez Spark SQL .
- Effectuer une analyse de données à l'aide de Spark SQL .
- Interrogez des ensembles de données dans différents formats.
- Visualisez les données et les résultats de la requête.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Il se divise en deux paquets:
-
spark.mllib contient l'API d'origine construite sur les RDD.
-
spark.ml fournit des API de niveau supérieur construites à partir de DataFrames pour la construction de pipelines ML.
Public
Ce cours s’adresse aux ingénieurs et aux développeurs qui souhaitent utiliser une bibliothèque de machines intégrée à Apache Spark