sparksql
7 heures (généralement 1 jours pauses comprises)
Audience
Spark SQL est le module Apache Spark permettant de travailler avec des données structurées et non structurées. Spark SQL fournit des informations sur la structure des données ainsi que sur les calculs en cours. Ces informations peuvent être utilisées pour effectuer des optimisations. Les deux utilisations courantes de Spark SQL sont SQL suivantes:
- pour exécuter SQL requêtes SQL .
- lire les données d'une installation Hive existante.
Lors de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à analyser divers types de jeux de données à l'aide de Spark SQL .
À la fin de cette formation, les participants seront en mesure de:
Format du cours
Options de personnalisation du cours
Machine Translated
Introduction
Overview of Data Access Approaches (Hive, databases, etc.)
Overview of Spark Features and Architecture
Installing and Configuring Spark
Understanding Dataframes in Spark
Defining Tables and Importing Datasets
Querying Data Frames using SQL
Carrying out Aggregations, JOINs and Nested Queries
Uploading and Accessing Data
Querying Different Types of Data
Querying Data Lakes with SQL
Troubleshooting
Summary and Conclusion









.png)




























_ireland.gif)




.jpg)




