Project Description
Este curso foi concebido como um ponto de entrada para desenvolvedores que precisam criar aplicativos para analisar grandes dados armazenados no Apache Hadoop usando o Spark. Os tópicos incluem: Uma visão geral da Hortonworks Data Platform (HDP), incluindo HDFS e YARN; usando as API Spark Core para exploração de dados interativa; Spark SQL e operações do DataFrame; Spark Streaming e DStreamoperations; visualização de dados, relatórios e colaboração; monitoramento e afinação de desempenho; construção e implantação de aplicativos Spark; e uma introdução à Spark Machine Learning Library.
Público-Alvo
Somente treinamentos para empresas (In-Company). Engenheiros de software que procuram desenvolver aplicativos em memória para aplicações sensíveis ao tempo e altamente iterativas em um ambiente Enterprise HDP.
Requisitos
Somente treinamentos para empresas (In-Company). Estar familiarizado com os princípios de programação e ter experiência prévia no desenvolvimento de software utilizando Python ou Scala. A experiência com transmissão de dados, SQL.
Conteúdo Programático
Este é o conteúdo que será abordado durante o curso. [inglês]
1. AN INTRODUCTION TO ZEPPELIN AND RDDS
OBJECTIVES
-
HDP Overview for Developers
-
Overview ofApacheZeppelin and Spark
-
Working with RDDs
-
Pair RDDs
LABS
-
Using HDFS Commands
-
Introduction to Spark REPLs and Zeppelin
-
Create and Manipulate RDDs
-
Create and Manipulate Pair RDDs
2. SPARK STREAMING
OBJECTIVES
-
Spark Streaming
-
Spark SQL
LABS
-
Basic Spark Streaming
-
Basic Spark Streaming Transformations
-
Spark Streaming Windows Transformations
-
Create and Save DataFrames
-
Working with Tables and DataFrames
3. WORKING WITH DATA VISUALIZATION
OBJECTIVES
-
Data Visualization with Zeppelin
-
Job Monitoring
LABS
- Data visualization Reporting and Collaboration Using Zepplein
- Job Monitoring
4. AN INTRODUCTION TO MACHINE LEARNING WITH SPARK
OBJECTIVES
-
Performance Tuning
-
Building and Submitting Spark Applications
-
Introduction to Machine Learning with Spark
LABS
-
Performance Tuning
-
Build and Submit Applications to YARN
-
Machine Learning Walkthrough