Project Description
Este curso oferece aos programadores Java um mergulho profundo no desenvolvimento de aplicativos Hadoop. Os alunos aprenderão como projetar e desenvolver aplicativos MapReduce eficientes e efetivos para o Hadoop usando a Hortonworks Data Platform, incluindo como implementar combinadores, particionadores, tipos secundários, formatos personalizados de entrada e saída, juntar conjuntos de dados grandes, testar unidades e desenvolver UDFs para Pig e Hive.
Os laboratórios são executados em um cluster HDD 2.1 de 7 nós que está sendo executado em uma máquina virtual que os alunos podem manter para uso após o treinamento.
Público-Alvo
Somente treinamentos para empresas (In-Company). Experientes engenheiros de software Java que precisam desenvolver aplicativos Java MapReduce para o Hadoop.
Requisitos
Somente treinamentos para empresas (In-Company). Experiência em desenvolver aplicativos Java e usar um Java IDE. Os laboratórios são completados usando o Eclipse IDE e o Gradle. Não é necessário conhecimento prévio de Hadoop.
Conteúdo Programático
Este é o conteúdo que será abordado durante o curso. [inglês]
1. UNDERSTANDING HADOOP AND MAPREDUCE
- Understanding Hadoop 2.0 and HDFS
- Writing MapReduce Applications
- Map Aggregation
LABS
- Demonstration: Understanding Block Storage
- Configuring a Hadoop Development Environment
- Putting Files in HDFS with Java
- Demonstration: Understanding Map Reduce
- Word Count
- Distributed Grep
- Inverted Index
- Using a Combiner
- Computing an Average