Project Description

Nesse treinamento de apache hadoop, seguimos o currículo oficial Hortonworks, demonstrando as principais características do ambiente hadoop e as ferramentas do seu ecossistema. O descritivo do curso está em inglês:

This course provides a technical overview of Apache Hadoop. It includes high-level information about concepts, architecture, operation, and uses of the Hortonworks Data Platform (HDP) and the Hadoop ecosystem. The course provides an optional primer for those who plan to attend a hands-on, instructor-led course.

Público-Alvo

Somente treinamentos para empresas (In-Company). Profissionais de TI ou usuários de negócios; alunos, professores ou qualquer pessoa que deseja compreender os fundamentos do Big Data e do Ecossistema Hadoop.

Requisitos

Somente treinamentos para empresas (In-Company). Nenhum conhecimento anterior em Hadoop ou programação são necessários. Os alunos precisarão de notebook com acesso à internet.

Conteúdo Programático

Estes são os tópicos abordados durante o curso Hadoop Essentials.

OBJECTIVES

  • The Case for Hadoop
  • The Hadoop Ecosystem
  • HDFS Architecture
  • Ingesting Data
  • Parallel Processing
  • Apache Hive Overview
  • Apache Pig Overview
  • pache Spark Overview
  • YARN Architecture
  • Hadoop Security

DEMONSTRATIONS

  • Operational Overview with Ambari
  • Loading Data into HDFS
  • Streaming Data into HDFS
  • Processing with MapReduce
  • Data Manipulation with Hive
  • Risk Analysis with Pig
  • Risk Analysis with Spark
  • Securing Ranger with Hive