Project Description

Este curso foi projetado para grandes analistas de dados que desejam usar o banco de dados NoBQL do HBase, que é executado na parte superior do HDFS para o acesso de leitura / gravação à hora providentada para conjuntos de dados esparsos. Os tópicos incluem arquitetura HBase, serviços, instalação e design de esquema.

This course is designed for big data analysts who want to use theHBase NoSQL database which runs on top of HDFS to providereal-time read/write access to sparse datasets. Topics include HBase architecture, services, installation and schema design.

Público-Alvo

Somente treinamentos para empresas (In-Company). Arquitetos, desenvolvedores de software e analistas responsáveis ​​pela implementação de bancos de dados não-SQL, a fim de lidar com conjuntos de dados dispersos comumente encontrados em grandes casos de uso de dados.

Requisitos

Somente treinamentos para empresas (In-Company). Familiaridade básica com os sistemas de gerenciamento de dados. A familiaridade com Hadoop ou bancos de dados é útil, mas não é necessária. É recomendado, para os ingressantes no Hadoop, realizar o curso Hadoop Essentials.

Conteúdo Programático

Este é o conteúdo que será abordado durante o curso. [inglês]

PART 1

  • Using Hadoop and MapReduce
  • Using HBase
  • Examining Configuration Files
  • Using Backup and Snapshot

PART 2

  • HBase Shell Operations
  • Using a Java Data Access Object Application oInteract with HBase
  • Importing Data from MySQL to HBase
  • Using Apache ZooKeeper

PART 3

  • Creating Tables with Multiple Column Families
  • Exploring HBase Schema
  • Blocksize and Bloom filters
  • Exporting Data