Project Description
Este curso foi projetado para grandes analistas de dados que desejam usar o banco de dados NoBQL do HBase, que é executado na parte superior do HDFS para o acesso de leitura / gravação à hora providentada para conjuntos de dados esparsos. Os tópicos incluem arquitetura HBase, serviços, instalação e design de esquema.
This course is designed for big data analysts who want to use theHBase NoSQL database which runs on top of HDFS to providereal-time read/write access to sparse datasets. Topics include HBase architecture, services, installation and schema design.
Público-Alvo
Somente treinamentos para empresas (In-Company). Arquitetos, desenvolvedores de software e analistas responsáveis pela implementação de bancos de dados não-SQL, a fim de lidar com conjuntos de dados dispersos comumente encontrados em grandes casos de uso de dados.
Requisitos
Somente treinamentos para empresas (In-Company). Familiaridade básica com os sistemas de gerenciamento de dados. A familiaridade com Hadoop ou bancos de dados é útil, mas não é necessária. É recomendado, para os ingressantes no Hadoop, realizar o curso Hadoop Essentials.
Conteúdo Programático
Este é o conteúdo que será abordado durante o curso. [inglês]
PART 1
- Using Hadoop and MapReduce
- Using HBase
- Examining Configuration Files
- Using Backup and Snapshot
PART 2
- HBase Shell Operations
- Using a Java Data Access Object Application oInteract with HBase
- Importing Data from MySQL to HBase
- Using Apache ZooKeeper
PART 3
- Creating Tables with Multiple Column Families
- Exploring HBase Schema
- Blocksize and Bloom filters
- Exporting Data