Project Description

Nesse novo curso da Cetax, vamos abordar os principais conceitos e fundamentos do software Pentaho Data Integration, pra quem não conhece é uma ferramenta muito utilizada para tratamento e ingestão de dados e o melhor é Open Source então não tem o custo com licenciamento e não fica atrás de nenhum software no seu segmento.

Público-Alvo

Somente treinamentos para empresas (In-Company). Compreensão de Banco de Dados relacionais e dos conceitos de Data Warehouse, Business Intelligence.

Requisitos

Somente treinamentos para empresas (In-Company). Conhecimento básico em Linux e alguma linguagem de programação. No curso utilizaremos Python como linguagem de exemplo.

Conteúdo Programático

Este é o conteúdo que será abordado durante o curso.

Instalação

  • Instalar Pentaho Data Integration e demais aplicativos.
  • Instalar Banco de dados Mysql.

Inputs

  • Entrada de dados do Banco de dados, excel, Web Services e API.
  • Geração manual de registros.
  • Acessando vários arquivos XML de um mesmo diretório.
  • Transformações
  • Ordenar os registros chaves.
  • Fazer join entre duas ou mais tabelas.
  • Agregar registros como sum,avg, count.
  • Tratar os dados de forma rápida e eficiente.
  • Filtro de registros.
  • Unificar fluxos.
  • Converter tipos de dados.
  • Automatizando analises e processos.

Outputs

  • Carregar registros em Excel e banco de dados
  • Tratar os erros do fluxo num arquivo csv.
  • Enviar o arquivo em um email enviado via Pentaho
  • Criando uma carga de dados de forma incremental, aonde só irá carregar os registros novos.

Jobs

  • Executar várias transformações num mesmo job.
  • Configurar o job para executar de forma agenda e automática.
  • Enviar um email caso o job não for executado enviando em anexo o log de erro.