Project Description
Nesse novo curso da Cetax, vamos abordar os principais conceitos e fundamentos do software Pentaho Data Integration, pra quem não conhece é uma ferramenta muito utilizada para tratamento e ingestão de dados e o melhor é Open Source então não tem o custo com licenciamento e não fica atrás de nenhum software no seu segmento.
Público-Alvo
Somente treinamentos para empresas (In-Company). Compreensão de Banco de Dados relacionais e dos conceitos de Data Warehouse, Business Intelligence.
Requisitos
Somente treinamentos para empresas (In-Company). Conhecimento básico em Linux e alguma linguagem de programação. No curso utilizaremos Python como linguagem de exemplo.
Conteúdo Programático
Este é o conteúdo que será abordado durante o curso.
Instalação
- Instalar Pentaho Data Integration e demais aplicativos.
- Instalar Banco de dados Mysql.
Inputs
- Entrada de dados do Banco de dados, excel, Web Services e API.
- Geração manual de registros.
- Acessando vários arquivos XML de um mesmo diretório.
- Transformações
- Ordenar os registros chaves.
- Fazer join entre duas ou mais tabelas.
- Agregar registros como sum,avg, count.
- Tratar os dados de forma rápida e eficiente.
- Filtro de registros.
- Unificar fluxos.
- Converter tipos de dados.
- Automatizando analises e processos.
Outputs
- Carregar registros em Excel e banco de dados
- Tratar os erros do fluxo num arquivo csv.
- Enviar o arquivo em um email enviado via Pentaho
- Criando uma carga de dados de forma incremental, aonde só irá carregar os registros novos.
Jobs
- Executar várias transformações num mesmo job.
- Configurar o job para executar de forma agenda e automática.
- Enviar um email caso o job não for executado enviando em anexo o log de erro.