Project Description
Nesse novo curso da Cetax, vamos abordar os principais conceitos e fundamentos do software Pentaho Data Integration, pra quem não conhece é uma ferramenta muito utilizada para tratamento e ingestão de dados e o melhor é Open Source então não tem o custo com licenciamento e não fica atrás de nenhum software no seu segmento.
Público-Alvo
Somente treinamentos para empresas (In-Company). Compreensão de Banco de Dados relacionais e dos conceitos de Data Warehouse, Business Intelligence.
Requisitos
Somente treinamentos para empresas (In-Company). Conhecimento básico em Linux e alguma linguagem de programação. No curso utilizaremos Python como linguagem de exemplo.
Conteúdo Programático
Este é o conteúdo que será abordado durante o curso.
Instalação
-
Instalar Pentaho Data Integration e demais aplicativos.
-
Instalar Banco de dados Mysql.
Inputs
-
Entrada de dados do Banco de dados, excel, Web Services e API.
-
Geração manual de registros.
-
Acessando vários arquivos XML de um mesmo diretório.
-
Transformações
-
Ordenar os registros chaves.
-
Fazer join entre duas ou mais tabelas.
-
Agregar registros como sum,avg, count.
-
Tratar os dados de forma rápida e eficiente.
-
Filtro de registros.
-
Unificar fluxos.
-
Converter tipos de dados.
-
Automatizando analises e processos.
Outputs
-
Carregar registros em Excel e banco de dados
-
Tratar os erros do fluxo num arquivo csv.
-
Enviar o arquivo em um email enviado via Pentaho
-
Criando uma carga de dados de forma incremental, aonde só irá carregar os registros novos.
Jobs
-
Executar várias transformações num mesmo job.
-
Configurar o job para executar de forma agenda e automática.
-
Enviar um email caso o job não for executado enviando em anexo o log de erro.