Hadoop: O que é, conceito e definição (2024)

Hadoop é uma plataforma de software de código aberto para o armazenamento e processamento distribuído de grandes conjuntos de dados, utilizando clusters de computadores com hardware commodity. Os serviços do Hadoop fornecem armazenamento , processamento, acesso, governança, segurança e operações de Dados.
Talend: Criando Job simples para ordenação de dados

Job simples no Talend para ordenação de dados Hoje vamos criar um job no talend, para ler um arquivo e fazer a ordenação dos dados. Requisitos Fazer Download do arquivo Aula_2.zip < Click Aqui > Esse arquivo será usado para carregar no talend. Criando o Job No repositório, ao lado direito do talend click com […]
Agregação de Dados com o Talend

Neste artigo “Agregação de Dados com o Talend”, nosso objetivo é fazer a agregação de dois arquivos e extrair um arquivo de saída com dados agregados, para isso vai ser usado 2 arquivos como fonte State.txt e o customer.csv agregação de dados com o talend – Pré-requisitos Fazer o download do arquivo Aula_3.zip < Click […]
Trabalhando com variáveis globais e contexto | Talend

Neste artigo, “Trabalhando com variáveis globais e contexto no Talend”, vamos trabalhar com as variáveis e contextos. Em algumas situações e, dependendo do trabalho que está sendo feito, podemos configurar alguns tipos de execução – Desenvolvimento, produção. PASSO 1 Clique com o botão direito em Job Design Clique em create Job, de o nome do […]
Capturando informações das execuções dos seus trabalhos

Hoje vamos abordar a parte de captura de informações no Log (com um exemplo de erro). Passo 1: Criar Job Vamos criar um novo Job. Clique com o botão direito em: job Design-> create Job. Crie o nome do Job com o nome: Captura_Informacao. Depois clique no botão Finish. Na área do Designer arraste o […]
Talend: Carregamento e Transformação de Dados

Nesse artigo vamos trabalhar a leitura de um arquivo, a transformação dos dados carregados, e a carga em um novo arquivo. Requisitos Fazer o Download do arquivo funcionário.csv << Clique Aqui >> Passo 1: Cria um Job No repositório clique com o botão direito em Job Designer/ create job No repositório em metadata clique com […]
O que é Power BI – Conheça o Software de BI da Microsoft

Conheça mais sobre o Power BI, essa poderosa ferramenta de inteligência da Microsoft
O que é ETL – Extract Transform Load?

ETL: O Processo de Extração, Transformação e Carga de Dados 1. Introdução ao ETL ETL, que significa Extração, Transformação e Carga, é um processo fundamental no gerenciamento de dados em empresas de todos os portes. Ele se refere ao fluxo de trabalho que extrai dados de várias fontes, os transforma para atender a necessidades específicas […]
Quem é Ralph Kimball?

Ralph Kimball Ralph Kimball, é referência quando se trata de Data Warehouse e Business Intelligence. É conhecido para convicções a longo prazo que os Data Warehouses devem ser projetados para serem compreensíveis e rápidos. Sua metodologia, conhecida como modelagem dimensional ou a metodologia de Kimball, é usada freqüentemente para permitir compartilhar dimensões conformadas. Ralph Kimball, […]
O que é OLAP – Online Analytical Processing ? (2024)

OLAP – Online Analytical Processing (2024) OLAP é um software cuja tecnologia de construção permite aos analistas de negócios, gerentes e executivos analisar e visualizar dados corporativos de forma rápida, consistente e principalmente interativa. A funcionalidade OLAP é inicialmente caracterizada pela análise dinâmica e multidimensional dos dados consolidados de uma organização permitindo que as atividades […]