Data Science é o estudo disciplinado dos dados e informações inerentes ao negócio e todas as visões que podem cercar um determinado assunto. É uma ciência que estuda as informações, seu processo de captura, transformação, geração e, posteriormente, análise de dados. A ciência de dados envolve diversas disciplinas:

  • Computação;
  • Estatística;
  • Matemática;
  • Conhecimento do Negócio.

 

Data Scientist ou Cientista de Dados

Já que definimos Data Science/Ciência de Dados, porquê não definirmos o profissional Cientista de Dados/Data Scientist?
O cientista de dados é um profissional multidisciplinar, responsável por realizar o processo citado no tópico Data Science acima. Ou seja, é responsável por transformar dados em informações ou produtos de informações dentro de uma corporação.

Além disso, ele também deve ser responsável pela formulação dos problemas, escolha de modelos de simulação e estatística e entrega dos produtos de dados.

Bom, agora que compreendemos um pouquinho o que é Data Science/Ciência de Dados e Data Scientist/Cientista de Dados, nos convém, agora, entender a diferença entre:

 

Data Scientist x Business Analyst x Data Analyst

Seguindo a mesma simplicidade na desmitificação do que é Data Science/Ciência de Dados e Data Scientist/Cientista, vamos definir os três itens que dão nome ao tópico. Vamos lá!

Data Scientist: 

Participa da formulação do problema, hipóteses de resolução e análise de resultados.

Business Analyst: 

Analisa os dados gerados em relação ao negócio ou empresa avaliada.

Data Analyst:

Analisa os dados disponibilizados em busca de solução para o problemas enfrentados.

Simples, não? Inicialmente podemos descrever o trio desta forma. E ‘caminhando’ adiante, chegamos até o Big Data. Mas o que é Big Data?

O que é Big Data

Big Data (“Mega dados” em português), em tecnologia da Informação, refere-se a um grande conjunto de dados armazenados. E pode-se basear em 5V’s: Velocidade, Volume, Variedade, Veracidade e Valor.

Big Data é um termo amplamente usado atualmente para nomear conjuntos de dados muito grande ou complexos, que os aplicativos de processamento de dados tradicionais não conseguem lidar. Para atuar com Big Data, deve-se compreender os desafios de se trabalhar na área, que incluem: Análise, Captura, Curadoria de Dados, Pesquisa, Compartilhamento, Armazenamento, Transferência, Visualizações e informações acerca da privacidade dos dados.

Quero trabalhar com Big Data

Para se trabalhar com Big Data, acredita-se que o melhor caminho é:

  • Conhecer as ferramentas utilizadas (que iremos abordar em outro artigo em breve);
  • Possuir perfil perfil misto: técnico e negócios;
  • Conhecer Business Inteligence e Data Warehouse;
  • Compreender os processos da empresa;
  • E conhecer estatística e matemática.

Podemos fracionar classificar os profissionais que atuam com Big Data em três perfis:

1. ANALISTA DE DADOS

ATRIBUIÇÕES E TAREFAS:

  • Responsável por atender as demandas das áreas de negócio ou planejamento da empresa;
  • Participa da formulação dos problemas e respostas;
  • Nível mais próximo ao negócio;
  • Deve conhecer as ferramentas de consulta e acesso aos dados;
  • Deveria conhecer estatística.

2. DESENVOLVEDOR

ATRIBUIÇÕES E TAREFAS:

  • Responsável por Desenvolver os processos necessários para geração dos dados;
  • Processos de Captura, Transformação e Carga de Dados;
  • Deve conhecer tecnicamente as ferramentas envolvidadas;
  • Deve conhecer sobre programação;
  • Será responsável pelo desenvolvimento de novas rotinas e processos.

3. ADMINISTRADOR

ATRIBUIÇÕES E TAREFAS:

  • Responsável por manter os ambientes e ferramentas funcionando da melhor maneira;
  • Deve conhecer sobre os sistemas operacionais utilizados, principalmente Linux;
  • Deve conhecer sobre arquitetura de hardware e redes para garantir a melhor performance;
  • Deve conhecer sobre os processos de Tunning das ferramentas.

O que é preciso saber para se trabalhar com Big Data?

Não tem muito segredo, abaixo você pode conferir pontos técnicos importantes para se trabalhar com Big Data.

  • Programação – as ferramentas ainda são pouco automatizadas na geração de código;
  • Sistema Operacional Linux – Diversos softwares rodam em Linux. É necessários conhecer comandos básicos para execução de processos;
  • Modelagem de Dados
  • Conhecer sobre o negócio ou sobre os processos da empresa;
  • Conhecer ou ter noções mínimas de estatística e matemática aplicada a dados.

Especializações/Cursos

A Cetax oferece diversos treinamentos na área de Business Intelligence, aqui em nosso site você pode conferir os cursos que ministramos, seu conteúdo programático e tirar dúvidas através do chat online. Abaixo estão os links dos cursos sobre os tópicos que abordamos aqui neste artigo.

  1. Curso de HDP Analyst: Data Science
  2. Curso de Data Quality
  3. Curso de Big Data
  4. Curso de Business Analysis
  5. Modelagem Dimensional 
  6. Modelagem Dimensional Avançado 

Por enquanto é isso. Você também pode complementar nosso artigo com mais informações úteis. Mande-nos um e-mail com sugestões de melhorias e/ou novos artigos.

Até o próximo artigo.
Douglas Godoi