Data Science é o estudo disciplinado dos dados e informações inerentes ao negócio e todas as visões que podem cercar um determinado assunto. É uma ciência que estuda as informações, seu processo de captura, transformação, geração e, posteriormente, análise de dados. A ciência de dados envolve diversas disciplinas:
- Computação;
- Estatística;
- Matemática;
- Conhecimento do Negócio.
Data Scientist ou Cientista de Dados
Já que definimos Data Science/Ciência de Dados, porquê não definirmos o profissional Cientista de Dados/Data Scientist?
O cientista de dados é um profissional multidisciplinar, responsável por realizar o processo citado no tópico Data Science acima. Ou seja, é responsável por transformar dados em informações ou produtos de informações dentro de uma corporação.
Além disso, ele também deve ser responsável pela formulação dos problemas, escolha de modelos de simulação e estatística e entrega dos produtos de dados.
Bom, agora que compreendemos um pouquinho o que é Data Science/Ciência de Dados e Data Scientist/Cientista de Dados, nos convém, agora, entender a diferença entre:
Data Scientist x Business Analyst x Data Analyst
Seguindo a mesma simplicidade na desmitificação do que é Data Science/Ciência de Dados e Data Scientist/Cientista, vamos definir os três itens que dão nome ao tópico. Vamos lá!
Data Scientist:
Participa da formulação do problema, hipóteses de resolução e análise de resultados.
Business Analyst:
Analisa os dados gerados em relação ao negócio ou empresa avaliada.
Data Analyst:
Analisa os dados disponibilizados em busca de solução para o problemas enfrentados.
Simples, não? Inicialmente podemos descrever o trio desta forma. E ‘caminhando’ adiante, chegamos até o Big Data. Mas o que é Big Data?
O que é Big Data
Big Data (“Mega dados” em português), em tecnologia da Informação, refere-se a um grande conjunto de dados armazenados. E pode-se basear em 5V’s: Velocidade, Volume, Variedade, Veracidade e Valor.
Big Data é um termo amplamente usado atualmente para nomear conjuntos de dados muito grande ou complexos, que os aplicativos de processamento de dados tradicionais não conseguem lidar. Para atuar com Big Data, deve-se compreender os desafios de se trabalhar na área, que incluem: Análise, Captura, Curadoria de Dados, Pesquisa, Compartilhamento, Armazenamento, Transferência, Visualizações e informações acerca da privacidade dos dados.
Quero trabalhar com Big Data
Para se trabalhar com Big Data, acredita-se que o melhor caminho é:
- Conhecer as ferramentas utilizadas (que iremos abordar em outro artigo em breve);
- Possuir perfil perfil misto: técnico e negócios;
- Conhecer Business Inteligence e Data Warehouse;
- Compreender os processos da empresa;
- E conhecer estatística e matemática.
Podemos fracionar classificar os profissionais que atuam com Big Data em três perfis:
1. ANALISTA DE DADOS
ATRIBUIÇÕES E TAREFAS:
- Responsável por atender as demandas das áreas de negócio ou planejamento da empresa;
- Participa da formulação dos problemas e respostas;
- Nível mais próximo ao negócio;
- Deve conhecer as ferramentas de consulta e acesso aos dados;
- Deveria conhecer estatística.
2. DESENVOLVEDOR
ATRIBUIÇÕES E TAREFAS:
- Responsável por Desenvolver os processos necessários para geração dos dados;
- Processos de Captura, Transformação e Carga de Dados;
- Deve conhecer tecnicamente as ferramentas envolvidadas;
- Deve conhecer sobre programação;
- Será responsável pelo desenvolvimento de novas rotinas e processos.
3. ADMINISTRADOR
ATRIBUIÇÕES E TAREFAS:
- Responsável por manter os ambientes e ferramentas funcionando da melhor maneira;
- Deve conhecer sobre os sistemas operacionais utilizados, principalmente Linux;
- Deve conhecer sobre arquitetura de hardware e redes para garantir a melhor performance;
- Deve conhecer sobre os processos de Tunning das ferramentas.
O que é preciso saber para se trabalhar com Big Data?
Não tem muito segredo, abaixo você pode conferir pontos técnicos importantes para se trabalhar com Big Data.
- Programação – as ferramentas ainda são pouco automatizadas na geração de código;
- Sistema Operacional Linux – Diversos softwares rodam em Linux. É necessários conhecer comandos básicos para execução de processos;
- Modelagem de Dados
- Conhecer sobre o negócio ou sobre os processos da empresa;
- Conhecer ou ter noções mínimas de estatística e matemática aplicada a dados.
Especializações/Cursos
A Cetax oferece diversos treinamentos na área de Business Intelligence, aqui em nosso site você pode conferir os cursos que ministramos, seu conteúdo programático e tirar dúvidas através do chat online. Abaixo estão os links dos cursos sobre os tópicos que abordamos aqui neste artigo.
- Curso de HDP Analyst: Data Science
- Curso de Data Quality
- Curso de Big Data
- Curso de Business Analysis
- Modelagem Dimensional
- Modelagem Dimensional Avançado
Por enquanto é isso. Você também pode complementar nosso artigo com mais informações úteis. Mande-nos um e-mail com sugestões de melhorias e/ou novos artigos.
Até o próximo artigo.
Douglas Godoi