Introdução a Linguagem R
O que é Linguagem R ? É uma linguagem e ambiente para computação estatística e gráficos. É um projeto GNU que é semelhante ao idioma e ao ambiente S desenvolvido na Bell Laboratories (anteriormente AT&T, agora Lucent Technologies) por John Chambers e colegas. R pode ser considerado uma implementação diferente de S.
Existem algumas diferenças importantes, mas muito código escrito para que S seja executado inalterado sob R. Ele fornece uma grande variedade de estatísticas (modelagem linear e não-linear, testes estatísticos clássicos, análise de séries temporais, classificação, agrupamento,…) e técnicas gráficas e é altamente extensível. A linguagem S é muitas vezes o veículo de escolha para a pesquisa metodológica estatística, e R fornece uma rota de código aberto para participar dessa atividade.
Um dos pontos fortes da Linguagem R é a facilidade com que se podem produzir parcelas de qualidade de publicação bem concebidas, incluindo símbolos matemáticos e fórmulas, quando necessário. Grande cuidado foi assumido sobre os padrões para as escolhas menores do desenho em gráficos, mas o usuário mantém o controle total.
R está disponível como Software Livre nos termos da Licença Pública Geral GNU do Free Software Foundation em código fonte. Ele compila e funciona em uma grande variedade de plataformas UNIX e sistemas similares (incluindo FreeBSD e Linux), Windows e MacOS.
O ambiente R
R é um conjunto integrado de instalações de software para manipulação de dados, cálculos e exibição gráfica. Inclui:
– uma instalação de manipulação eficaz e armazenamento de dados,
– um conjunto de operadores para cálculos em matrizes, em particular matrizes,
– uma coleta ampla, coerente e integrada de ferramentas intermediárias para análise de dados,
– instalações gráficas para análise de dados e exibição em tela ou em cópia impressa, e
– uma linguagem de programação bem desenvolvida, simples e eficaz, que inclui condicionais, loops, funções recursivas definidas pelo usuário e instalações de entrada e saída.
O termo “ambiente” destina-se a caracterizá-lo como um sistema totalmente planejado e coerente, ao invés de uma acumulação incremental de ferramentas muito específicas e inflexíveis, como é frequentemente o caso de outros softwares de análise de dados.
A Linguagem R, como S, está desenhado em torno de uma linguagem de computador verdadeira, e permite aos usuários adicionar funcionalidades adicionais definindo novas funções. Grande parte do sistema está escrito no dialecto R de S, o que torna fácil para os usuários seguir as escolhas algorítmicas feitas.
Para tarefas computacionalmente intensivas, C, C ++ e o código Fortran podem ser vinculados e chamados em tempo de execução. Os usuários avançados podem escrever código C para manipular objetos da linguagem diretamente.
Muitos usuários pensam na linguagem como um sistema de estatísticas. Preferimos pensar nisso em um ambiente dentro do qual as técnicas estatísticas são implementadas. R pode ser estendido (facilmente) através de pacotes. Existem cerca de oito pacotes fornecidos com a distribuição e muitos outros estão disponíveis através da família de sites da rede CRAN cobrindo uma ampla gama de estatísticas modernas.
R tem seu próprio formato de documentação tipo LaTeX, que é usado para fornecer documentação abrangente, tanto on-line em vários formatos quanto em cópias impressas.