Atividades Preparatórias para o Curso

O R e sua filosofia de trabalho

“Uma das coisas mais importantes que você pode fazer é dedicar um tempo para aprender uma linguagem de programação de verdade. Aprender a programar é como aprender outro idioma: exige tempo e treinamento, e não há resultados práticos imediatos. Mas se você supera essa primeira subida íngreme da curva de aprendizado, os ganhos como cientista são enormes. Programar não vai apenas livrar você da camisa de força dos pacotes estatísticos, mas também irá aguçar suas habilidades analíticas e ampliar os horizontes de modelagem ecológica e estatística.”
Gotelli & Ellison, 2004. A Primer of Ecological Statistics. Sunderland, Sinauer.

O R não é um software do tipo aplicativo, é um ambiente de programação com um conjunto integrado de ferramentas de software para manipulação de dados, cálculo e apresentação gráfica. A linguagem R foi elaborada inicialmente com o objetivo específico de análises de dados, na qual muitas técnicas estatísticas, clássicas e modernas, podem ser implementadas, entre outras coisas não tão estatísticas. Algumas dessas técnicas estão implementadas no ambiente báscio do R (R base), mas muitas estão implementadas em pacotes adicionas (packages).

O ambiente R foi desenvolvido baseado na linguagem S, no final da década de 90 início dos anos 2000. A sua estrutura de código aberto (que vem da linguagem S) e de software público e gratuito atraiu um grande número de desenvolvedores, sendo que há hoje inúmeros pacotes para o R.

Instalando o R

Vá para a página de download do R para o CRAN (repositório do R) mais próximo (BRAZIL SP - FMVZ-USP) e baixe o pacote de instalação para o seu sistema operacional. O R já vem com uma interface gráfica para utilização. O tipo de interface depende do sistema operacional, se for o Windows será o RGUI. Esta interface distribuída ainda carece de muitos recursos que estão disponíveis em interfaces desenvolvidas para facilitar o trabalho e ser mais amigável com aqueles que não entendem muito de linha de comando e programação. Para isso usaremo o Rstudio, veja como instalar abaixo.

Instalando o Rstudio

O Rstudio é um IDE (Integrated Development Environment) de distribuição livre para o R. Ou seja, é um interface gráfica que permite que utilizemos o R de maneira mais amigável, simples e eficiente. É muito útil para aqueles que não estão familiarizados com ambientes de programação através de linha de comando. Instale o Rstudio aqui.

Veja também esse vídeo de 1:30 min sobre o Rstudio!

Instalando pacotes no R

Pacotes nada mais são do que conjuntos de funcionalidades (funções e dados) distribuídos em conjunto para realizar tarefas específicas. Como já foi dito, o R vem com os pacotes base (R base) que possui grande parte das funções mais básicas em leitura, manipulação de dados e estatítica. Porém, uma imensa quantidade de funções muito úteis estão em pacotes adicionais (add-on packages), que podem ser baixados e instalados no R rapidamente através dos comandos dentro do console do R.

Como exemplo, o pacotes vegan carrega na sua área de trabalho (deixa disponível para uso) um conjunto de ferramentas para análises de dados de ecologia de comunidade. Para usar os pacotes disponíveis é necessário entender as diferenças entre baixar (download) o pacote do repositório e carregar em sua área de trabalho. Para baixar algum pacote disponível no repositório CRAN do R é necessário utilizar o comando install.packages() com o nome do pacote entre ”” dentro do parenteses. Se não houver nenhuma mensagem de erro, significa que o download do pacote foi realizado com sucesso.

Se você quiser usar uma função que está implementada dentro do pacote instalado, você precisa carregá-lo para fazer parte do seu workspace. Para cada projeto, precisamos carregar aqueles pacotes que vamos necessitar (normalmente colocamos a função library nas primeiras linhas de comando do nosso código):

install.packages("vegan") #instalando o pacote vegan
library(vegan) # carregando o pacote para que você utilize suas funções

OBS: No Rstudio existe uma aba no painel direito inferior chamada Packages onde você pode ver os pacotes que já vem com o R base e os que você isntalou. Clique no botão de marcação do pacote se você quer ativá-lo para usar suas funções (é o mesmo que a função library()). Também, para instalar um pacote você pode clicar no botão Install que será o mesmo que dar o comando install.packages.

O código é tudo!

Um dos primeiros hábitos que você deve adquirir para trabalhar com o R é não digitar os comandos diretamente na linha de comando (Console), e sim em um arquivo texto, que chamamos de script ou código. Este novo script, com extensão .R ou .r, conterá todos os comandos que você vai usar para analisar seus dados e pode ser lido facilmente por qualquer editor de texto (bloco de notas do windows por exemplo). Os scripts são sequências de comandos que podem ser armazenados e usados de novo quantas vezes quisermos. No cotidiano do uso do R, é bem comum que precisemos fazer o mesmo procedimento diversas vezes com diferentes conjuntos de dados. Isto pode se tornar bem trabalhoso, o que torna muito prático armazenar linhas prontas para que possam ser usadas novamente.

Uma coisa muito importante é a possibilidade de inserir comentários nos scripts para você não se perder em suas análises. Para inserir cabeçalho, dicas, comentários ou até mesmo “desligar” um comando você colocará o símbolo de # antes de qualquer linha. É recomendável que os comentários sejam usados durante o processo de aprendizado, na forma de lembretes sobre o uso das funções. Eles também são bastante úteis durante a interpretação de resultados de análises, pois permitem que o usuário anote as suas primeiras conclusões e interpretações diretamente com os resultados. Nos exemplos deste tutorial existem vários comentários como exemplo.

### Análises X
# Melina Leite
# 21 março de 2016

# exemplo de cabeçalho do script acima 

# você pode colocar quantos comentários quiser
# veja abaixo um exemplo de separação de seção

###################
# GRAFICOS FINAIS #
###################

Na interface do Rstudio você pode criar um novo editor de texto indo em FILE > NEW FILE > R SCRIPT, ou clicando no íncone (+) no canto esquerdo superior. Assim, você terá seu novo script aberto logo em cima do console do R. Para enviar comandos do script para o console, aperte CTRL+R ou CTRL+Enter (para usuários do Mac use Comand+Enter) em cima da linha do comando.

Aulas iniciais de R

Para você começar a se familiarizar com o R, acompanhe o roteiro Curso Relâmpago de R e traga suas dúvidas para a primeira aula!

Há também um curso bem básico em inglês de introdução ao R no site do DataCamp. Este site contém diversos cursos em R, alguns pagos. Faça pelo menos o capítulo 1 (Intro to basics). Assim você terá uma noção melhor do R e de como executar seus comandos básicos.

Material extra

Melina Leite

22 de março de 2016