Introdução aos Pacotes R
O pacote é uma coleção de funções e conjuntos de dados. Os pacotes ajudam a aprimorar a funcionalidade em uma linguagem de programação. Se queremos armazenar e processar bancos de dados (por exemplo, funcionalidades como SQL usando quadros de dados), podemos usar o pacote dplyr no R. Os pacotes também fornecem documentação sobre como usar as funções e os conjuntos de dados em um determinado pacote.
Onde encontramos pacotes?
Os pacotes estão disponíveis na internet através de diferentes fontes. No entanto, existem certos repositórios confiáveis de onde podemos baixar os pacotes.
Aqui estão os dois repositórios importantes que estão disponíveis online.
- CRAN (rede abrangente de arquivamento R): esta é a comunidade R oficial com uma rede de servidores FTP e web que contém o código e a documentação mais recentes da R. Antes de publicar seus pacotes on-line, ele passa por uma série de testes que seguem a política do CRAN .
- GitHub: O GitHub é outro repositório famoso, mas não específico do R. A comunidade online pode compartilhar seus pacotes com outras pessoas e é usada para o controle de versão. O GitHub é um código aberto e não possui nenhum processo de revisão.
Lista de pacotes R úteis
Existem vários pacotes no R e podem ser baixados do CRAN ou GitHub. Abaixo estão os pacotes que podem ser usados para fins específicos.
1. Carregando os dados de fontes externas
- Refúgio: R lê e grava dados do SAS.
- DBI: Para estabelecer comunicação entre o banco de dados relacional e o R.
- RSQlite: É usado para ler dados de bancos de dados relacionais.
2. Manipulação de Dados
- Dplyr: É usado para manipulação de dados, como subconjuntos, fornece atalhos para acessar dados e gera consultas sql.
- Tidyr - É usado para converter dados em pequenos formatos.
- stringr - manipula expressões de string e caracteres.
- Lubrificar - Para trabalhar com dados e tempo.
3. Visualização de Dados
- Rgl: Para trabalhar em visualizações 3D.
- ggvis: Para criar e criar gramática de gráficos.
- googlevis: para usar as ferramentas de visualização do google em R.
4. Pacotes baseados na Web
- XML: Para ler e gravar documentos XML em R.
- Httpr: trabalhe com conexões http.
- Jsonlite: Para ler tabelas de dados json.
Obtendo pacotes R
Podemos verificar os pacotes disponíveis que estão presentes no R usando o código abaixo.
- available.packages (): Existem aproximadamente 5200 pacotes disponíveis na rede CRAN.
O CRAN possui visualizações de tarefas que agrupam pacotes sob um tópico específico.
Instalando pacotes R
Podemos instalar pacotes diretamente através do IDE ou através de comandos. Para instalar pacotes, usamos a função abaixo e especificamos o nome do pacote.
Sintaxe:
install.packages()
Código:
install.packages(“ggplot2”)
O código acima instala o pacote ggplot2 e seus pacotes dependentes, se houver.
Podemos instalar vários pacotes ao mesmo tempo especificando os nomes dos pacotes sob um vetor de caracteres.
Sintaxe:
install.packages(c(“package 1”, ”package 2”, ”package 3”))
Código:
install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))
Instalando usando o R Studio
A vantagem de usar um estúdio R é a GUI (Interface Gráfica do Usuário). Podemos escolher os pacotes a serem instalados e a fonte dele.
Podemos ir para ferramentas -> Instalar pacotes.
Carregando pacotes R
Depois de instalar o pacote R, precisamos carregá-los no R, para começar a usar os pacotes instalados.
Usamos a função abaixo para carregar os pacotes.
Sintaxe:
library(package name)
Código:
library(ggplot2)
Existem certos pacotes que exibem mensagens quando carregados. Alguns deles, não. Podemos ver os detalhes da biblioteca instalada com a ajuda do código abaixo.
Código:
library(ggplot2)
search()
Resultado:
“Package: lattice” “package: ggplot2” “package: makeslides”
“Package: knitr” “package: slidify” “tools: rstudio”
Criando seu próprio pacote
Antes de criarmos nosso próprio pacote. Devemos manter a lista de verificação abaixo em mente antes de continuarmos a criar um pacote.
- Organizar o código é uma das coisas mais importantes ao escrever o código no pacote. Perdemos metade do tempo pesquisando o local do código em vez de melhorá-lo. Coloque todos os arquivos em uma pasta que seja facilmente acessível.
- Documentar o código ajuda a entender a finalidade do código. Quando não revisitamos o código com frequência, esquecemos por que escrevemos o código de uma certa maneira. Também pode ajudar as pessoas a entender melhor seu código quando compartilhadas com elas.
- Compartilhar os scripts por email tornou-se arcaico. A maneira mais fácil é fazer upload do seu código e distribuí-lo no GitHub. É possível obter feedback que possa ajudá-lo a aprimorar o código.
Para criar seu próprio pacote, temos que instalar o pacote devtools.
Código:
install.packages("devtools")
Para ajudar com a documentação, podemos usar o pacote abaixo.
Código:
install.packages("roxygen2")
Depois de instalar o pacote devtools. Você pode criar seu próprio pacote.
Código:
devtools::create ("packagename")
No lugar de "packagename", você pode dar o nome que desejar. Agora você pode adicionar suas funções neste pacote.
Você pode criar o mesmo nome de arquivo que seu nome de função.
Sintaxe:
Devtools:create(“firstpackage”)
Pacote de distribuição
Você pode distribuir seu pacote no github usando o pacote devtools.
Usamos o código abaixo para distribuir nosso pacote no github.
Código:
devtools::install_github("yourusername/firstpackage")
Você pode fornecer seu nome de usuário e pacote do github que você criou acima.
Aqui estão os arquivos necessários para um pacote
- Funções
- Documentação
- Dados
Quando tivermos todos os arquivos acima, é bom publicá-los no repositório.
Artigos recomendados
Este é um guia para pacotes R. Aqui discutimos a lista de pacotes R úteis, instalando pacotes usando o R studio e criando seu próprio pacote, etc. Você também pode consultar os seguintes artigos para saber mais -
- O que é a linguagem de programação R?
- Carreiras em Programação R
- Programação R vs Python
- MySQL vs SQLite
- Lista de Pacotes R