Introdução aos Pacotes R

O pacote é uma coleção de funções e conjuntos de dados. Os pacotes ajudam a aprimorar a funcionalidade em uma linguagem de programação. Se queremos armazenar e processar bancos de dados (por exemplo, funcionalidades como SQL usando quadros de dados), podemos usar o pacote dplyr no R. Os pacotes também fornecem documentação sobre como usar as funções e os conjuntos de dados em um determinado pacote.

Onde encontramos pacotes?

Os pacotes estão disponíveis na internet através de diferentes fontes. No entanto, existem certos repositórios confiáveis ​​de onde podemos baixar os pacotes.

Aqui estão os dois repositórios importantes que estão disponíveis online.

  • CRAN (rede abrangente de arquivamento R): esta é a comunidade R oficial com uma rede de servidores FTP e web que contém o código e a documentação mais recentes da R. Antes de publicar seus pacotes on-line, ele passa por uma série de testes que seguem a política do CRAN .
  • GitHub: O GitHub é outro repositório famoso, mas não específico do R. A comunidade online pode compartilhar seus pacotes com outras pessoas e é usada para o controle de versão. O GitHub é um código aberto e não possui nenhum processo de revisão.

Lista de pacotes R úteis

Existem vários pacotes no R e podem ser baixados do CRAN ou GitHub. Abaixo estão os pacotes que podem ser usados ​​para fins específicos.

1. Carregando os dados de fontes externas

  • Refúgio: R lê e grava dados do SAS.
  • DBI: Para estabelecer comunicação entre o banco de dados relacional e o R.
  • RSQlite: É usado para ler dados de bancos de dados relacionais.

2. Manipulação de Dados

  • Dplyr: É usado para manipulação de dados, como subconjuntos, fornece atalhos para acessar dados e gera consultas sql.
  • Tidyr - É usado para converter dados em pequenos formatos.
  • stringr - manipula expressões de string e caracteres.
  • Lubrificar - Para trabalhar com dados e tempo.

3. Visualização de Dados

  • Rgl: Para trabalhar em visualizações 3D.
  • ggvis: Para criar e criar gramática de gráficos.
  • googlevis: para usar as ferramentas de visualização do google em R.

4. Pacotes baseados na Web

  1. XML: Para ler e gravar documentos XML em R.
  2. Httpr: trabalhe com conexões http.
  3. Jsonlite: Para ler tabelas de dados json.

Obtendo pacotes R

Podemos verificar os pacotes disponíveis que estão presentes no R usando o código abaixo.

  • available.packages (): Existem aproximadamente 5200 pacotes disponíveis na rede CRAN.

O CRAN possui visualizações de tarefas que agrupam pacotes sob um tópico específico.

Instalando pacotes R

Podemos instalar pacotes diretamente através do IDE ou através de comandos. Para instalar pacotes, usamos a função abaixo e especificamos o nome do pacote.

Sintaxe:

install.packages()

Código:

install.packages(“ggplot2”)

O código acima instala o pacote ggplot2 e seus pacotes dependentes, se houver.

Podemos instalar vários pacotes ao mesmo tempo especificando os nomes dos pacotes sob um vetor de caracteres.

Sintaxe:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Código:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Instalando usando o R Studio

A vantagem de usar um estúdio R é a GUI (Interface Gráfica do Usuário). Podemos escolher os pacotes a serem instalados e a fonte dele.

Podemos ir para ferramentas -> Instalar pacotes.

Carregando pacotes R

Depois de instalar o pacote R, precisamos carregá-los no R, para começar a usar os pacotes instalados.

Usamos a função abaixo para carregar os pacotes.

Sintaxe:

library(package name)

Nota: O nome do pacote não precisa ser indicado entre aspas.

Código:

library(ggplot2)

Existem certos pacotes que exibem mensagens quando carregados. Alguns deles, não. Podemos ver os detalhes da biblioteca instalada com a ajuda do código abaixo.

Código:

library(ggplot2)
search()

Resultado:

“Package: lattice” “package: ggplot2” “package: makeslides”

“Package: knitr” “package: slidify” “tools: rstudio”

Criando seu próprio pacote

Antes de criarmos nosso próprio pacote. Devemos manter a lista de verificação abaixo em mente antes de continuarmos a criar um pacote.

  • Organizar o código é uma das coisas mais importantes ao escrever o código no pacote. Perdemos metade do tempo pesquisando o local do código em vez de melhorá-lo. Coloque todos os arquivos em uma pasta que seja facilmente acessível.
  • Documentar o código ajuda a entender a finalidade do código. Quando não revisitamos o código com frequência, esquecemos por que escrevemos o código de uma certa maneira. Também pode ajudar as pessoas a entender melhor seu código quando compartilhadas com elas.
  • Compartilhar os scripts por email tornou-se arcaico. A maneira mais fácil é fazer upload do seu código e distribuí-lo no GitHub. É possível obter feedback que possa ajudá-lo a aprimorar o código.

Para criar seu próprio pacote, temos que instalar o pacote devtools.

Código:

install.packages("devtools")

Para ajudar com a documentação, podemos usar o pacote abaixo.

Código:

install.packages("roxygen2")

Depois de instalar o pacote devtools. Você pode criar seu próprio pacote.

Código:

devtools::create ("packagename")

No lugar de "packagename", você pode dar o nome que desejar. Agora você pode adicionar suas funções neste pacote.

Você pode criar o mesmo nome de arquivo que seu nome de função.

Sintaxe:

Devtools:create(“firstpackage”)

Pacote de distribuição

Você pode distribuir seu pacote no github usando o pacote devtools.

Usamos o código abaixo para distribuir nosso pacote no github.

Código:

devtools::install_github("yourusername/firstpackage")

Você pode fornecer seu nome de usuário e pacote do github que você criou acima.

Aqui estão os arquivos necessários para um pacote

  • Funções
  • Documentação
  • Dados

Quando tivermos todos os arquivos acima, é bom publicá-los no repositório.

Artigos recomendados

Este é um guia para pacotes R. Aqui discutimos a lista de pacotes R úteis, instalando pacotes usando o R studio e criando seu próprio pacote, etc. Você também pode consultar os seguintes artigos para saber mais -

  1. O que é a linguagem de programação R?
  2. Carreiras em Programação R
  3. Programação R vs Python
  4. MySQL vs SQLite
  5. Lista de Pacotes R

Categoria: