Introdução à lista de pacotes R

Um pacote na linguagem de programação R é uma unidade que fornece as funcionalidades necessárias que podem ser utilizadas carregando-o no ambiente R. Uma lista de pacotes R é semelhante a uma biblioteca em C, C ++ ou Java. Portanto, essencialmente, um pacote pode ter inúmeras funcionalidades, como funções, constantes, etc., permitindo que o usuário as utilize no contexto de um problema específico. Em R, um pacote necessário pode ser carregado usando a função library (). Caso um pacote não esteja presente, ele poderá ser instalado usando a função install.packages (). Os pacotes facilitam tarefas aparentemente difíceis por meio de suas funcionalidades prontas.

O que são pacotes R?

Existem muitos pacotes no R, e a seleção de um pacote depende da sua aplicação. Embora existam certos pacotes amplamente utilizados devido às funcionalidades que eles fornecem, não é o caso de outros pacotes serem menos importantes. Pacotes diferentes têm propósitos diferentes; alguns estão relacionados a técnicas estatísticas, outros dizem respeito a visualizações etc.

Na seção a seguir, veremos alguns dos pacotes importantes no R:

1. Carro

Este pacote é complementar à regressão aplicada. É um pacote grande que fornece várias funcionalidades para análise estatística. A importação deste pacote para o ambiente R importa outros pacotes relacionados, como MASS, estatísticas, gráficos etc. Algumas das funções do pacote incluem Anova, avPlots, Boxplot, carPalette, plotagens de densidade, infIndexPlot, hipótese linear, logit, teste de outlier, qqPlot, gráficos residuais, gráfico de dispersão, matriz de gráfico de dispersão, etc. Os extensos recursos do pacote podem ser medidos a partir do número de funções que ele fornece.

2. Corrotação

O pacote fornece uma exibição gráfica de uma matriz de correlação e um intervalo de confiança. O pacote também fornece algoritmos para executar a reordenação da matriz. Várias opções incluem a escolha de cores necessárias, rótulos de texto, rótulos de cores, layout etc. Vários métodos de visualização ou métodos de parâmetros no pacote de correspondência são "círculo", "quadrado", "elipse", "número", "sombra", "cor" e "torta". A função corrplot que incorpora várias opções fornece uma representação visualmente atraente da correlação entre diferentes variáveis ​​que, caso contrário, em circunstâncias normais, como números, são difíceis de interpretar. As correlações positivas são exibidas em azul e as negativas em vermelho. A intensidade da cor e o tamanho do círculo são proporcionais aos coeficientes de correlação.

3. DataExplorer

Este pacote trata da exploração e tratamento automatizados de dados. Ele fornece um processo automatizado de exploração de dados destinado a tarefas analíticas e modelagem preditiva. Isso é crucial, pois permite ao usuário entender dados e extrair insights. Cada variável na análise é varrida e analisada pelo pacote. Além disso, o pacote fornece funcionalidades para visualização dessas variáveis ​​usando técnicas gráficas típicas. Ele também fornece métodos comuns de processamento de dados para tratar e formatar dados.

4. Gmodels

O pacote gmodels fornece várias ferramentas em R para plotar dados. Ele contém várias funções, como glh.test, que é usado para testar, imprimir ou resumir uma hipótese linear geral para um modelo de regressão. A função faz. contrastes convertem contrastes legíveis por humanos na forma que R exige para o cálculo. A matriz retornada por make.contrasts pode ser usada como argumento para o argumento contrastes das funções do modelo. A função coefFrame ajusta um modelo para cada subgrupo definido por e retorna um quadro de dados com uma linha para cada ajuste e uma coluna para cada parâmetro. A função estimada calcula e testa contrastes e outras funções lineares estimadas dos coeficientes do modelo para lm, glm, etc. A função fit.contrast calcula e testa contrastes arbitrários para objetos de regressão.

5. Gplots

Este pacote fornece funcionalidades de visualização por meio de diversas ferramentas de programação. As funções no pacote trabalham no conceito de cálculo e plotagem. Os recursos gráficos do pacote são demonstrados por várias funções, como plotagem de banda, boxplot2, col2hex, ci2d, hist2d, plotagem de texto, plotagem coletor, piloto de balão, plotCI, meios de plotagem, etc. Essas funções permitem trabalhar com configurações relacionadas a cores, texto e outros aspectos gráficos intrincados da visualização. Eles também lidam com elementos complexos envolvidos na visualização baseada em estatísticas, por exemplo, lmplot2, funções de residplot que permitem ao usuário conduzir o diagnóstico de regressão detalhado através de gráficos de diagnóstico. Se vários dados precisarem ser plotados na mesma região, mas com eixos separados, isso será possível usando a função over plot no pacote.

6. Ggplot2

É um dos pacotes mais famosos do R que oferece amplos recursos visuais e apresenta os resultados mesmo de técnicas estatísticas e matemáticas complexas. As inúmeras funcionalidades fornecidas pelo pacote permitem que o analista obtenha informações dos dados da maneira mais interativa. A descrição R da função é "um sistema para criar declarativamente gráficos baseados na Gramática dos Gráficos". Essa gramática dos gráficos significa que o usuário deve informar ao 'ggplot2' sobre como as variáveis ​​devem ser mapeadas para a estética, portanto, isso significa essencialmente que especificar quais aspectos gráficos usar e o ggplot2 funcionará adequadamente com base nos detalhes.

7. Lubridate

Este pacote R facilita o trabalho com datas e horas. O pacote de lubrificado permite fácil manipulação de dados de data e hora. Ele analisa um número e fornece um arranjo de dados adequado; de fato, as funções de análise no pacote lidam com uma ampla variedade de formatos e separadores que simplificam o processo de análise. Um dos recursos notáveis ​​é que o pacote fornece funcionalidades para lidar com datas com diferentes fusos horários.

8. Hmisc

Nomeado Harrell Miscellaneous, o pacote Hmisc contém muitas funções que podem ser aproveitadas para análise de dados, gráficos de alto nível e operações utilitárias. Ele também inclui funções para calcular o tamanho e a potência da amostra, importar e anotar conjuntos de dados, imputar valores ausentes, fornecer funcionalidades avançadas de tabela, clustering de variáveis, manipulação da cadeia de caracteres, conversão de objetos R em código HTML etc.

9. Malha

O pacote oferece um sistema de visualização de dados de alto nível inspirado nos gráficos da Trellis. Ele enfatiza dados multivariados. Os poderosos recursos de visualização do pacote fornecem a solução gráfica necessária. Algumas das funções notáveis ​​do pacote são B_07_cloud, que ajuda a produzir gráficos de dispersão 3D e gráficos de superfície de estrutura de arame; D_level. cores, uma função para calcular cores falsas representando variáveis ​​numéricas ou categóricas; B_06_levelplot, uma função que gera gráficos de nível e gráficos de contorno; A_01_Lattice, uma função que fornece recursos gráficos da estrutura. B_09_tmd é uma função que gera o gráfico Tukey Mean - Difference; B_11_oneway, uma função que se encaixa no modelo unidirecional. O pacote, portanto, fornece amplas funcionalidades para visualizações através de várias funções.

10. MatrixModels

Este pacote permite modelar com matrizes esparsas e densas 'Matrix'. Para fazer isso, utiliza previsão e resposta modulares, classes de módulos. Todas as funções fornecidas pelo pacote são igualmente importantes, algumas das quais são lm.fit.sparse, que é uma função mais adequada para modelos lineares esparsos, resolveCoef que resolve o modelo de coeficientes e incremento de coeficiente. Uma matriz que constrói matrizes de design ou modelo possivelmente esparsas, glm4, que se encaixa em modelos lineares generalizados.

11. Multcomp

O pacote permite múltiplas comparações de k grupos em modelos lineares generalizados. Uma lista de nove procedimentos padrão a seguir. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott e Tetrade são fornecidos ao usuário, e o usuário seleciona as comparações com base nos requisitos. Além disso, também é fornecida uma interface de entrada livre para a matriz de contraste, que permite comparações especiais. O recurso digno de nota é que as comparações em si não se restringem a qualquer projeto específico, como equilibrado ou simples; os programas são projetados de maneira a se adequarem a múltiplas comparações dentro do modelo linear geral, que permite covariáveis, médias correlacionadas, valores ausentes., etc.

12. OpenMx

Este pacote trata basicamente da modelagem de equações estruturais estendidas. Ele fornece funcionalidades para criar modelos de equações estruturais. Esses modelos podem ser manipulados usando programação. Os modelos podem ser especificados com matrizes ou caminhos como LISREL ou RAM. Alguns dos tipos de modelos incluem vários grupos, fator de confirmação, distribuição da mistura, limiar categórico, funções diferenciais de ajuste, etc.

13. Plyr

É um pacote muito importante que fornece funcionalidades para manipulação de dados. Ele fornece ferramentas para dividir, aplicar e combinar dados. Ele vem com um conjunto de ferramentas que ajuda a resolver um conjunto comum de problemas. Por exemplo, às vezes, podemos precisar dividir uma grande tarefa em tarefas menores que são administráveis, depois operamos em cada uma das peças e, finalmente, reunimos todas as peças.

14. Qcc

O pacote adquire importância devido a várias funcionalidades de análise de qualidade que ele fornece. Ele fornece gráficos de controle de qualidade da Shewhart para dados contínuos, de atributos e contagens. Entre outros gráficos importantes estão os gráficos Cusum e EWMA e as curvas de características operacionais. Também oferece funcionalidade de análise de capacidade de processo. O gráfico de Pareto e o gráfico de causa e efeito e os gráficos de controle multivariados são ferramentas úteis fornecidas pelo pacote.

15. RandomForest

Como o nome sugere, este pacote é usado para criar um algoritmo de floresta aleatório. O pacote implementa o algoritmo de floresta aleatória de Breiman, que é baseado no código FORTRAN original de Beiman e Cutler. O algoritmo é usado para classificação e regressão. O pacote também pode ser usado no modo não supervisionado para avaliar as proximidades entre os pontos de dados.

16. Psych

É um pacote destinado a um propósito especial. O pacote fornece um procedimento para pesquisa psicológica, psicométrica e de personalidade. As funções são principalmente para análise multivariada usando várias técnicas estatísticas multivariadas.

Conclusão-Lista de Pacotes R

Existem inúmeros pacotes no R, e a aplicação de um pacote depende dos requisitos. A comunidade da Lista de pacotes R tem crescido muito rapidamente e todos os dias um pacote é adicionado. Vários pacotes podem fornecer funcionalidades semelhantes, mas a seleção de um pacote deve ser baseada em seu estudo cuidadoso.

Artigos recomendados

Este é um guia para uma lista de pacotes R. Aqui discutimos a introdução aos pacotes R e alguns pacotes importantes de R. Você também pode consultar nossos outros artigos sugeridos para saber mais -

  1. Pacotes Java
  2. O que é JNDI em Java?
  3. JColorChooser
  4. Programação R vs Python

Categoria: