Visão geral do quadro de dados R
Os quadros de dados são uma lista de vetores com o mesmo comprimento. No entanto, a diferença entre matrizes e quadros de dados é que eles aceitam vários tipos de dados. (Caractere, numérico, etc.). Neste tópico, vamos aprender sobre o R Data Frame.
Vantagens de usar quadros de dados
- Coleta distribuída de dados e organizada.
- Possui otimizações melhores em comparação com um banco de dados relacional.
- Contém uma variedade de dados heterogêneos.
Criando um quadro de dados em R
Criamos data_frame. Abaixo está o exemplo para declarar um quadro de dados.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
No exemplo acima, não definimos as variáveis. Vamos agora ver como atribuímos valores a variáveis e os armazenamos no quadro de dados.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Resultado:
Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
Estrutura do quadro de dados
Quando queremos conhecer a estrutura de um quadro de dados específico. Podemos usar a função abaixo.
Estrela ()
str(Data_frame)
Resultado:
Número: num 2 3 4
alfa: Fator com 3 níveis "x", "y", "z": 1 2 3
Booleanos: logi VERDADEIRO VERDADEIRO FALSO
Extraindo dados específicos do quadro de dados
1. Usando o nome da coluna
Podemos extrair um conjunto específico de dados do quadro de dados.
Do nosso exemplo acima, vamos extrair apenas a primeira coluna do quadro de dados que é Number.
Data_ frame <- data. Frame(Number)
Resultado:
Número
1 2
2 3
3 4
2. Usando as linhas
Podemos extrair os dados das linhas, como no exemplo abaixo.
Vamos supor que queremos imprimir apenas duas linhas da coluna Número.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Resultado:
Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
------------
Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
Podemos observar a diferença na primeira e na segunda saídas.
3. Imprimir linhas e colunas específicas
Também podemos imprimir linhas e colunas específicas.
No exemplo abaixo, imprimimos a primeira e a segunda linhas, colunas
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Resultado:
Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
-------------
Número alfa
1 2 x
2 3 anos
4. Adicionando outra coluna ao quadro de dados
Podemos adicionar outra coluna, juntamente com valores, ao quadro de dados.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Resultado:
Número alfa classe booleana
1 2 x VERDADEIRO A
2 3 e VERDADEIRO B
3 4 z FALSO C
5. Adicionando uma linha ao quadro de dados
Usamos a função rbind para adicionar uma nova linha ao quadro de dados existente.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Resultado:
Número alfa classe booleana
1 2 x VERDADEIRO A
2 3 e VERDADEIRO B
3 4 z FALSO C
4 5 x FALSO D
6. Combinando os dois quadros de dados
Também podemos combinar dois quadros de dados para produzir uma única saída.
Para combinar dois quadros de dados, precisamos ter a mesma coluna para os quadros de dados.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Resultado:
Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
--------------
Number alpha Booleans
1 4 x VERDADEIRO
2 5 y VERDADEIRO
3 6 z FALSO
--------------
Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
4 4 x VERDADEIRO
5 5 y VERDADEIRO
6 6 z FALSO
Inspecionando quadros de dados
Abaixo estão as diferentes maneiras de inspecionar um quadro de dados e fornece informações sobre um quadro de dados exatamente como a função em estrela acima.
1. Nomes - fornece os nomes das variáveis no quadro de dados
Sintaxe : names(data frame name)
Exemplo
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
saída : (1) "Número" "alfa" "Booleanos"
2. Resumo - fornece as estatísticas do quadro de dados.
Sintaxe: summary(data frame name)
Exemplo
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Resultado:
Number alpha Booleans
Min. : 2, 0 x: 1 Modo: lógico
1º Qu .: 2, 5 anos: 1 FALSO: 1
Mediana: 3, 0 z: 1 VERDADEIRO: 2
Média: 3, 0 NA's: 0
3º Qu .: 3, 5
Máx. : 4.0
3. Head - Fornece os dados para as primeiras linhas.
Sintaxe: Head( name of the data frame)
Exemplo
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Resultado:
Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
4 5 a VERDADEIRO
5 6 b FALSO
6 7 c FALSO
4. Cauda - Imprime as últimas linhas no quadro de dados.
Sintaxe: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Resultado:
Number alpha Booleans
5 6 b FALSO
6 7 c FALSO
7 8 d FALSO
8 9 f FALSO
9 10 g FALSO
10 11 j FALSO
Conclusão
Os quadros de dados são um conceito importante na programação R. É fácil e poderoso na criação de conjuntos de dados que podem ser modificados e acessados facilmente. Assim como a matriz, os conjuntos de dados podem ser acessados por meio de linhas e nomes de colunas, adicionando e removendo dados com facilidade.
Artigos recomendados
Este é um guia para o R Data Frame. Aqui discutimos a criação do quadro de dados em R com a estrutura e a extração de dados específicos do quadro de dados. Você também pode consultar os seguintes artigos para saber mais -
- Tipos de dados em C
- Carreira em ciência de dados
- Tecnologias de Big Data
- Plataforma de Ciência de Dados
- Booleanos Java