Visão geral do quadro de dados R

Os quadros de dados são uma lista de vetores com o mesmo comprimento. No entanto, a diferença entre matrizes e quadros de dados é que eles aceitam vários tipos de dados. (Caractere, numérico, etc.). Neste tópico, vamos aprender sobre o R Data Frame.

Vantagens de usar quadros de dados

  • Coleta distribuída de dados e organizada.
  • Possui otimizações melhores em comparação com um banco de dados relacional.
  • Contém uma variedade de dados heterogêneos.

Criando um quadro de dados em R

Criamos data_frame. Abaixo está o exemplo para declarar um quadro de dados.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

No exemplo acima, não definimos as variáveis. Vamos agora ver como atribuímos valores a variáveis ​​e os armazenamos no quadro de dados.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Resultado:

Number alpha Booleans

1 2 x VERDADEIRO

2 3 y VERDADEIRO

3 4 z FALSO

Estrutura do quadro de dados

Quando queremos conhecer a estrutura de um quadro de dados específico. Podemos usar a função abaixo.

Estrela ()

str(Data_frame)

Resultado:

Número: num 2 3 4

alfa: Fator com 3 níveis "x", "y", "z": 1 2 3

Booleanos: logi VERDADEIRO VERDADEIRO FALSO

Extraindo dados específicos do quadro de dados

1. Usando o nome da coluna

Podemos extrair um conjunto específico de dados do quadro de dados.

Do nosso exemplo acima, vamos extrair apenas a primeira coluna do quadro de dados que é Number.

Data_ frame <- data. Frame(Number)

Resultado:

Número

1 2

2 3

3 4

2. Usando as linhas

Podemos extrair os dados das linhas, como no exemplo abaixo.

Vamos supor que queremos imprimir apenas duas linhas da coluna Número.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Resultado:

Number alpha Booleans

1 2 x VERDADEIRO

2 3 y VERDADEIRO

3 4 z FALSO

------------

Number alpha Booleans

1 2 x VERDADEIRO

2 3 y VERDADEIRO

Podemos observar a diferença na primeira e na segunda saídas.

3. Imprimir linhas e colunas específicas

Também podemos imprimir linhas e colunas específicas.

No exemplo abaixo, imprimimos a primeira e a segunda linhas, colunas

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Resultado:

Number alpha Booleans

1 2 x VERDADEIRO

2 3 y VERDADEIRO

3 4 z FALSO

-------------

Número alfa

1 2 x

2 3 anos

4. Adicionando outra coluna ao quadro de dados

Podemos adicionar outra coluna, juntamente com valores, ao quadro de dados.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Resultado:

Número alfa classe booleana

1 2 x VERDADEIRO A

2 3 e VERDADEIRO B

3 4 z FALSO C

5. Adicionando uma linha ao quadro de dados

Usamos a função rbind para adicionar uma nova linha ao quadro de dados existente.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Resultado:

Número alfa classe booleana

1 2 x VERDADEIRO A

2 3 e VERDADEIRO B

3 4 z FALSO C

4 5 x FALSO D

6. Combinando os dois quadros de dados

Também podemos combinar dois quadros de dados para produzir uma única saída.

Para combinar dois quadros de dados, precisamos ter a mesma coluna para os quadros de dados.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Resultado:

Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
--------------
Number alpha Booleans
1 4 x VERDADEIRO
2 5 y VERDADEIRO
3 6 z FALSO

--------------

Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
4 4 x VERDADEIRO
5 5 y VERDADEIRO
6 6 z FALSO

Inspecionando quadros de dados

Abaixo estão as diferentes maneiras de inspecionar um quadro de dados e fornece informações sobre um quadro de dados exatamente como a função em estrela acima.

1. Nomes - fornece os nomes das variáveis ​​no quadro de dados

Sintaxe : names(data frame name)

Exemplo

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

saída : (1) "Número" "alfa" "Booleanos"

2. Resumo - fornece as estatísticas do quadro de dados.

Sintaxe: summary(data frame name)

Exemplo

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Resultado:

Number alpha Booleans
Min. : 2, 0 x: 1 Modo: lógico
1º Qu .: 2, 5 anos: 1 FALSO: 1
Mediana: 3, 0 z: 1 VERDADEIRO: 2
Média: 3, 0 NA's: 0
3º Qu .: 3, 5
Máx. : 4.0

3. Head - Fornece os dados para as primeiras linhas.

Sintaxe: Head( name of the data frame)

Exemplo

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Resultado:

Number alpha Booleans
1 2 x VERDADEIRO
2 3 y VERDADEIRO
3 4 z FALSO
4 5 a VERDADEIRO
5 6 b FALSO
6 7 c FALSO

4. Cauda - Imprime as últimas linhas no quadro de dados.

Sintaxe: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Resultado:

Number alpha Booleans
5 6 b FALSO
6 7 c FALSO
7 8 d FALSO
8 9 f FALSO
9 10 g FALSO
10 11 j FALSO

Conclusão

Os quadros de dados são um conceito importante na programação R. É fácil e poderoso na criação de conjuntos de dados que podem ser modificados e acessados ​​facilmente. Assim como a matriz, os conjuntos de dados podem ser acessados ​​por meio de linhas e nomes de colunas, adicionando e removendo dados com facilidade.

Artigos recomendados

Este é um guia para o R Data Frame. Aqui discutimos a criação do quadro de dados em R com a estrutura e a extração de dados específicos do quadro de dados. Você também pode consultar os seguintes artigos para saber mais -

  1. Tipos de dados em C
  2. Carreira em ciência de dados
  3. Tecnologias de Big Data
  4. Plataforma de Ciência de Dados
  5. Booleanos Java

Categoria: