ANOVA em dois sentidos em R - Teste ANOVA em dois sentidos no Guia Fácil R - Exemplos

Índice:

Anonim

Visão geral da ANOVA em dois sentidos em R

A ANOVA de duas vias (Análise de Variância) nos ajuda a entender a relação entre uma variável dependente contínua e duas variáveis ​​independentes categóricas. Neste tópico, vamos aprender sobre a ANOVA de duas vias em R.

Abaixo está a hipótese de interesse sob ANOVA bidirecional

  1. H₀: Chame isso de efeito principal, que é o primeiro fator dependente da variável contínua
  2. H₀: o efeito Principal também é sobre o efeito na segunda variável na variável contínua dependente.
  3. H₀: Interação é o efeito combinado da primeira variável do segundo fator na variável dependente

Abaixo estão as normas que uma ANOVA de duas vias deve satisfazer.

  1. As observações devem ser independentes
  2. As observações devem ser normalmente distribuídas.
  3. Deve haver igual variação nas observações
  4. Não há discrepâncias no design
  5. Os erros devem ser independentes.

Nota

Precisamos transformar nossos dados se a normalidade e a variação igual forem violadas.

Exemplo de ANOVA Bidirecional em R

Vamos executar o teste ANOVA de uma maneira no conjunto de dados de níveis de câncer que contém 48 linhas e 3 variáveis ​​de dados:

Tempo decorrido: tempo de sobrevivência de um animal

Diferentes níveis de câncer 1 - 3

Tratamento: Tratamentos usados ​​de 1-3

Antes de testarmos, precisamos dos seguintes dados em mãos.

  • Importando os dados
  • Remover variável desnecessária
  • Converta variáveis ​​(níveis de Câncer) como nível ordenado.

Abaixo está o conjunto de dados.

Observações: 48

Variáveis: 3

tempo de sobrevivência 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…

níveis de câncer 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…

Tratamento A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

Objetivos

  1. H₀: nenhuma alteração no tempo médio de sobrevivência entre o grupo
  2. H₀: o tempo de sobrevivência é diferente para pelo menos um grupo.

Passos

  • Verifique os níveis de câncer. Podemos ver três valores de caracteres porque os convertemos em fatores com um verbo mutado.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Calcular desvio médio e padrão

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Resultado:

Um toque: 3 x 4

cancerlevels count_cancerlevels mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 276250 0, 06227627

  • Na etapa três, você pode verificar graficamente se há uma diferença entre as distribuições. Observe que você inclui o ponto tremido.
  • Execute o teste com o comando AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Sintaxe:

y ~ X1 + X2 +… + Xn (X1 + X2 +… refere-se às variáveis ​​independentes)

y ~. Use todas as variáveis ​​restantes como variáveis ​​independentes

Salve o modelo e imprima o resumo.

Código

  • aov (time ~ cancerlevels, data = df): execute o teste ANOVA com a seguinte fórmula
  • resumo (anova_one_way): imprime o resumo do teste

Df Soma Sq Média Sq F valor Pr (> F)

Níveis de câncer 2 1.033 0, 5165 11, 79 7, 66e-05 ***

Residuais 45 1, 972 0, 0438

-

Signif. códigos: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1

O valor p é menor que o limite 0, 05. A diferença estatística é indicada por '*' no caso acima.

Teste unidirecional para Anova em dois sentidos em R

Vamos ver como o teste unidirecional pode ser estendido para a ANOVA bidirecional. O teste é semelhante à ANOVA unidirecional, mas a fórmula difere e adiciona outra variável de grupo à fórmula.

y = x1 + x2

  • H0 : As médias são iguais para as duas variáveis ​​(variáveis ​​fatoriais)
  • H3 : As médias são diferentes para ambas as variáveis

Você adiciona variáveis ​​de tratamento ao nosso modelo. Esta variável indica o tratamento dado ao paciente. Você está interessado em verificar se existe uma dependência estatística entre os níveis de câncer e o tratamento administrado ao paciente.

Ajustamos nosso código adicionando um tratamento com a outra variável independente.

Df Soma Sq Média Sq F valor Pr (> F)

Níveis de câncer 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***

Tratamento 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***

Residuais 42 1, 0509 0, 0250

Os níveis de câncer e o tratamento são estatisticamente diferentes de 0. Por isso, podemos rejeitar a hipótese NULL. Além disso, confirme que a alteração do tratamento ou tipo de câncer afeta o tempo de sobrevivência.

Teste

ANOVA unidirecional: H3 - Média é diferente para pelo menos um grupo

ANOVA de duas vias: H3 - Média é diferente para ambos os grupos.

Diferença entre ANOVA unidirecional e bidirecional

Diferenças entre ANOVA unidirecional e ANOVA bidirecional

ANOVA unidirecionalANOVA de duas vias
Projetado para permitir testes de igualdade entre três ou mais meiosProjetado para avaliar a inter-relação de duas variáveis ​​independentes em uma variável dependente.
Envolve uma variável independenteEnvolve duas variáveis ​​independentes
Analisado em 3 ou mais grupos categóricos.Compara vários grupos de dois fatores
Tem que satisfazer dois princípios - replicação e randomizaçãoTem que satisfazer três princípios que são replicação, randomização e controle local.

Vantagens da ANOVA em dois sentidos

  • No exemplo acima, a idade e o sexo em nosso exemplo - ajudam a reduzir a variação de erros, tornando o design mais eficiente.
  • A ANOVA de duas vias nos permite testar o efeito de dois fatores ao mesmo tempo.

Aplicações de ANOVA

  1. Comparando a quilometragem de diferentes veículos, tipos de combustível e estrada.
  2. Conhecer o impacto da temperatura, pressão ou concentração química em algumas reações químicas (reatores de potência, usinas químicas, etc.)
  3. Impacto de diferentes catalisadores nas taxas de reação química
  4. Compreender o impacto de comerciais e diferentes números de respostas dos clientes.
  5. Impacto do desempenho, qualidade e rapidez na fabricação da biologia (processo com base no número de células em que são divididas)

Artigos recomendados

Este é um guia para a ANOVA de duas vias na R. Aqui discutimos os exemplos, objetivos, etapas e diferenças entre a ANOVA de mão única e a mão dupla. Você também pode consultar os seguintes artigos para saber mais -

  1. ANOVA em R
  2. Como interpretar resultados usando o teste ANOVA
  3. Regressão vs ANOVA
  4. GLM em R