Visão geral da ANOVA em dois sentidos em R
A ANOVA de duas vias (Análise de Variância) nos ajuda a entender a relação entre uma variável dependente contínua e duas variáveis independentes categóricas. Neste tópico, vamos aprender sobre a ANOVA de duas vias em R.
Abaixo está a hipótese de interesse sob ANOVA bidirecional
- H₀: Chame isso de efeito principal, que é o primeiro fator dependente da variável contínua
- H₀: o efeito Principal também é sobre o efeito na segunda variável na variável contínua dependente.
- H₀: Interação é o efeito combinado da primeira variável do segundo fator na variável dependente
Abaixo estão as normas que uma ANOVA de duas vias deve satisfazer.
- As observações devem ser independentes
- As observações devem ser normalmente distribuídas.
- Deve haver igual variação nas observações
- Não há discrepâncias no design
- Os erros devem ser independentes.
Nota
Precisamos transformar nossos dados se a normalidade e a variação igual forem violadas.
Exemplo de ANOVA Bidirecional em R
Vamos executar o teste ANOVA de uma maneira no conjunto de dados de níveis de câncer que contém 48 linhas e 3 variáveis de dados:
Tempo decorrido: tempo de sobrevivência de um animal
Diferentes níveis de câncer 1 - 3
Tratamento: Tratamentos usados de 1-3
Antes de testarmos, precisamos dos seguintes dados em mãos.
- Importando os dados
- Remover variável desnecessária
- Converta variáveis (níveis de Câncer) como nível ordenado.
Abaixo está o conjunto de dados.
Observações: 48
Variáveis: 3
tempo de sobrevivência 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
níveis de câncer 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…
Tratamento A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Objetivos
- H₀: nenhuma alteração no tempo médio de sobrevivência entre o grupo
- H₀: o tempo de sobrevivência é diferente para pelo menos um grupo.
Passos
- Verifique os níveis de câncer. Podemos ver três valores de caracteres porque os convertemos em fatores com um verbo mutado.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Calcular desvio médio e padrão
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Resultado:
Um toque: 3 x 4
cancerlevels count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- Na etapa três, você pode verificar graficamente se há uma diferença entre as distribuições. Observe que você inclui o ponto tremido.
- Execute o teste com o comando AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Sintaxe:
y ~ X1 + X2 +… + Xn (X1 + X2 +… refere-se às variáveis independentes)
y ~. Use todas as variáveis restantes como variáveis independentes
Salve o modelo e imprima o resumo.
Código
- aov (time ~ cancerlevels, data = df): execute o teste ANOVA com a seguinte fórmula
- resumo (anova_one_way): imprime o resumo do teste
Df Soma Sq Média Sq F valor Pr (> F)
Níveis de câncer 2 1.033 0, 5165 11, 79 7, 66e-05 ***
Residuais 45 1, 972 0, 0438
-
Signif. códigos: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
O valor p é menor que o limite 0, 05. A diferença estatística é indicada por '*' no caso acima.
Teste unidirecional para Anova em dois sentidos em R
Vamos ver como o teste unidirecional pode ser estendido para a ANOVA bidirecional. O teste é semelhante à ANOVA unidirecional, mas a fórmula difere e adiciona outra variável de grupo à fórmula.
y = x1 + x2
- H0 : As médias são iguais para as duas variáveis (variáveis fatoriais)
- H3 : As médias são diferentes para ambas as variáveis
Você adiciona variáveis de tratamento ao nosso modelo. Esta variável indica o tratamento dado ao paciente. Você está interessado em verificar se existe uma dependência estatística entre os níveis de câncer e o tratamento administrado ao paciente.
Ajustamos nosso código adicionando um tratamento com a outra variável independente.
Df Soma Sq Média Sq F valor Pr (> F)
Níveis de câncer 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Tratamento 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Residuais 42 1, 0509 0, 0250
Os níveis de câncer e o tratamento são estatisticamente diferentes de 0. Por isso, podemos rejeitar a hipótese NULL. Além disso, confirme que a alteração do tratamento ou tipo de câncer afeta o tempo de sobrevivência.
Teste
ANOVA unidirecional: H3 - Média é diferente para pelo menos um grupo
ANOVA de duas vias: H3 - Média é diferente para ambos os grupos.
Diferença entre ANOVA unidirecional e bidirecional
Diferenças entre ANOVA unidirecional e ANOVA bidirecional
ANOVA unidirecional | ANOVA de duas vias |
Projetado para permitir testes de igualdade entre três ou mais meios | Projetado para avaliar a inter-relação de duas variáveis independentes em uma variável dependente. |
Envolve uma variável independente | Envolve duas variáveis independentes |
Analisado em 3 ou mais grupos categóricos. | Compara vários grupos de dois fatores |
Tem que satisfazer dois princípios - replicação e randomização | Tem que satisfazer três princípios que são replicação, randomização e controle local. |
Vantagens da ANOVA em dois sentidos
- No exemplo acima, a idade e o sexo em nosso exemplo - ajudam a reduzir a variação de erros, tornando o design mais eficiente.
- A ANOVA de duas vias nos permite testar o efeito de dois fatores ao mesmo tempo.
Aplicações de ANOVA
- Comparando a quilometragem de diferentes veículos, tipos de combustível e estrada.
- Conhecer o impacto da temperatura, pressão ou concentração química em algumas reações químicas (reatores de potência, usinas químicas, etc.)
- Impacto de diferentes catalisadores nas taxas de reação química
- Compreender o impacto de comerciais e diferentes números de respostas dos clientes.
- Impacto do desempenho, qualidade e rapidez na fabricação da biologia (processo com base no número de células em que são divididas)
Artigos recomendados
Este é um guia para a ANOVA de duas vias na R. Aqui discutimos os exemplos, objetivos, etapas e diferenças entre a ANOVA de mão única e a mão dupla. Você também pode consultar os seguintes artigos para saber mais -
- ANOVA em R
- Como interpretar resultados usando o teste ANOVA
- Regressão vs ANOVA
- GLM em R