Fórmula do Coeficiente de Determinação (Sumário)
- Fórmula
- Exemplos
Qual é a fórmula do coeficiente de determinação?
Em estatística, o coeficiente de determinação, também denominado R2, é uma ferramenta que determina e avalia a capacidade de um modelo estatístico para explicar e prever resultados futuros. Em outras palavras, se tivermos a variável dependente y e a variável independente x em um modelo, então R2 ajudará a determinar a variação em y pela variação x. É um dos principais resultados da análise de regressão e é usado quando queremos prever o futuro ou testar alguns modelos com informações relacionadas. O valor de R2 fica entre 0 e 1 e maior que o valor de R2, melhor será a previsão e a força do modelo. R2 é muito semelhante ao coeficiente de correlação, uma vez que o coeficiente de correlação mede a associação direta de duas variáveis. R2 é basicamente um quadrado de um coeficiente de correlação.
Fórmula para coeficiente de determinação:
Existem várias fórmulas para calcular o coeficiente de determinação:
- Usando o coeficiente de correlação:
Correlation Coefficient = Σ ((X – X m ) * (Y – Y m )) / √ (Σ (X – X m ) 2 * Σ (Y – Y m ) 2 )
Onde:
- X - pontos de dados no conjunto de dados X
- Y - Pontos de dados no conjunto de dados Y
- X m - Média do conjunto de dados X
- Y m - Média do conjunto de dados Y
então
Coefficient of Determination(R 2 ) = (Correlation Coefficient) 2
- Usando saídas de regressão
Coeficiente de determinação (R 2 ) = variação explicada / variação total
Coeficiente de determinação (R 2 ) = MSS / TSS
Coefficient of Determination (R 2 ) = (TSS – RSS) / TSS
Onde:
- TSS - Soma total de quadrados = Σ (Yi - Ym) 2
- MSS - Modelo de soma dos quadrados = Σ (Y - Ym) 2
- RSS - Soma residual de quadrados = Σ (Yi - Y ^) 2
Y é o valor previsto do modelo, Yi é o i-ésimo valor e Ym é o valor médio
Exemplos de fórmula de coeficiente de determinação (com modelo do Excel)
Vamos dar um exemplo para entender melhor o cálculo do coeficiente de determinação.
Você pode fazer o download deste modelo de Excel de fórmula de coeficiente de determinação aqui - Modelo de Excel de fórmula de coeficiente de determinaçãoCoeficiente de Fórmula de Determinação - Exemplo # 1
Digamos que temos dois conjuntos de dados X e Y e cada um contém 20 pontos de dados aleatórios. Calcule o coeficiente de determinação para o conjunto de dados X e Y.
A média é calculada como:
- Média do conjunto de dados X = 48, 7
- Média do conjunto de dados Y = 42, 1
Agora, precisamos calcular a diferença entre os pontos de dados e o valor médio.
Da mesma forma, calcule para todo o conjunto de dados de X.
Da mesma forma, calcule-o para o conjunto de dados Y também.
Calcule o quadrado da diferença para os conjuntos de dados X e Y.
Multiplique a diferença em X com Y.
O coeficiente de correlação é calculado usando a fórmula abaixo
Coeficiente de correlação = Σ ((X - X m ) * (Y - Y m )) / √ (Σ (X - X m ) 2 * Σ (Y - Y m ) 2 )
O coeficiente de determinação é calculado usando a fórmula abaixo
Coeficiente de Determinação = (Coeficiente de Correlação) 2
Coeficiente de determinação = 13, 69%
Coeficiente de Fórmula de Determinação - Exemplo # 2
Digamos que você seja um investidor muito avesso ao risco e deseja investir dinheiro no mercado de ações. Você não tem certeza em quais ações investir e também seu apetite por risco é baixo. Então, você deseja investir em uma ação que seja segura e possa imitar o desempenho do índice. Seu amigo, que é um investidor ativo, selecionou três ações para você, com base em informações técnicas e fundamentais, e você deseja escolher duas ações entre essas três.
Você também coletou informações sobre seus retornos históricos nos últimos 15 anos.
O coeficiente de correlação é calculado usando a fórmula do excel
O coeficiente de determinação é calculado usando a fórmula abaixo
Coeficiente de Determinação = (Coeficiente de Correlação) 2
Com base nas informações, você escolherá as ações ABC e XYZ para investir, pois elas têm o maior coeficiente de determinação.
Explicação
O coeficiente de determinação, conforme explicado acima, é o quadrado da correlação entre dois conjuntos de dados. Se R2 for 0, significa que não há correlação e a variável independente não pode prever o valor da variável dependente. Da mesma forma, se seu valor for 1, significa que a variável independente sempre terá êxito na previsão da variável dependente. Mas existem algumas limitações também. Embora nos diga a correlação entre dois conjuntos de dados, não nos diz se esse valor é suficiente ou não.
Além disso, o grande valor R2 nem sempre implica que as 2 variáveis têm fortes relacionamentos e isso pode ser um acaso. Por exemplo: digamos que o valor de R2 entre um número de carros vendidos em um ano e o número de caixas de sorvete vendidas em um ano seja de 80%. Mas não há relação entre esses dois. Portanto, deve-se ter muito cuidado ao usar R2 e entender primeiro os dados e depois aplicar o método
Relevância e usos da fórmula do coeficiente de determinação
Existem muitas aplicações práticas de R2. Por exemplo, o R2 é muito comumente usado pelos investidores para comparar o desempenho de seu portfólio com o mercado e tentar prever direções futuras também. Da mesma forma, os Hedge Funds usam R2 os ajudam a modelar o risco em seus modelos. Mas, em última análise, o resultado é baseado em números puros e estatísticas que podem ser enganosas às vezes. Como mencionado acima, é preciso verificar primeiro se a saída do R2 faz sentido na vida real ou não.
Artigos recomendados
Este foi um guia para a fórmula do coeficiente de determinação. Aqui discutimos como calcular o coeficiente de determinação, juntamente com exemplos práticos e modelo de excel para download. Você também pode consultar os seguintes artigos para saber mais -
- Guia para a fórmula de prêmio de risco de mercado
- Exemplos de fórmula da taxa de cobertura
- Calculadora para fórmula de custeio baseado em atividade
- Como calcular a taxa de informações usando a fórmula?