Fórmula de Outliers (Sumário)

  • Fórmula de Outliers
  • Exemplos de fórmula de Outliers (com modelo do Excel)

Fórmula de Outliers

Nas estatísticas, os Outliers são os dois pontos incomuns extremamente distantes nos conjuntos de dados fornecidos. Os valores extremamente alto e extremamente baixo são os valores extremos de um conjunto de dados. Isso é muito útil para encontrar qualquer falha ou erro que ocorreu. Simplesmente como o nome diz, Outliers são valores que estavam fora dos demais valores no conjunto de dados. Por exemplo, considere os estudantes de engenharia e imagine que eles tinham anões em sua classe. Portanto, os anões são as pessoas com altura extremamente baixa quando comparadas com outras pessoas normais. Portanto, esse é o valor externo dessa classe. Valores extremos podem ser calculados usando o método Tukey.

A fórmula para Outliers -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Exemplos de fórmula de Outliers (com modelo do Excel)

Vamos dar um exemplo para entender melhor o cálculo da fórmula Outliers.

Você pode fazer o download deste modelo de Outliers aqui - Modelo de Outliers

Fórmula de Outliers - Exemplo # 1

Considere o seguinte conjunto de dados e calcule os outliers para o conjunto de dados.

Conjunto de dados = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Ordem crescente do conjunto de dados:

O conjunto de dados da mediana da ordem crescente é calculado como:

Nesse conjunto de dados, o número total de dados é 11. Então n = 11. Mediana = 11 + 1/2 = 12/2 = 6. Portanto, o valor que está na 6ª posição nesse conjunto de dados é a mediana.

Valor mediano = 34.

Divida o conjunto de dados em duas metades usando a mediana.

A mediana do conjunto de dados da metade inferior e da metade superior é calculada como:

  • Na metade inferior 2, 5, 6, 7, 23, se encontrarmos a mediana como encontramos na etapa 2, o valor mediano seria 6. Então Q1 = 6.
  • Na metade superior, 45, 56, 89, 98.309, se encontrarmos a mediana como encontramos na etapa 2, o valor mediano seria 89. Então, Q3 = 89.

O IQR é calculado usando a fórmula abaixo

IQR = Q3 - Q1

  • IQR = 89 -6
  • IQR = 83

O valor mínimo inferior é calculado usando a fórmula abaixo

Outlier inferior = Q1 - (1, 5 * IQR)

  • Outlier inferior = 6 - (1, 5 * 83)
  • Menor Outlier = -118, 5

Outlier superior é calculado usando a fórmula abaixo

Outlier superior = Q3 + (1, 5 * IQR)

  • Outlier superior = 89 + (1, 5 * 83)
  • Maior Outlier = 213, 5

Agora, busque esses valores no conjunto de dados -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213, 5, 309. Valores que caem abaixo no valor do lado inferior e acima no lado mais alto são o valor externo. Para esse conjunto de dados, 309 é o discrepante.

Fórmula de Outliers - Exemplo # 2

Considere o seguinte conjunto de dados e calcule os outliers para o conjunto de dados.

Conjunto de dados = 45, 21, 34, 90, 109.

Ordem crescente do conjunto de dados:

O conjunto de dados da mediana da ordem crescente é calculado como:

Nesse conjunto de dados, o número total de dados é 5. Então n = 5. Mediana = 5 + 1/2 = 6/2 = 3. Portanto, o valor que está na 3ª posição nesse conjunto de dados é a mediana.

Valor mediano = 45.

Divida o conjunto de dados em duas metades usando a mediana.

A mediana do conjunto de dados da metade inferior e da metade superior é calculada como:

  • Q1 = 27, 5
  • Q3 = 89

O IQR é calculado usando a fórmula abaixo

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

O valor mínimo inferior é calculado usando a fórmula abaixo

Outlier inferior = Q1 - (1, 5 * IQR)

  • Outlier inferior = 27, 5 - (1, 5 * 72)
  • Menor Outlier = -80, 5

Outlier superior é calculado usando a fórmula abaixo

Outlier superior = Q3 + (1, 5 * IQR)

  • Outlier superior = 99, 5 + (1, 5 * 72)
  • Maior Outlier = 207, 5

Explicação

Etapa 1: organize todos os valores no conjunto de dados fornecido em ordem crescente.

Etapa 2: encontre o valor mediano dos dados classificados. A mediana pode ser encontrada usando a seguinte fórmula. O cálculo a seguir simplesmente fornece a posição do valor mediano que reside na data definida.

Mediana = (n + 1) / 2

Onde n é o número total de dados disponíveis no conjunto de dados.

Etapa 3: encontre o valor mais baixo do quartil Q1 no conjunto de dados. Para descobrir isso, usando o valor mediano, divida o conjunto de dados em duas metades. No conjunto de valores da metade inferior, encontre a mediana do conjunto inferior, que é o valor Q1.

Etapa 4: encontre o valor superior do quartil Q3 no conjunto de dados. É exatamente como o passo acima. Em vez da metade inferior, temos que seguir o mesmo procedimento no conjunto de valores da metade superior.

Etapa 5: Encontre o valor IQR da Faixa Interquartil. Para encontrar o valor Deduzir Q1 de Q3.

IQR = Q3-Q1

Etapa 6: encontre o valor do Inner Extreme. Um fim que fica fora do lado inferior, que também pode ser chamado de menor discrepante. Multiplique o valor IQR por 1, 5 e deduza esse valor de Q1 para obter o extremo inferior interno.

Outlier inferior = Q1 - (1, 5 * IQR)

Etapa 7: encontre o valor Outer Extreme. Um fim que fica fora do lado superior, que também pode ser chamado de um grande desvio. Multiplique o valor IQR por 1, 5 e some esse valor com Q3 para obter o extremo exterior mais alto.

Outlier superior = Q3 + (1, 5 * IQR)

Etapa 8: os valores que ficam fora desses extremos interno e externo são os valores extremos para o conjunto de dados fornecido.

Relevância e Usos da Fórmula Outliers

Os valores discrepantes são muito importantes em qualquer problema de análise de dados. Outlier mostra inconsistência em qualquer conjunto de dados, pois é definido como valores distantes incomuns no conjunto de dados de um para outro. Isso é muito útil para encontrar falhas que ocorreram no conjunto de dados. Como quando você coloca um erro no conjunto de dados, ele afeta a média e a mediana, portanto, pode haver grandes desvios no resultado se Outliers estiverem no conjunto de dados. Por isso, é essencial descobrir Outliers a partir do conjunto de dados para evitar problemas sérios na análise estatística.

Artigos recomendados

Este foi um guia para a fórmula de Outliers. Aqui discutimos como calcular os Outliers, juntamente com exemplos práticos e modelo de excel para download. Você também pode consultar os seguintes artigos para saber mais -

  1. Guia para Midrange Formula
  2. Exemplos de fórmula salarial
  3. Calculadora para a fórmula DPMO
  4. Como calcular a distribuição T?
  5. Fórmula de desvio de quartil | Exemplos