Introdução à regressão polinomial

Regressão é definida como o método para encontrar a relação entre as variáveis ​​independentes e dependentes para prever o resultado. O primeiro modelo de regressão polinomial foi usado em 1815 por Gergonne. É usado para encontrar a melhor linha de ajuste usando a linha de regressão para prever os resultados. Existem muitos tipos de técnicas de regressão, a regressão polinomial é uma delas. Antes de entender isso, é aconselhável ter um conhecimento adequado da regressão linear, para que seja fácil marcar as diferenças entre elas.

Por que regressão polinomial?

  • Essa é uma das técnicas de regressão utilizadas pelos profissionais para prever o resultado. É definido como o relacionamento entre as variáveis ​​independentes e dependentes quando a variável dependente está relacionada à variável independente que possui um enésimo grau. Não requer que o relacionamento entre variáveis ​​dependentes e independentes seja linear; portanto, se a linha for uma curva, poderá ter qualquer termo polinomial.
  • A principal diferença entre regressão linear e polinomial é que a regressão linear exige que as variáveis ​​dependentes e independentes sejam relacionadas linearmente, enquanto isso pode se ajustar melhor à linha se incluirmos um grau mais alto no termo da variável independente na equação. A equação da regressão polinomial com um enésimo grau pode ser escrita como:

Y = b0 + a1x + a2x 2 + a3x 3 +…. ans n

  • Se adicionarmos graus mais altos, como quadráticos, ela transforma a linha em uma curva que melhor se ajusta aos dados. Geralmente, é usado quando os pontos no conjunto de dados estão dispersos e o modelo linear não é capaz de descrever o resultado claramente. Devemos sempre manter um olho em Sobreajuste e Soberbaço, considerando esses graus na equação.
  • É melhor considerar o grau que passa por todos os pontos de dados, mas, às vezes, um grau mais alto, como 10 ou 20, pode passar por todos os pontos de dados e reduzir o erro, mas também captura o ruído dos dados que estão superando o modelo e isso pode ser evitado adicionando mais amostras ao conjunto de dados de treinamento. Portanto, é sempre aconselhável escolher um grau ideal para se ajustar ao modelo.

Existem duas técnicas usadas para decidir o grau da equação:

  • Seleção direta: é o método de aumentar o grau até que seja significativo o suficiente para definir o modelo.
  • Seleção para trás: é o método de diminuir o grau até que seja significativo o suficiente para definir o modelo.

Procedimento para aplicar regressão polinomial

Encontre as etapas ou o procedimento abaixo para aplicar a regressão polinomial a qualquer conjunto de dados:

Etapa 1: importe o respectivo conjunto de dados para qualquer plataforma (R ou Python) e instale os pacotes necessários para a aplicação do modelo.

Etapa 2: divida o conjunto de dados em conjuntos de treinamento e teste para que possamos aplicar o algoritmo ao conjunto de dados de treinamento e testá-lo usando o conjunto de dados de teste.

Etapa 3: aplique métodos de análise exploratória de dados para estudar o plano de fundo dos dados, como média, mediana, modo, primeiro quartil, segundo quartil, etc.

Etapa 4: aplique o algoritmo de regressão linear ao conjunto de dados e estude o modelo.

Etapa 5: aplique o algoritmo de regressão polinomial ao conjunto de dados e estude o modelo para comparar os resultados RMSE ou R quadrado entre regressão linear e regressão polinomial.

Etapa 6: visualize e preveja os resultados da regressão linear e polinomial e identifique qual modelo prediz o conjunto de dados com melhores resultados.

Regressão polinomial Usos

  • É usado em muitos procedimentos experimentais para produzir o resultado usando esta equação.
  • Ele fornece um ótimo relacionamento definido entre as variáveis ​​independentes e dependentes.
  • É usado para estudar os isótopos dos sedimentos.
  • É usado para estudar o surgimento de diferentes doenças em qualquer população.
  • É usado para estudar a geração de qualquer síntese.

Características da regressão polinomial

  • É um tipo de método de regressão não linear que nos diz a relação entre a variável independente e a dependente quando a variável dependente está relacionada à variável independente do enésimo grau.
  • A melhor linha de ajuste é decidida pelo grau da equação de regressão polinomial.
  • O modelo derivado da regressão polinomial é afetado pelos outliers, portanto, é sempre melhor tratar os outliers antes de aplicar o algoritmo ao conjunto de dados.
  • A função Polynomialfeature () se converte em um recurso da matriz, dependendo do grau da equação.
  • A natureza da curva pode ser estudada ou visualizada usando um gráfico de dispersão simples, que lhe dará uma idéia melhor sobre a relação de linearidade entre as variáveis ​​e decidirá em conformidade.

Conclusão

A regressão polinomial é usada em muitas organizações quando identificam um relacionamento não linear entre as variáveis ​​independentes e dependentes. É uma das técnicas de regressão difíceis em comparação com outros métodos de regressão; portanto, ter um conhecimento profundo sobre a abordagem e o algoritmo ajudará você a obter melhores resultados.

Artigos recomendados

Este é um guia para uma regressão polinomial. Aqui discutimos os recursos e os usos da regressão polinomial. Você também pode consultar nossos outros artigos sugeridos para saber mais:

  1. Algoritmo SVM
  2. Métodos do Kernel
  3. Função PROJ.LIN Excel
  4. Algoritmos de aprendizado de máquina
  5. Regressão linear vs regressão logística | Principais diferenças

Categoria: