Introdução à regressão multivariada

  • O termo no modelo de médias multivariadas com mais de uma variável
  • A regressão multivariada faz parte das estatísticas multivariadas.
  • A regressão multivariada é uma técnica usada para estimar um único modelo de regressão quando há mais de uma variável de resultado.
  • A regressão multivariada costumava usar um algoritmo de aprendizado de máquina que é um algoritmo de aprendizado supervisionado.

Por que o modelo único de regressão não funciona?

  • Como se sabe, a análise de regressão é usada principalmente para explorar a relação entre uma variável dependente e independente.
  • No mundo real, existem muitas situações em que muitas variáveis ​​independentes são influenciadas por outras variáveis, para que tenhamos que mudar para opções diferentes de um único modelo de regressão que só pode receber uma variável independente.

O que é regressão multivariada?

  • A regressão multivariada ajuda a medir o ângulo de mais de uma variável independente e de mais de uma variável dependente. Encontra a relação entre as variáveis ​​(linearmente relacionadas).
  • Ele costumava prever o comportamento da variável de resultado e a associação de variáveis ​​preditoras e como as variáveis ​​preditoras estão mudando.
  • Pode ser aplicado a muitos campos práticos, como política, economia, medicina, trabalhos de pesquisa e muitos tipos diferentes de negócios.
  • A regressão multivariada é uma extensão simples da regressão múltipla.
  • A regressão múltipla é usada para prever e trocar os valores de uma variável com base no valor coletivo de mais de um valor das variáveis ​​preditoras.
  • Primeiro, daremos um exemplo para entender o uso da regressão multivariada e, em seguida, procuraremos a solução para esse problema.

Exemplos de regressão multivariada

  • Se a empresa de comércio eletrônico coletou os dados de seus clientes, como idade, histórico de compra de um cliente, gênero e empresa, deseja encontrar o relacionamento entre esses diferentes dependentes e variáveis ​​independentes.
  • Um instrutor de academia coletou os dados de seu cliente que estão chegando à academia e deseja observar algumas coisas do cliente que são saúde, hábitos alimentares (que tipo de produto o cliente está consumindo toda semana), o peso do cliente. Isso quer encontrar uma relação entre essas variáveis.

Como você viu nos dois exemplos acima, em ambas as situações há mais de uma variável, algumas são dependentes e outras são independentes; portanto, uma única regressão não é suficiente para analisar esse tipo de dados.

Aqui está a regressão multivariada que entra em cena.

1. Seleção de recursos -

A seleção de recursos desempenha o papel mais importante na regressão multivariada.

Localizando o recurso necessário para localizar qual variável depende desse recurso.

2. Recursos de normalização -

Para melhores análises, é necessário dimensionar os recursos para colocá-los em um intervalo específico. Também podemos alterar o valor de cada recurso.

3. Selecione a função Perda e Hipótese -

A função de perda calcula a perda quando a hipótese prevê o valor errado.

E hipótese significa valor previsto da variável de recurso.

4. Definir parâmetros de hipótese -

Defina o parâmetro de hipótese que pode reduzir a função de perda e prever.

5. Minimize a função de perda

Minimizar a perda usando algum algoritmo de minimização de perdas e usá-lo sobre o conjunto de dados, o que pode ajudar a ajustar os parâmetros da hipótese. Uma vez que a perda é minimizada, ela pode ser usada para previsão.

Existem muitos algoritmos que podem ser usados ​​para reduzir a perda, como a descida do gradiente.

6. Teste a função de hipótese -

Verifique a função de hipótese, se está correta, prevendo valores, teste-a com dados de teste.

Etapas para seguir a regressão multivariada do arquivo morto

1) Importe as bibliotecas comuns necessárias, como numpy, pandas

2) Leia o conjunto de dados usando a biblioteca dos pandas

3) Como discutimos acima, precisamos normalizar os dados para obter melhores resultados. Por que normalização, porque cada recurso tem uma faixa de valores diferente.

4) Crie um modelo que possa arquivar a regressão se você estiver usando regressão linear, use a equação

Y = mx + c

Na qual x recebe entrada, m é uma linha de slop, c é constante, y é a variável de saída.

5) Treine o modelo usando o hiperparâmetro. Entenda o hiperparâmetro definido de acordo com o modelo. Como taxa de aprendizado, épocas, iterações.

6) Como discutido acima, como a hipótese desempenha um papel importante na análise, verifica a hipótese e mede a função de perda / custo.

7) A função de perda / custo nos ajudará a medir como o valor da hipótese é verdadeiro e preciso.

8) Minimizar a função de perda / custo ajudará o modelo a melhorar a previsão.

9) A equação de perda pode ser definida como uma soma da diferença ao quadrado entre o valor previsto e o valor real dividido por duas vezes o tamanho do conjunto de dados.

10) Para minimizar a função Perder / custo, use a descida em gradiente, ela começa com um valor aleatório e encontra o ponto em que sua função de perda é menor.

Seguindo o exemplo acima, podemos implementar a regressão multivariada

Vantagens da regressão multivariada

  • A técnica multivariada permite encontrar uma relação entre variáveis ​​ou características
  • Ajuda a encontrar uma correlação entre variáveis ​​independentes e dependentes.

Des vantagens da regressão multivariada

  • Técnicas multivariadas são um cálculo matemático um pouco complexo e de alto nível
  • A saída do modelo de regressão multivariada não é facilmente interpretável e, às vezes, porque algumas saídas de perda e erro não são idênticas.
  • Ele não pode ser aplicado a um pequeno conjunto de dados porque os resultados são mais diretos em conjuntos de dados maiores.

Conclusão - Regressão multivariada

  • O principal objetivo do uso da regressão multivariada é quando você tem mais de uma variável disponível e, nesse caso, a regressão linear única não funciona.
  • Principalmente o mundo real tem múltiplas variáveis ​​ou características quando várias variáveis ​​/ características entram em jogo. A regressão multivariada é usada.

Artigos recomendados

Este é um guia para a regressão multivariada. Aqui discutimos a introdução, exemplos de regressão multivariada, juntamente com as vantagens e desvantagens. Você também pode consultar nossos outros artigos sugeridos para saber mais -

  1. Fórmula de regressão
  2. Curso de Ciência de Dados em Londres
  3. Operadores SAS
  4. Técnicas de Ciência de Dados
  5. Variáveis ​​em JavaScript
  6. Principais diferenças entre regressão e classificação

Categoria: