Diferença entre aprendizado de máquina e análise preditiva
O aprendizado de máquina é uma área da ciência da computação, que está crescendo cada vez mais atualmente. Progressos recentes em tecnologias de hardware que resultaram em um aumento maciço de potência computacional, como GPU (unidades de processamento gráfico) e avanço em redes neurais, aprendizado de máquina tornou-se uma palavra da moda. Essencialmente, usando técnicas de aprendizado de máquina, podemos construir algoritmos para extrair dados e ver informações ocultas importantes deles. A análise preditiva também faz parte do domínio de aprendizado de máquina, limitado para prever o resultado futuro dos dados com base em padrões anteriores. Embora a análise preditiva esteja em uso há mais de duas décadas, principalmente no setor bancário e financeiro, a aplicação do aprendizado de máquina ganhou destaque recentemente com algoritmos como detecção de objetos a partir de imagens, classificação de texto e sistemas de recomendação.
Machine Learning
O aprendizado de máquina usa internamente os fundamentos de estatística, matemática e ciência da computação para criar lógica para algoritmos que podem fazer classificação, previsão e otimização tanto em tempo real quanto em lote. Classificação e regressão são duas classes principais de um problema no aprendizado de máquina. Vamos entender o Machine Learning e o Predictive Analytics em detalhes.
Classificação
Sob esses intervalos de um problema, tendemos a classificar um objeto com base em suas várias propriedades em uma ou mais classes. Por exemplo, classificar um cliente do banco como elegível para um empréstimo à habitação ou não com base em seu histórico de crédito. Normalmente, teríamos dados transacionais disponíveis para o cliente, como idade, renda, formação educacional, experiência profissional, setor em que trabalha, número de dependentes, despesas mensais, empréstimos anteriores, se houver, padrão de gastos, histórico de crédito, etc. e, com base nessas informações, tenderíamos a calcular se ele deveria receber empréstimo ou não.
Existem muitos algoritmos de aprendizado de máquina padrão usados para resolver o problema de classificação. A regressão logística é um desses métodos, provavelmente o mais amplamente utilizado e o mais conhecido, também o mais antigo. Além disso, também temos alguns dos modelos mais avançados e complicados, que variam de árvore de decisão a floresta aleatória, AdaBoost, XP boost, máquinas de vetores de suporte, feltro ingênuo e rede neural. Desde os últimos dois anos, o aprendizado profundo está em primeiro plano. Normalmente, redes neurais e aprendizado profundo são usados para classificar imagens. Se houver centenas de milhares de imagens de gatos e cães e você quiser escrever um código que possa separar automaticamente imagens de gatos e cães, convém usar métodos de aprendizado profundo, como uma rede neural convolucional. Tocha, café, fluxo de sensores, etc. são algumas das bibliotecas populares em python para aprendizado profundo.
Para medir a precisão dos modelos de regressão, são usadas métricas como taxa de falso positivo, taxa de falso negativo, sensibilidade etc.
Regressão
A regressão é outra classe de problemas no aprendizado de máquina, na qual tentamos prever o valor contínuo de uma variável em vez de uma classe diferente dos problemas de classificação. As técnicas de regressão são geralmente usadas para prever o preço das ações, o preço de venda de uma casa ou carro, a demanda por um determinado item, etc. Quando as propriedades de séries temporais também entram em jogo, os problemas de regressão se tornam muito interessantes para resolver. A regressão linear com mínimos quadrados comuns é um dos algoritmos clássicos de aprendizado de máquina nesse domínio. Para padrão baseado em séries temporais, ARIMA, média móvel exponencial, média móvel ponderada e média móvel simples são usadas.
Para medir a precisão dos modelos de regressão, são utilizadas métricas como erro quadrático médio, erro quadrático médio absoluto, erro quadrático de medida raiz, etc.
Análise preditiva
Existem algumas áreas de sobreposição entre aprendizado de máquina e análise preditiva. Embora técnicas comuns, como logística e regressão linear, estejam sob aprendizado de máquina e análise preditiva, algoritmos avançados como uma árvore de decisão, floresta aleatória etc. são essencialmente aprendizado de máquina. Sob a análise preditiva, o objetivo dos problemas permanece muito estreito, onde a intenção é calcular o valor de uma variável específica em um momento futuro. A análise preditiva é fortemente carregada de estatísticas, enquanto o aprendizado de máquina é mais uma mistura de estatística, programação e matemática. Um analista preditivo típico gasta seu tempo computando t quadrado, f estatísticas, Innova, qui-quadrado ou quadrado mínimo ordinário. Perguntas como se os dados são normalmente distribuídos ou inclinados, se a distribuição t do aluno deve ser usada ou a curva de sinos deve ser usada, se o alfa deve ser tomado em 5% ou 10%, incomoda-os o tempo todo. Eles procuram o diabo em detalhes. Um engenheiro de aprendizado de máquina não se incomoda com muitos desses problemas. Sua dor de cabeça é completamente diferente, eles se vêem presos à melhoria da precisão, minimização de taxas falso-positivas, manuseio externo, normalização de faixa ou validação de k fold.
Um analista preditivo usa principalmente ferramentas como o Excel. O cenário ou a busca de objetivos são seus favoritos. Ocasionalmente, usam VBA ou micros e dificilmente escrevem códigos longos. Um engenheiro de aprendizado de máquina gasta todo o seu tempo escrevendo códigos complicados além do entendimento comum, ele usa ferramentas como R, Python, Saas. A programação é seu principal trabalho, corrigindo bugs e testando nas diferentes paisagens uma rotina diária.
Essas diferenças também trazem uma grande diferença em sua demanda e salário. Embora os analistas preditivos sejam tão ontem, o aprendizado de máquina é o futuro. Um engenheiro de aprendizado de máquina típico ou cientista de dados (como é chamado hoje em dia) recebe entre 60% e 80% a mais do que um engenheiro de software ou analista preditivo típico e é o principal fator no mundo de tecnologia habilitado atualmente. Uber, Amazon e agora carros autônomos também são possíveis apenas por causa deles.
Comparação direta entre aprendizado de máquina e análise preditiva (infográficos)
Abaixo está a comparação dos 7 principais entre Machine Learning e Predictive Analytics
Tabela de comparação Machine Learning vs Predictive Analytics
Abaixo está a explicação detalhada de Machine Learning vs Predictive Analytics
Machine Learning | Análise preditiva |
É um termo geral que abrange vários subcampos, incluindo análise preditiva. | Pode ser tratado como um subcampo do aprendizado de máquina. |
Orientado para codificação intensa. | Principalmente orientado a software padrão, em que um usuário não precisa codificar muito |
Considera-se que é gerado a partir da ciência da computação, ou seja, a ciência da computação pode ser tratada como pai aqui. | As estatísticas podem ser tratadas como pai aqui. |
É a tecnologia de amanhã. | É tão ontem. |
É uma máquina dominada por muitas técnicas difíceis de entender, mas que funcionam como charme, como aprendizado profundo. | É dominado pelo usuário com técnicas que devem ser intuitivas para o usuário entender e implementar. |
Ferramentas como R, Python, SaaS são usadas. | Excel, SPSS, Minitab são usados. |
É muito amplo e em constante expansão. | Tem um escopo e aplicação muito limitados. |
Conclusão - Machine Learning vs Predictive Analytics
A partir da discussão acima sobre o Machine Learning e o Predictive Analytics, fica claro que a análise preditiva é basicamente um subcampo do aprendizado de máquina. O aprendizado de máquina é mais versátil e capaz de resolver uma ampla gama de problemas.
Artigo recomendado
Este foi um guia para o Machine Learning vs o Predictive Analytics, seu significado, comparação cara a cara, diferenças principais, tabela de comparação e conclusão. Você também pode consultar os seguintes artigos para saber mais -
- Aprenda Big Data Vs Machine Learning
- Diferença entre ciência de dados e aprendizado de máquina
- Comparação entre análise preditiva e ciência de dados
- Data Analytics vs Predictive Analytics - Qual é útil