Introdução à Aprendizagem Supervisionada e Aprendizagem Não Supervisionada

Aprendizado supervisionado e aprendizado não supervisionado são tarefas de aprendizado de máquina.
O aprendizado supervisionado é simplesmente um processo de algoritmo de aprendizado do conjunto de dados de treinamento. O aprendizado supervisionado é onde você tem variáveis ​​de entrada e uma variável de saída e usa um algoritmo para aprender a função de mapeamento da entrada para a saída. O objetivo é aproximar a função de mapeamento para que, quando tivermos novos dados de entrada, possamos prever as variáveis ​​de saída para esses dados.

O aprendizado não supervisionado é modelar a estrutura ou distribuição subjacente ou oculta nos dados, para aprender mais sobre os dados. O aprendizado não supervisionado é onde você só tem dados de entrada e nenhuma variável de saída correspondente.

Conjunto de dados de treinamento: um conjunto de exemplos usados ​​para o aprendizado, onde o valor-alvo é conhecido.

Comparações cara a cara entre aprendizado supervisionado e aprendizado não supervisionado (infográficos)

Abaixo está a comparação dos 7 principais entre aprendizado supervisionado e aprendizado não supervisionado

Principais diferenças entre aprendizado supervisionado e aprendizado não supervisionado

Abaixo estão as listas de pontos, descreva as principais diferenças entre aprendizado supervisionado e aprendizado não supervisionado

1. Os algoritmos de aprendizado de máquina descobrem padrões em big data. Esses diferentes algoritmos podem ser classificados em duas categorias, com base na maneira como eles “aprendem” sobre os dados para fazer previsões. Esses são aprendizado supervisionado e não supervisionado.

2. No aprendizado supervisionado, o cientista atua como um guia para ensinar ao algoritmo quais conclusões ou previsões ele deve apresentar. No aprendizado não supervisionado, não há resposta correta, não há professor, os algoritmos são deixados por conta própria para descobrir e apresentar a interessante estrutura oculta nos dados.

3. O modelo de aprendizado supervisionado usará os dados de treinamento para aprender um link entre a entrada e as saídas.

4. O aprendizado não supervisionado não usa dados de saída. No aprendizado não supervisionado, não haverá conhecimento prévio rotulado, enquanto no aprendizado supervisionado terá acesso aos rótulos e conhecimento prévio sobre os conjuntos de dados.

5. Aprendizado supervisionado: A idéia é que o treinamento possa ser generalizado e que o modelo possa ser usado em novos dados com alguma precisão.

6. Algoritmos de aprendizado supervisionados: máquina de vetores de suporte, regressão linear e logística, rede neural, árvores de classificação e floresta aleatória etc.

7. Os algoritmos não supervisionados podem ser divididos em diferentes categorias: algoritmos de cluster, médias K, cluster hierárquico, algoritmos de redução dimensional, detecções de anomalias etc.

8. Área de classificação e regressão algoritmos amplamente utilizados na aprendizagem supervisionada. As Máquinas de Vetor de Suporte (SVM) são modelos de aprendizado de máquina supervisionados com algoritmos de aprendizado associados, que podem ser usados ​​para fins de classificação e regressão, mas principalmente para problemas de classificação.

9. No modelo SVM, plotamos cada item de dados como um ponto no espaço n-dimensional (onde n são os recursos que temos), com os valores de cada recurso sendo o valor de uma coordenada específica. Em seguida, a classificação é realizada pela localização do hiperplano que diferencia as duas classes.

10. O principal objetivo dos algoritmos de regressão é prever o valor discreto ou contínuo. Em alguns casos, o valor previsto pode ser usado para identificar o relacionamento linear entre os atributos. Com base no problema, os algoritmos de regressão da diferença podem ser usados. Alguns dos algoritmos básicos de regressão são regressão linear, regressão polinomial, etc.

11. O agrupamento é amplamente utilizado no aprendizado não supervisionado. O armazenamento em cluster é a tarefa de dividir os pontos de dados em número de grupos, de modo que os mesmos pontos de características estejam juntos na forma de cluster. Existem muitos algoritmos de agrupamento; alguns deles são modelos de conectividade, modelos centróides, modelos de distribuição e modelos de densidade.

12. O agrupamento hierárquico está sob aprendizado não supervisionado. O armazenamento em cluster hierárquico, como o nome sugere, é um algoritmo que constrói a hierarquia de clusters. Esse algoritmo começa com todos os pontos de dados atribuídos a um cluster próprio. Em seguida, dois clusters mais próximos são mesclados no mesmo cluster. No final, esse algoritmo termina quando resta apenas um único cluster.

13.KMeans vem sob o método de cluster não supervisionado. Os dados serão particionados em k clusters, com base em seus recursos. Cada cluster é representado por seu centróide, definido como o centro dos pontos no cluster. O KMeans é simples e rápido, mas não gera o mesmo resultado a cada execução.

14.Para entender melhor o aprendizado supervisionado e o aprendizado não supervisionado, vamos dar exemplos da vida real. Aprendizado supervisionado: tomemos como exemplo a funcionalidade do Gmail, que é um email de spam. Com base nas informações anteriores sobre emails de spam, filtrando um novo email de entrada na pasta Caixa de Entrada ou na Lixeira. Nesse cenário, o Gmail é modelado como uma função de mapeamento para segregar as mensagens recebidas com base no conhecimento prévio sobre as mensagens; isso é um aprendizado supervisionado.

15. Aprendizado não supervisionado: Vamos supor que uma amiga o convide para a festa dela, onde você conhecerá novas pessoas. Agora você os classificará sem nenhum conhecimento prévio (aprendizado não supervisionado) e essa classificação pode ter qualquer característica. Pode ser faixa etária, gênero, vestuário, qualificação educacional ou qualquer outra maneira que você desejar. Como você não usou nenhum conhecimento prévio sobre as pessoas e as classificou, elas ficam sob aprendizado não supervisionado.

Tabela de comparação de aprendizado supervisionado versus aprendizado não supervisionado

Aprendizado supervisionadoAprendizagem não supervisionada

Método

Variáveis ​​de entrada e variáveis ​​de saída serão fornecidas.Somente dados de entrada serão fornecidos

Objetivo

O objetivo do aprendizado supervisionado é determinar a função tão bem que, quando um novo conjunto de dados de entrada fornecido, pode prever a saída.O objetivo de aprendizado não supervisionado é modelar os padrões ocultos ou a estrutura subjacente nos dados de entrada fornecidos para aprender sobre os dados.

Classe

Problemas de aprendizado de máquina, mineração de dados e rede neural,Aprendizado de máquina, mineração de dados, problemas e rede neural

Exemplos

  • Classificação
  • Regressão
  • Regressão linear
  • Máquina de vetor de suporte
  • Agrupamento
  • Associação
  • k-significa
  • Associação
Quem usaCientistas de dadosCientistas de dados

Ecossistemas

Processamento de big data, mineração de dados etc

Processamento de big data, mineração de dados etc

Usos

O aprendizado supervisionado é frequentemente usado para sistemas de exportação em reconhecimento de imagem, reconhecimento de fala, previsão, análise financeira e treinamento de redes neurais e árvores de decisão, etc.

Os algoritmos de aprendizado não supervisionado são usados ​​para pré-processar os dados, durante a análise exploratória ou para pré-treinar algoritmos de aprendizado supervisionado.

Conclusão - Aprendizado supervisionado versus aprendizado não supervisionado

A escolha de usar um algoritmo de aprendizado de máquina supervisionado ou não supervisionado normalmente depende de fatores relacionados à estrutura e volume de seus dados e ao caso de uso. Na realidade, na maioria das vezes, os cientistas de dados usam as abordagens de aprendizado supervisionado e aprendizado não supervisionado juntos para resolver o caso de uso.

Artigo recomendado

Este foi um guia para o aprendizado supervisionado versus o não supervisionado, seu significado, comparação cara a cara, diferenças principais, tabela de comparação e conclusão. Você também pode consultar os seguintes artigos para saber mais -

  1. 7 Melhor Comparação entre Aprendizado Supervisionado vs Aprendizado por Reforço
  2. 5 Diferenças mais úteis entre ciência de dados e aprendizado de máquina
  3. Aprenda a 10 melhor diferença entre Map Reduce vs Yarn
  4. MapReduce vs Apache Spark - 20 comparações úteis para aprender
  5. O que é Aprendizado por Reforço?

Categoria: