Introdução aos métodos de aprendizado de máquina

O artigo a seguir, Métodos de aprendizado de máquina fornece um resumo dos métodos mais usados ​​no aprendizado de máquina. O aprendizado de máquina é uma técnica que torna um computador capaz de 'aprender' as coisas por conta própria. Os algoritmos melhoram adaptativamente seu desempenho à medida que os dados disponíveis para o aprendizado aumentam. Ou seja, quanto mais dados, mais preciso seria o nosso modelo.

Como as máquinas aprendem?

Existem vários métodos para fazer isso. O método a seguir depende completamente da declaração do problema. Dependendo do conjunto de dados e do nosso problema, existem duas maneiras diferentes de ir mais fundo. Um é aprendizado supervisionado e o outro é aprendizado não supervisionado. A tabela a seguir explica a classificação adicional dos métodos de aprendizado de máquina. Vamos discuti-los um por um.

Veja a tabela a seguir!

Vamos entender o que significa Aprendizado Supervisionado.

Aprendizado supervisionado

Como o nome sugere, imagine um professor ou um supervisor ajudando você a aprender. O mesmo vale para máquinas. Treinamos ou ensinamos a máquina usando dados rotulados.

Algumas das melhores aplicações de aprendizado supervisionado são:

  • Análise de sentimentos (Twitter, Facebook, Netflix, YouTube, etc.)
  • Processamento de linguagem natural
  • Classificação da imagem
  • Análise preditiva
  • Reconhecimento de padrões
  • Detecção de spam
  • Processamento de fala / sequência

Agora, o aprendizado supervisionado é dividido em classificação e regressão. Vamos entender isso.

Classificação

Classificação é o processo de encontrar um modelo que ajude a separar os dados em diferentes classes categóricas. Nesse processo, os dados são categorizados em rótulos diferentes, de acordo com alguns parâmetros fornecidos na entrada e, em seguida, os rótulos são previstos para os dados. Categórico significa que a variável de saída é uma categoria, ou seja, vermelho ou preto, spam ou não spam, diabético ou não diabético, etc.

Os modelos de classificação incluem máquina de vetores de suporte (SVM), vizinho mais próximo K (KNN), Naive Bayes etc.

a) Classificador de máquina de vetor de suporte (SVM)

O SVM é um método de aprendizado supervisionado que analisa os dados e os classifica em uma de duas categorias. Eu uso um hiperplano para categorizar os dados. Um classificador discriminativo linear tenta desenhar uma linha reta que separa os dois conjuntos de dados e, assim, criar um modelo para classificação. Ele simplesmente tenta encontrar uma linha ou curva (em duas dimensões) ou uma variedade (em várias dimensões) que divide as classes umas das outras.

Nota- Para classificação multiclasse, o SVM utiliza 'one vs rest', o que significa calcular diferentes SVM para cada classe.

b) Classificador do vizinho mais próximo K (KNN)

  • Se você ler atentamente, o próprio nome sugere o que o algoritmo faz. O KNN considera os pontos de dados mais próximos, muito mais semelhantes em termos de recursos e, portanto, mais propensos a pertencer à mesma classe que o vizinho. Para qualquer novo ponto de dados, a distância para todos os outros pontos de dados é calculada e a classe é decidida com base em K vizinhos mais próximos. Sim, pode parecer ridículo, mas, para algumas das classificações, funciona como qualquer coisa.
  • Um ponto de dados é classificado pelo número máximo de votos de seus vizinhos e, em seguida, o ponto de dados é atribuído à classe mais próxima entre seus k-vizinhos.
  • No KNN, nenhum aprendizado do modelo é necessário e todo o trabalho acontece no momento em que uma previsão é solicitada. É por isso que o KNN é frequentemente referido como um algoritmo de aprendizado lento.

c) classificador Naïve Bayes

  • Naïve Bayes é um algoritmo de aprendizado de máquina altamente recomendado para problemas de classificação de texto. É baseado no teorema da probabilidade de Bayes. Esses classificadores são chamados ingênuos porque assumem que as variáveis ​​de recursos são independentes umas das outras. Isso significa, por exemplo, que temos uma frase completa para entrada, e então Naïve Bayes assume que cada palavra em uma frase é independente das outras. E depois classifique-os de acordo. Eu sei, parece bastante ingênuo, mas é uma ótima opção para problemas de classificação de texto e é uma escolha popular para classificação de email de spam.
  • Ele fornece diferentes tipos de algoritmos Naive Bayes, como BernoulliNB, GaussianNB, MultinomialNB.
  • Ele considera todos os recursos não relacionados, portanto, não pode aprender a relação entre os recursos. Por exemplo, digamos, Varun gosta de comer hambúrgueres, ele também gosta de comer batatas fritas com coca-cola. Mas ele não gosta de comer um hambúrguer e uma combinação de batata frita com coca-cola juntos. Aqui, Naïve Bayes não pode aprender a relação entre dois recursos, mas apenas aprende apenas a importância dos recursos individuais.

Agora, vamos para o outro lado do nosso método de aprendizado supervisionado, que é uma regressão.

Regressão

Regressão é o processo de encontrar um modelo que ajude a diferenciar os dados usando valores contínuos. Neste, a natureza dos dados previstos é ordenada. Alguns dos modelos de regressão mais utilizados incluem regressão linear, floresta aleatória (árvores de decisão) e redes neurais.

Regressão linear

  • Uma das abordagens mais simples da aprendizagem supervisionada, útil na previsão da resposta quantitativa.
  • A regressão linear inclui encontrar a linha reta mais adequada através dos pontos. A linha de melhor ajuste é chamada de linha de regressão. A linha de melhor ajuste não passa exatamente por todos os pontos de dados, mas tenta o melhor para se aproximar deles.
  • É o algoritmo amplamente utilizado para dados contínuos. No entanto, ele se concentra apenas na média da variável dependente e se limita a um relacionamento linear.
  • A regressão linear pode ser usada para séries temporais, previsão de tendências. Pode prever vendas futuras, com base nos dados anteriores.

Aprendizagem não supervisionada

  • A aprendizagem não supervisionada baseia-se na abordagem que pode ser considerada como a ausência de um professor e, portanto, de medidas de erro absoluto. É útil quando é necessário aprender o agrupamento ou agrupamento de elementos. Os elementos podem ser agrupados (agrupados) de acordo com sua similaridade.
  • No aprendizado não supervisionado, os dados são sem rótulo, não categorizados e os algoritmos do sistema atuam nos dados sem treinamento prévio. Os algoritmos de aprendizado não supervisionado podem executar tarefas mais complexas do que os algoritmos de aprendizado supervisionado.
  • O aprendizado não supervisionado inclui agrupamento, que pode ser feito usando K significa agrupamento hierárquico, mistura gaussiana e modelo Markov oculto.

As aplicações de aprendizado não supervisionado são:

  1. Detecção de similaridade
  2. Rotulagem automática
  3. Segmentação de objetos (como Pessoa, Animal, Filmes)

Agrupamento

  • O clustering é uma técnica de aprendizado não supervisionado usada para análise de dados em muitos campos. O algoritmo de agrupamento é útil quando queremos obter informações detalhadas sobre nossos dados.
  • Um exemplo real de clustering seria os clusters de gênero da Netflix, que são divididos para diferentes clientes-alvo, incluindo interesses, dados demográficos, estilos de vida etc. Agora, você pode pensar em quão útil é o clustering quando as empresas querem entender sua base de clientes e atingir um novo potencial. clientes.

a) K significa agrupamento

  • K significa que o algoritmo de agrupamento tenta dividir os dados desconhecidos em clusters. Ele seleciona aleatoriamente o centróide de clusters 'k', calcula a distância entre os pontos de dados e o centróide de clusters e, finalmente, atribui o ponto de dados ao centróide de cluster cuja distância é mínima de todos os centróides de cluster.
  • Em k-médias, os grupos são definidos pelo centróide mais próximo de cada grupo. Esse centróide atua como o 'cérebro' do algoritmo, eles adquirem os pontos de dados mais próximos deles e os adicionam aos clusters.

b) Clustering hierárquico

O armazenamento em cluster hierárquico é quase semelhante ao armazenamento em cluster normal, a menos que você queira construir uma hierarquia de clusters. Isso pode ser útil quando você deseja decidir o número de clusters. Por exemplo, suponha que você esteja criando grupos de itens diferentes no supermercado online. Na página inicial, você deseja alguns itens amplos e depois de clicar em um dos itens, categorias específicas, ou seja, clusters mais específicos, são abertos.

Redução de dimensionalidade

A redução de dimensionalidade pode ser considerada como compactação de um arquivo. Significa retirar informações que não são relevantes. Reduz a complexidade dos dados e tenta manter os dados significativos. Por exemplo, na compactação de imagem, reduzimos a dimensionalidade do espaço em que a imagem permanece como está, sem destruir muito o conteúdo significativo da imagem.

PCA para visualização de dados

A análise de componentes principais (PCA) é um método de redução de dimensão que pode ser útil para visualizar seus dados. O PCA é usado para compactar dados dimensionais mais altos para dados dimensionais inferiores, ou seja, podemos usar o PCA para reduzir dados quadridimensionais em três ou duas dimensões, para que possamos visualizar e entender melhor os dados.

Artigos recomendados

Este é um guia para Métodos de aprendizado de máquina. Aqui discutimos uma introdução, Como as máquinas aprendem? classificações de aprendizado de máquina e um fluxograma junto com uma explicação detalhada. Você também pode consultar nossos outros artigos sugeridos para saber mais -

  1. Arquitetura de aprendizado de máquina
  2. Estruturas de aprendizado de máquina
  3. Ferramentas de aprendizado de máquina
  4. Técnicas de aprendizado de máquina
  5. Aprendizado de máquina com hiperparâmetro
  6. Algoritmo de cluster hierárquico
  7. Clustering hierárquico | Clustering Aglomerativo e Divisivo

Categoria: