Introdução ao aprendizado de máquina não supervisionado

Alguma vez você já pensou em como uma criança é capaz de distinguir maçãs e laranjas quando não sabe o que realmente são, como têm o sabor, mas com base na cor e no tamanho, ele pode separá-las em 2 grupos sem nenhuma informação prévia? Podemos esperar a mesma segmentação que uma criança faz das máquinas se recebermos as informações de cor e tamanho? Vamos ver como podemos fazer isso! Neste tópico, aprenderemos sobre o aprendizado de máquina não supervisionado.

“Aprendizado de máquina”, como o termo sugere, está ensinando máquinas a realizar tarefas semelhantes às humanas e como as pessoas aprendem, seja por alguém ou por observação. O mesmo que os humanos, do jeito que a máquina aprende.

O aprendizado de máquina pode ser dividido em 3 partes: -

  1. Aprendizado supervisionado
  2. Aprendizagem não supervisionada
  3. Aprendizagem por reforço

Tipos de aprendizado de máquina

O aprendizado por reforço é um aprendizado baseado em agentes que envolve recompensa e punição em relação às ações tomadas por um agente. O objetivo final é maximizar a recompensa geral no processo de aprender com o meio ambiente.

Quando você possui dados de entrada e saída, em suma, dados rotulados, por exemplo, com altura e peso para determinar se uma pessoa é homem ou mulher podem ser considerados uma tarefa de aprendizado supervisionado (de alguém no caso de humanos).

Mas em muitos cenários da vida real, esses dados rotulados ou anotados nem sempre estão disponíveis. Muitas vezes enfrentamos problemas de segmentar objetos com base em suas propriedades que não são explicitamente mencionadas. Como resolver este problema? Bem, o aprendizado não supervisionado é a solução.

A Wikipedia diz que o aprendizado não supervisionado é um tipo de aprendizado Hebbian auto-organizado que ajuda a encontrar padrões anteriormente desconhecidos no conjunto de dados sem rótulos pré-existentes. No aprendizado não supervisionado, não temos informações sobre rótulos, mas, ainda assim, queremos obter informações dos dados com base em suas diferentes propriedades.

Tipos de aprendizado de máquina não supervisionado

As tarefas de aprendizado não supervisionado podem ser amplamente divididas em 3 categorias:

  1. Mineração de regra de associação
  2. Agrupamento
  3. Sistema de recomendação

1. Mineração de Regras de Associação

Quando temos dados transacionais para alguma coisa, podem ser produtos vendidos ou qualquer dado transacional relevante, quero saber, existe algum relacionamento oculto entre o comprador e os produtos ou produto para produto, de forma que eu possa, de alguma forma, aproveitar essas informações aumentar minhas vendas. Extrair esses relacionamentos é o núcleo da Mineração de Regras de Associação. Podemos usar os algoritmos de crescimento AIS, SETM, Apriori, FP para extrair relacionamentos.

2. Agrupamento

O armazenamento em cluster pode ser feito com dados em que não temos as informações de classe ou rótulo. Queremos agrupar os dados de modo que as observações com propriedades semelhantes pertençam ao mesmo cluster / grupo e a distância entre agrupamentos seja máxima. Considerando que a distância intra-cluster deve ser mínima. Podemos agrupar os dados do eleitor para descobrir a opinião sobre o governo ou produtos de agrupamento, com base em seus recursos e uso. Segmente a população com base nos recursos de renda ou use o agrupamento em vendas e marketing.

Podemos usar K-Means, K-Means ++, K-Medoids, Fuzzy C-means (FCM),

Maximização de expectativas (EM), Clustering aglomerado, DBSCAN, tipos de Clustering hierárquico como ligação única, ligação completa, ligação mediana, algoritmos do método de Ward para agrupamento.

3. Sistema de Recomendação

O Sistema de Recomendação é basicamente uma extensão da mineração de regras de Associação, no ARM estamos extraindo relacionamentos e no Sistema de Recomendação, estamos usando esses relacionamentos para recomendar algo que está tendo maiores chances de aceitação pelo usuário final. Os sistemas de recomendação ganharam popularidade depois que a Netflix anunciou um grande prêmio de US $ 1.000.000 em 2009.

A recomendação Systems trabalha com dados transacionais, seja transação financeira, comércio eletrônico ou transação de mercearia. Atualmente, empresas gigantes do setor de comércio eletrônico estão atraindo clientes, fazendo uma recomendação personalizada para cada usuário com base em seu histórico de compras anteriores e em dados de compra de comportamento semelhantes de outros usuários.

Os métodos para desenvolver sistemas de recomendação podem ser amplamente divididos em filtragem colaborativa e filtragem baseada em conteúdo. Na filtragem colaborativa novamente, temos filtragem colaborativa usuário-usuário e filtragem colaborativa item-item, que são abordagens baseadas em memória e fatoração de matriz e decomposição de valor singular (SVD) são abordagens baseadas em modelo.

Aplicações da aprendizagem não supervisionada

Como os dados do mundo aumentam tremendamente a cada dia, o aprendizado não supervisionado tem muitos aplicativos. Estamos sempre criando dados usando plataformas de mídia social ou algum conteúdo de vídeo no YouTube e muitas vezes nem fazemos deliberadamente. Todos esses dados não são estruturados e rotulá-los para tarefas de aprendizado supervisionado será cansativo e caro.

A seguir, são apresentadas algumas aplicações interessantes de aprendizado de máquina não supervisionado.

  1. Mercearia ou loja / mercado de comércio eletrônico: Extraia regras de associação dos dados transacionais dos clientes e recomendações para que os consumidores comprem produtos.
  2. Plataforma de mídia social: Extraia relacionamentos com diferentes usuários, para sugerir produtos ou serviços. Recomende novas pessoas para conexão social.
  3. Serviços: recomendações de serviços de viagem, recomendação de casas para alugar ou serviços de casamenteiros.
  4. Bancário: agrupe clientes com base em suas transações financeiras. Transação fraudulenta em cluster para detecção de fraude.
  5. Política: agrupe as opiniões dos eleitores sobre as chances de vitória para um partido em particular.
  6. Visualização de dados: Com agrupamento e incorporação estocástica de vizinhos distribuídos em t (SNE), podemos visualizar dados de alta dimensão. Além disso, isso pode ser usado para redução de dimensionalidade.
  7. Entretenimento: recomendações para filmes, músicas, como Netflix e Amazon estão fazendo.
  8. Segmentação de imagens : agrupe porções de imagens com base nos valores de pixels mais próximos.
  9. Conteúdo: jornais personalizados, recomendações de páginas da Web, aplicativos de e-learning e filtros de e-mail.
  10. Descoberta estrutural: Com o clustering, podemos descobrir qualquer estrutura oculta nos dados.Cluster twitter twitter para análise de sentimentos.

Conclusão

O aprendizado de máquina não supervisionado não é quantificável, mas pode resolver muitos problemas nos quais os algoritmos supervisionados falham. Existem muitos aplicativos para o aprendizado não supervisionado em muitos domínios em que temos dados não estruturados e não rotulados. Podemos usar técnicas de aprendizado não supervisionadas para ensinar nossas máquinas a fazer um trabalho melhor do que nós. Nos últimos anos, as máquinas superaram os humanos em termos de tarefas que são consideradas resolvidas por humanos há séculos. Espero que, com este artigo, você entenda o que é e como técnicas de aprendizado de máquina não supervisionadas podem ser usadas para resolver problemas do mundo real.

Artigos recomendados

Este é um guia para o aprendizado de máquina não supervisionado. Aqui discutimos os tipos de aprendizado de máquina e os tipos de aprendizado de máquina não supervisionado, juntamente com suas aplicações. Você também pode consultar os seguintes artigos para saber mais -

  1. Algoritmos de aprendizado de máquina
  2. O que é aprendizado de máquina?
  3. Introdução ao aprendizado de máquina
  4. Ferramentas de aprendizado de máquina
  5. Clustering no Machine Learning
  6. Aprendizado de máquina com hiperparâmetro
  7. Algoritmo de cluster hierárquico
  8. Clustering hierárquico | Clustering Aglomerativo e Divisivo
  9. As 8 principais etapas do ciclo de vida do Machine Learning

Categoria: