Introdução à Classificação de Redes Neurais

As redes neurais são a maneira mais eficiente (sim, você leu certo) de resolver problemas do mundo real em inteligência artificial. Atualmente, é também uma das áreas mais pesquisadas em ciência da computação que uma nova forma de rede neural teria sido desenvolvida enquanto você lê este artigo. Existem centenas de redes neurais para resolver problemas específicos de diferentes domínios. Aqui vamos orientá-lo através de diferentes tipos de redes neurais básicas, na ordem de crescente complexidade.

Diferentes tipos de conceitos básicos na classificação de redes neurais

1. Redes neurais rasas (filtragem colaborativa)

Redes neurais são feitas de grupos de Perceptron para simular a estrutura neural do cérebro humano. As redes neurais rasas têm uma única camada oculta do perceptron. Um dos exemplos comuns de redes neurais rasas é a filtragem colaborativa. A camada oculta do perceptron seria treinada para representar as semelhanças entre as entidades, a fim de gerar recomendações. O sistema de recomendação da Netflix, Amazon, YouTube etc. usa uma versão do filtro Collaborative para recomendar seus produtos de acordo com o interesse do usuário.

2. Perceptron multicamada (redes neurais profundas)

As redes neurais com mais de uma camada oculta são denominadas redes neurais profundas. Alerta de spoiler! Todas as redes neurais a seguir são uma forma de rede neural profunda aprimorada / aprimorada para resolver problemas específicos do domínio. Em geral, eles nos ajudam a alcançar a universalidade. Dado número suficiente de camadas ocultas do neurônio, uma rede neural profunda pode se aproximar, isto é, resolver qualquer problema complexo do mundo real.

O Teorema da Aproximação Universal é o núcleo das redes neurais profundas para treinar e ajustar-se a qualquer modelo. Cada versão da rede neural profunda é desenvolvida por uma camada totalmente conectada do produto combinado máximo de multiplicação de matrizes, que é otimizada por algoritmos de retropropagação. Continuaremos a aprender as melhorias que resultam em diferentes formas de redes neurais profundas.

3. Rede Neural Convolucional (CNN)

As CNNs são a forma mais madura de redes neurais profundas para produzir resultados mais precisos, ou seja, melhores que os humanos em visão computacional. As CNNs são feitas de camadas de convoluções criadas pela digitalização de cada pixel de imagens em um conjunto de dados. À medida que os dados são aproximados camada por camada, a CNN começa a reconhecer os padrões e, assim, os objetos nas imagens. Esses objetos são usados ​​extensivamente em várias aplicações para identificação, classificação, etc. Práticas recentes como transferência de aprendizado nas CNNs levaram a melhorias significativas na imprecisão dos modelos. O Google Translator e o Google Lens são os exemplos mais avançados da CNN.

A aplicação de CNNs é exponencial, pois eles são usados ​​até na solução de problemas que não estão relacionados principalmente à visão computacional. Uma explicação muito simples, porém intuitiva, das CNNs pode ser encontrada aqui.

4. Rede Neural Recorrente (RNN)

RNNs são a forma mais recente de redes neurais profundas para resolver problemas em PNL. Simplificando, as RNNs retornam a saída de algumas camadas ocultas para a camada de entrada para agregar e levar adiante a aproximação para a próxima iteração (época) do conjunto de dados de entrada. Também ajuda o modelo a autoaprender e corrige as previsões mais rapidamente até certo ponto. Esses modelos são muito úteis para entender a semântica do texto nas operações da PNL. Existem diferentes variantes de RNNs, como Memória de Longo Prazo (LSTM), Unidade Recorrente Fechada (GRU), etc. No diagrama abaixo, a ativação de h1 e h2 é alimentada com as entradas x2 e x3, respectivamente.

5. Memória de Longo Prazo (LSTM)

Os LSTMs são projetados especificamente para resolver o problema de gradientes de fuga com a RNN. Os gradientes de fuga ocorrem em grandes redes neurais, onde os gradientes das funções de perda tendem a se aproximar de zero, fazendo com que as redes neurais em pausa aprendam. O LSTM resolve esse problema, impedindo as funções de ativação em seus componentes recorrentes e mantendo os valores armazenados não alterados. Essa pequena mudança deu grandes melhorias no modelo final, resultando em gigantes da tecnologia adaptando o LSTM em suas soluções. Até a ilustração “mais simples e auto-explicativa” do LSTM,

6. Redes baseadas em atenção

Os modelos de atenção estão lentamente assumindo o controle das novas RNNs na prática. Os modelos de Atenção são criados, concentrando-se em parte de um subconjunto das informações fornecidas, eliminando assim a enorme quantidade de informações básicas que não são necessárias para a tarefa em questão. Os modelos de atenção são construídos com uma combinação de atenção e encaixe suave e duro, com atenção suave de propagação traseira. Vários modelos de atenção empilhados hierarquicamente são chamados de Transformer. Esses transformadores são mais eficientes para executar as pilhas em paralelo, a fim de produzir resultados de última geração com dados e tempo comparativamente menores para o treinamento do modelo. Uma distribuição de atenção se torna muito poderosa quando usada com CNN / RNN e pode produzir uma descrição de texto para uma imagem da seguinte maneira.

Gigantes da tecnologia como Google, Facebook etc. estão rapidamente adaptando modelos de atenção para criar suas soluções.

7. Rede Adversarial Generativa (GAN)

Embora os modelos de aprendizado profundo forneçam resultados de última geração, eles podem ser enganados por colegas humanos muito mais inteligentes, adicionando ruído aos dados do mundo real. Os GANs são o mais recente desenvolvimento em aprendizado profundo para lidar com esses cenários. Os GANs usam o aprendizado não supervisionado, onde redes neurais profundas treinam com os dados gerados por um modelo de IA junto com o conjunto de dados real para melhorar a precisão e a eficiência do modelo. Esses dados contraditórios são usados ​​principalmente para enganar o modelo discriminatório, a fim de construir um modelo ideal. O modelo resultante tende a ser uma aproximação melhor do que pode superar esse ruído. O interesse da pesquisa em GANs levou a implementações mais sofisticadas, como GAN Condicional (CGAN), Pirâmide do Laplaciano GAN (LAPGAN), Super Resolução GAN (SRGAN), etc.

Conclusão - Classificação da Rede Neural

As redes neurais profundas têm aumentado os limites dos computadores. Eles não se limitam apenas à classificação (CNN, RNN) ou previsões (Filtragem Colaborativa), mas também à geração de dados (GAN). Esses dados podem variar da bela forma de arte às controversas falsificações profundas, mas estão superando os seres humanos por uma tarefa todos os dias. Portanto, também devemos considerar a ética e os impactos da IA ​​enquanto trabalhamos duro para construir um modelo de rede neural eficiente. Hora de um infográfico puro sobre as redes neurais.

Artigos recomendados

Este é um guia para a classificação da rede neural. Aqui discutimos os diferentes tipos de redes neurais básicas. Você também pode ler nossos artigos para saber mais.

  1. O que são redes neurais?
  2. Algoritmos de redes neurais
  3. Ferramentas de digitalização em rede
  4. Redes Neurais Recorrentes (RNN)
  5. Top 6 Comparações entre CNN vs RNN

Categoria: