O que é uma rede neuronal?

Uma explicação clara e acessível a iniciantes sobre o que é uma rede neuronal, como funciona e porque sustenta a IA moderna.

Uma rede neuronal é um tipo de modelo de aprendizagem automática composto por camadas de unidades computacionais simples, chamadas neurónios ou nós, ligados entre si com forças ajustáveis chamadas pesos. Cada neurónio recebe números, multiplica-os pelos pesos, soma um viés e passa o resultado por uma função não linear. Ao empilhar muitas dessas camadas, uma rede neuronal pode aprender a mapear entradas complexas, como píxeis, palavras ou formas de onda de áudio, em resultados como etiquetas de classe, frases traduzidas ou imagens geradas.

Como funciona uma rede neuronal

Durante o treino, a rede recebe exemplos (por exemplo, milhares de fotos etiquetadas como "gato" ou "cão") e produz uma previsão. Uma função de perda mede o quão errada está essa previsão, e um algoritmo chamado retropropagação calcula como cada peso na rede contribuiu para o erro. Um otimizador, tipicamente uma variante do gradiente descendente, ajusta depois ligeiramente cada peso para reduzir o erro. Repetir este processo ao longo de muitos exemplos faz com que os pesos da rede estabilizem em valores que capturam regularidades estatísticas úteis nos dados.

A profundidade de uma rede importa: as primeiras camadas tendem a aprender características simples, como contornos ou traços de letras, enquanto as camadas mais profundas combinam essas características em conceitos mais ricos, como formas, palavras ou objetos. Esta hierarquia de representações é o que torna as redes neuronais profundas tão eficazes em tarefas de perceção. Uma visão geral amplamente citada da arquitetura e do algoritmo de aprendizagem está disponível na revisão de aprendizagem profunda de LeCun, Bengio e Hinton, publicada na Nature em 2015.

Porque é importante

As redes neuronais sustentam a maioria das capacidades de IA que se tornaram correntes na década de 2020, incluindo classificação de imagens, reconhecimento de voz, tradução automática, sistemas de recomendação e modelos de linguagem de grande escala, como os modelos por trás dos assistentes conversacionais. Destacam-se em problemas onde regras escritas à mão são frágeis, mas existem grandes quantidades de dados etiquetados ou não etiquetados, porque a mesma arquitetura pode ser retreinada para novos domínios com relativamente poucas alterações ao código.

Tipos principais

  • Rede neuronal feedforward (FNN): A forma mais simples; os sinais movem-se numa só direção, da entrada para a saída. Um perceptrão multicamada é o exemplo canónico.
  • Rede neuronal convolucional (CNN): Utiliza filtros de pesos partilhados, ideais para imagens e vídeo.
  • Rede neuronal recorrente (RNN): Tem ciclos que retêm memória de passos anteriores, adequada para sequências como texto ou dados de sensores; em grande parte substituída pelos transformers na linguagem.
  • Transformer: Uma arquitetura moderna baseada em atenção em vez de recorrência. É a espinha dorsal dos atuais modelos de linguagem de grande escala e de muitos sistemas de visão.
  • Rede generativa adversária (GAN): Emparelha um gerador com um discriminador que aprende a distinguir amostras reais de falsas, usada para síntese de imagens.

Cada variante reorganiza ou especializa a receita básica de neurónios e pesos para se adequar a um tipo particular de dados, mas o princípio subjacente — aprender pesos por gradiente descendente sobre uma perda — mantém-se o mesmo.

You might also like

Artigos relacionados