📖

O que é Neural Network?

Uma explicação clara e acessível a iniciantes sobre o que é uma rede neuronal, como funciona e porque sustenta a IA moderna.

Uma rede neuronal é um tipo de modelo de aprendizagem automática composto por camadas de unidades computacionais simples, chamadas neurónios ou nós, ligados entre si com forças ajustáveis chamadas pesos. Cada neurónio recebe números, multiplica-os pelos pesos, soma um viés e passa o resultado por uma função não linear. Ao empilhar muitas dessas camadas, uma rede neuronal pode aprender a mapear entradas complexas, como píxeis, palavras ou formas de onda de áudio, em resultados como etiquetas de classe, frases traduzidas ou imagens geradas.

Como funciona uma rede neuronal

Durante o treino, a rede recebe exemplos (por exemplo, milhares de fotos etiquetadas como "gato" ou "cão") e produz uma previsão. Uma função de perda mede o quão errada está essa previsão, e um algoritmo chamado retropropagação calcula como cada peso na rede contribuiu para o erro. Um otimizador, tipicamente uma variante do gradiente descendente, ajusta depois ligeiramente cada peso para reduzir o erro. Repetir este processo ao longo de muitos exemplos faz com que os pesos da rede estabilizem em valores que capturam regularidades estatísticas úteis nos dados.

A profundidade de uma rede importa: as primeiras camadas tendem a aprender características simples, como contornos ou traços de letras, enquanto as camadas mais profundas combinam essas características em conceitos mais ricos, como formas, palavras ou objetos. Esta hierarquia de representações é o que torna as redes neuronais profundas tão eficazes em tarefas de perceção. Uma visão geral amplamente citada da arquitetura e do algoritmo de aprendizagem está disponível na revisão de aprendizagem profunda de LeCun, Bengio e Hinton, publicada na Nature em 2015.

Porque é importante

As redes neuronais sustentam a maioria das capacidades de IA que se tornaram correntes na década de 2020, incluindo classificação de imagens, reconhecimento de voz, tradução automática, sistemas de recomendação e modelos de linguagem de grande escala, como os modelos por trás dos assistentes conversacionais. Destacam-se em problemas onde regras escritas à mão são frágeis, mas existem grandes quantidades de dados etiquetados ou não etiquetados, porque a mesma arquitetura pode ser retreinada para novos domínios com relativamente poucas alterações ao código.

Tipos principais

  • Rede neuronal feedforward (FNN): A forma mais simples; os sinais movem-se numa só direção, da entrada para a saída. Um perceptrão multicamada é o exemplo canónico.
  • Rede neuronal convolucional (CNN): Utiliza filtros de pesos partilhados, ideais para imagens e vídeo.
  • Rede neuronal recorrente (RNN): Tem ciclos que retêm memória de passos anteriores, adequada para sequências como texto ou dados de sensores; em grande parte substituída pelos transformers na linguagem.
  • Transformer: Uma arquitetura moderna baseada em atenção em vez de recorrência. É a espinha dorsal dos atuais modelos de linguagem de grande escala e de muitos sistemas de visão.
  • Rede generativa adversária (GAN): Emparelha um gerador com um discriminador que aprende a distinguir amostras reais de falsas, usada para síntese de imagens.

Cada variante reorganiza ou especializa a receita básica de neurónios e pesos para se adequar a um tipo particular de dados, mas o princípio subjacente — aprender pesos por gradiente descendente sobre uma perda — mantém-se o mesmo.

Frequently Asked Questions

What is the difference between a neural network and deep learning?
A neural network is the underlying model: layers of weighted, interconnected neurons that transform inputs into outputs. Deep learning refers to training neural networks with many layers (typically dozens or more) so they can learn hierarchical representations. In practice, deep learning almost always means deep neural networks, but not every neural network is "deep."
Do neural networks really work like the human brain?
Only loosely. Real biological neurons fire electrochemical spikes, encode information with timing, and are embedded in complex circuitry that current artificial networks do not replicate. Neural networks borrow the high-level idea of many simple units learning from experience, but they are best understood as a mathematical function approximator optimized with gradient descent.
How much data does a neural network need to learn well?
It depends on the task, architecture, and whether you use a pre-trained model. Simple feedforward networks can converge on toy problems with hundreds of examples. State-of-the-art language and vision models are typically trained on billions of tokens or images, often using self-supervised pre-training followed by fine-tuning on smaller labeled datasets.
Can neural networks be wrong even when they are confident?
Yes. A model's predicted probability reflects patterns it has learned, not ground truth, so it can be confidently wrong on out-of-distribution inputs, adversarial examples, or rare edge cases. Calibration, evaluation on diverse test sets, and human-in-the-loop review are common ways to mitigate this.