O machine learning é uma área da ciência da computação e um pilar central da inteligência artificial, dedicado a construir sistemas que aprendem a partir de dados. Em vez de seguir instruções passo a passo escritas por um programador, um modelo de machine learning identifica padrões estatísticos em exemplos e utiliza esses padrões para fazer previsões ou tomar decisões sobre dados novos e nunca antes vistos. Quanto mais dados relevantes o modelo recebe, melhor tende a ser o seu desempenho.
Como funciona o Machine Learning
De forma geral, o machine learning começa com um conjunto de dados de exemplos — cada exemplo composto, normalmente, por características (as entradas) e, em muitos casos, um rótulo (a saída pretendida). Um modelo, como uma árvore de decisão, uma rede neuronal ou uma regressão linear, é inicializado com parâmetros aleatórios ou predefinidos e, depois, é treinado comparando repetidamente as suas previsões com as respostas conhecidas. Um processo de otimização, tipicamente o gradiente descendente, ajusta os parâmetros para reduzir o erro de previsão. O treino continua até o desempenho do modelo deixar de melhorar num conjunto de validação separado.
Considere um filtro de spam simples. O conjunto de treino contém milhares de e-mails rotulados como "spam" ou "não spam". O modelo aprende que determinadas palavras, padrões de remetente e estruturas de hiperligações estão associadas a spam. Quando chega um novo e-mail, o modelo atribui-lhe uma pontuação e encaminha-o em conformidade — sem que ninguém tenha de escrever regras explícitas para cada padrão de spam.
Porque é importante
O machine learning é o motor por trás da maioria das aplicações modernas de IA, desde assistentes de voz e análise de imagens médicas até à avaliação de crédito, previsão de procura e sistemas de recomendação. Destaca-se em tarefas nas quais escrever regras codificadas à mão seria impraticável, porque os padrões são demasiado complexos, subtis ou numerosos. A disciplina sustenta também os avanços do deep learning, em que redes neuronais com múltiplas camadas aprendem representações hierárquicas que fizeram progredir de forma significativa áreas como a visão computacional e o processamento de linguagem natural. Leia uma abordagem mais aprofundada no livro de referência de Mitchell e na visão geral da IBM sobre machine learning.
Principais tipos
- Aprendizagem supervisionada: o modelo aprende a partir de exemplos rotulados, como classificar imagens ou prever preços de imóveis.
- Aprendizagem não supervisionada: o modelo identifica estrutura em dados não rotulados, como segmentação de clientes ou deteção de anomalias.
- Aprendizagem por reforço: o modelo aprende ao interagir com um ambiente e ao receber recompensas, sendo usada em jogos e robótica.
- Aprendizagem semi-supervisionada e auto-supervisionada: abordagens híbridas que combinam pequenas quantidades de dados rotulados com grandes volumes de dados não rotulados, comuns nos modelos modernos de linguagem e visão.
O machine learning entende-se melhor como um conjunto de técnicas para transformar dados em comportamento. A sua eficácia depende da qualidade e quantidade dos dados de treino, da escolha do modelo e do alinhamento entre o objetivo de aprendizagem e a tarefa do mundo real que se pretende resolver.