El machine learning es un campo de la informática y una parte central de la inteligencia artificial, centrado en crear sistemas que aprenden de los datos. En lugar de seguir instrucciones paso a paso escritas por un programador, un modelo de machine learning identifica patrones estadísticos en ejemplos y utiliza esos patrones para hacer predicciones o tomar decisiones sobre datos nuevos que no ha visto. Cuantos más datos relevantes procesa, mejor tiende a funcionar.
Cómo funciona el machine learning
A grandes rasgos, el machine learning parte de un conjunto de datos de ejemplos —cada ejemplo suele estar formado por características (las entradas) y, en muchos casos, una etiqueta (la salida deseada)—. Un modelo, como un árbol de decisión, una red neuronal o una regresión lineal, se inicializa con parámetros aleatorios o predeterminados y luego se entrena comparando repetidamente sus predicciones con las respuestas conocidas. Un proceso de optimización, normalmente el descenso de gradiente, ajusta los parámetros para reducir el error de predicción. El entrenamiento continúa hasta que el rendimiento del modelo deja de mejorar en un conjunto de validación separado.
Piensa en un filtro antispam sencillo. El conjunto de entrenamiento contiene miles de correos etiquetados como "spam" o "no spam". El modelo aprende que ciertas palabras, patrones de remitente y estructuras de enlaces se correlacionan con el spam. Cuando llega un correo nuevo, el modelo lo puntúa y lo clasifica en consecuencia, sin que nadie haya escrito reglas explícitas para cada patrón de spam.
Por qué es importante
El machine learning es el motor detrás de la mayoría de las aplicaciones modernas de IA, desde asistentes de voz y análisis de imágenes médicas hasta la calificación crediticia, la previsión de la demanda y los motores de recomendación. Destaca en tareas en las que escribir reglas a mano resultaría poco práctico porque los patrones son demasiado complejos, demasiado sutiles o demasiado numerosos. Esta disciplina también sustenta los avances en deep learning, donde las redes neuronales de múltiples capas aprenden representaciones jerárquicas que han impulsado enormemente campos como la visión por computadora y el procesamiento del lenguaje natural. Encontrarás un análisis más profundo en el libro de referencia de Mitchell y en la introducción al machine learning de IBM.
Tipos principales
- Aprendizaje supervisado: el modelo aprende a partir de ejemplos etiquetados, como clasificar imágenes o predecir precios de viviendas.
- Aprendizaje no supervisado: el modelo encuentra estructura en datos sin etiquetar, como la segmentación de clientes o la detección de anomalías.
- Aprendizaje por refuerzo: el modelo aprende interactuando con un entorno y recibiendo recompensas, y se utiliza en juegos y robótica.
- Aprendizaje semisupervisado y auto-supervisado: enfoques híbridos que usan pequeñas cantidades de datos etiquetados junto con grandes volúmenes de datos sin etiquetar, habituales en los modelos modernos de lenguaje y visión.
El machine learning se entiende mejor como un conjunto de técnicas para convertir datos en comportamiento. Su eficacia depende de la calidad y la cantidad de los datos de entrenamiento, de la elección del modelo y de la alineación entre el objetivo de aprendizaje y la tarea real que debe resolver.