📖

¿Qué es Aprendizaje con Pocos Ejemplos?

El aprendizaje con pocos ejemplos permite a los modelos de IA dominar nuevas tareas a partir de solo un puñado de ejemplos. Descubre cómo funciona, por qué es importante y dónde se utiliza.

El aprendizaje con pocos ejemplos (few-shot learning) es un paradigma de aprendizaje automático en el que se espera que un modelo generalice a una nueva tarea o clase tras ver solo un número reducido de ejemplos etiquetados, a menudo tan pocos como uno (one-shot) o ninguno (zero-shot). Se diferencia del aprendizaje supervisado tradicional, que normalmente requiere grandes conjuntos de datos etiquetados para lograr un rendimiento sólido. El enfoque cobró especial protagonismo con los grandes modelos de lenguaje, que pueden interpretar instrucciones y ejemplos proporcionados directamente en su prompt de entrada.

Cómo funciona el aprendizaje con pocos ejemplos

La mayoría de los sistemas modernos de aprendizaje con pocos ejemplos parten de un gran modelo preentrenado que ya ha absorbido un conocimiento amplio a partir de enormes conjuntos de datos. Para realizar una nueva tarea, se le proporciona al modelo un pequeño conjunto de demostraciones dentro de su entrada, una técnica conocida como aprendizaje en contexto (in-context learning). Por ejemplo, para enseñar a un modelo a clasificar comentarios de clientes como positivos, negativos o neutros, un desarrollador podría incluir tres ejemplos etiquetados en el prompt: "¡Excelente servicio!" → positivo, "Respuesta lenta." → negativo y "Estuvo bien." → neutro. El modelo aplica entonces el mismo patrón a nuevas entradas sin etiquetar, sin actualizar sus pesos.

Más allá del prompting, el aprendizaje con pocos ejemplos también puede implementarse ajustando (fine-tuning) un modelo preentrenado con un pequeño conjunto de datos etiquetados, o mediante enfoques de meta-aprendizaje que entrenan explícitamente al modelo para aprender nuevas tareas con rapidez. En todos los casos, el objetivo es el mismo: aprovechar el conocimiento previo para que unos pocos ejemplos basten para especificar un nuevo comportamiento.

Por qué es importante

El aprendizaje con pocos ejemplos reduce drásticamente el coste y el tiempo necesarios para adaptar la IA a tareas especializadas. En ámbitos donde los datos etiquetados son escasos, costosos o sensibles, como el diagnóstico médico, la revisión legal o la traducción de idiomas poco comunes, recopilar miles de ejemplos suele ser poco viable. Los métodos de few-shot hacen posible crear aplicaciones útiles a partir de pocos ejemplos cuidadosamente seleccionados. También permiten una iteración más rápida, ya que los equipos pueden crear prototipos y refinar prompts o ajustes sin esperar a grandes proyectos de anotación.

Tipos clave

  • Aprendizaje de un solo ejemplo (one-shot learning): se le da al modelo un único ejemplo por clase para aprender.
  • Aprendizaje con pocos ejemplos (k-shot): se le da al modelo un número pequeño, normalmente entre 2 y 10, de ejemplos por clase.
  • Aprendizaje sin ejemplos (zero-shot learning): el modelo realiza la tarea sin ningún ejemplo, basándose solo en instrucciones o descripciones.
  • Aprendizaje con pocos ejemplos basado en prompts: los ejemplos se proporcionan directamente en el prompt de entrada, tal y como popularizaron GPT-3 y sus sucesores.
  • Meta-aprendizaje: el modelo se entrena explícitamente a través de muchas tareas relacionadas para poder adaptarse a nuevas con datos mínimos; una familia que incluye métodos como MAML y las redes prototípicas.

El aprendizaje con pocos ejemplos es una de las capacidades definitorias de los modelos fundacionales modernos y se sitúa en el corazón de técnicas como la ingeniería de prompts, la generación aumentada por recuperación y el ajuste ligero como LoRA. A medida que los modelos base siguen mejorando, el número de ejemplos necesario para un rendimiento fiable tiende a reducirse, lo que hace que la personalización de la IA sea accesible para equipos sin pipelines dedicados de etiquetado de datos.

Preguntas frecuentes

How is few-shot learning different from transfer learning?
Transfer learning is the broader practice of reusing knowledge from one task to help with another, usually by fine-tuning a pre-trained model. Few-shot learning is a specific goal within that umbrella: succeeding at a new task when only a handful of examples are available. Many few-shot systems use transfer learning, but the defining feature is the small data size, not the transfer mechanism itself.
What is the difference between few-shot and zero-shot learning?
Zero-shot learning requires the model to perform a task with no examples at all, relying on instructions, task descriptions, or general world knowledge. Few-shot learning provides a small number of demonstrations, typically 1 to 10, so the model can infer the desired pattern. Zero-shot is more demanding of the base model's reasoning ability, while few-shot tends to be more reliable for narrow or unusual tasks.
How many examples do you need for few-shot learning?
There is no fixed number, but few-shot learning generally uses between 1 and about 10 labeled examples per class, often provided directly in the prompt. More examples usually improve performance up to a point, after which the model's context window or diminishing returns set in. The exact sweet spot depends on the task, the base model, and the quality of the examples.
Is few-shot learning the same as prompt engineering?
Not exactly. Prompt engineering is the practice of crafting inputs to get the best results from a model, and it often includes adding few-shot examples as part of the prompt. Few-shot learning is the broader capability of learning from a few examples, which can be exercised through prompt engineering, fine-tuning, or meta-learning. They overlap heavily in practice but are distinct concepts.