How is few-shot learning different from transfer learning?

Transfer learning is the broader practice of reusing knowledge from one task to help with another, usually by fine-tuning a pre-trained model. Few-shot learning is a specific goal within that umbrella: succeeding at a new task when only a handful of examples are available. Many few-shot systems use transfer learning, but the defining feature is the small data size, not the transfer mechanism itself.

What is the difference between few-shot and zero-shot learning?

Zero-shot learning requires the model to perform a task with no examples at all, relying on instructions, task descriptions, or general world knowledge. Few-shot learning provides a small number of demonstrations, typically 1 to 10, so the model can infer the desired pattern. Zero-shot is more demanding of the base model's reasoning ability, while few-shot tends to be more reliable for narrow or unusual tasks.

How many examples do you need for few-shot learning?

There is no fixed number, but few-shot learning generally uses between 1 and about 10 labeled examples per class, often provided directly in the prompt. More examples usually improve performance up to a point, after which the model's context window or diminishing returns set in. The exact sweet spot depends on the task, the base model, and the quality of the examples.

Is few-shot learning the same as prompt engineering?

Not exactly. Prompt engineering is the practice of crafting inputs to get the best results from a model, and it often includes adding few-shot examples as part of the prompt. Few-shot learning is the broader capability of learning from a few examples, which can be exercised through prompt engineering, fine-tuning, or meta-learning. They overlap heavily in practice but are distinct concepts.

Few-Shot Öğrenme Nedir? Tanım ve Örnekler

Few-shot öğrenme, modelin yalnızca az sayıda etiketli örnek gördükten — çoğu zaman bir (one-shot) ya da hiç (zero-shot) örnek kadar — sonra yeni bir göreve veya sınıfa genelleme yapmasının beklendiği bir makine öğrenimi paradigmasıdır. Geleneksel denetimli öğrenmenin güçlü bir performans elde etmek için genellikle büyük etiketli veri kümeleri gerektirmesinin aksine, bu yaklaşım çok daha az veriyle çalışır. Özellikle büyük dil modellerinin yükselmesiyle öne çıkmıştır; bu modeller, doğrudan girdi istemlerinde verilen talimatları ve örnekleri yorumlayabilir.

Few-shot öğrenme nasıl çalışır

Modern few-shot öğrenme sistemlerinin çoğu, büyük veri kümelerinden geniş bilgiyi çoktan edinmiş büyük bir önceden eğitilmiş modelle başlar. Yeni bir görevi yerine getirmek için modele girdisinin içinde küçük bir gösterim seti verilir; bu teknik bağlam içi öğrenme (in-context learning) olarak bilinir. Örneğin, modele müşteri geri bildirimini olumlu, olumsuz veya nötr olarak sınıflandırmayı öğretmek için bir geliştirici isteme üç etiketli örnek ekleyebilir: "Harika hizmet!" → olumlu, "Yavaş yanıt." → olumsuz ve "İdare ederdi." → nötr. Model, hiçbir ağırlık güncellemesi yapmadan aynı kalıbı yeni, etiketlenmemiş girdilere uygular.

İstemlemenin ötesinde, few-shot öğrenme, önceden eğitilmiş bir modelin küçük bir etiketli veri kümesi üzerinde ince ayar yapılmasıyla ya da modeli yeni görevleri hızla öğrenecek şekilde açıkça eğiten meta-öğrenme yaklaşımlarıyla da uygulanabilir. Tüm durumlarda hedef aynıdır: birkaç örneğin yeni bir davranışı tanımlamaya yetmesi için önceki bilgiyi kullanmak.

Neden önemlidir

Few-shot öğrenme, yapay zekayı özelleşmiş görevlere uyarlamak için gereken maliyeti ve süreyi büyük ölçüde düşürür. Tıbbi tanı, hukuki inceleme veya nadir dillerin çevirisi gibi etiketli verinin kıt, pahalı veya hassas olduğu alanlarda binlerce örnek toplamak çoğu zaman pratik değildir. Few-shot yöntemleri, küçük ve özenle seçilmiş örneklerden faydalı uygulamalar geliştirmeyi mümkün kılar. Ayrıca daha hızlı yinelemeye olanak tanır; ekipler büyük etiketleme projelerini beklemeden istemleri veya ince ayarları hızla prototipleyip iyileştirebilir.

Temel türler

One-shot öğrenme: model, her sınıftan öğrenmek için tek bir örnek alır.
Few-shot öğrenme (k-shot): model, her sınıf için genellikle 2 ila 10 arasında değişen az sayıda örnek alır.
Zero-shot öğrenme: model, görevi hiç örnek olmadan, yalnızca talimatlara veya açıklamalara dayanarak yerine getirir.
İstem tabanlı few-shot öğrenme: örnekler, doğrudan girdi isteminde sağlanır; bu yaklaşım GPT-3 ve sonrası tarafından yaygınlaştırılmıştır.
Meta-öğrenme: model, birçok ilgili görev arasında açıkça eğitilir, böylece minimum veriyle yeni görevlere uyum sağlayabilir; MAML ve prototipik ağlar gibi yöntemleri kapsayan bir ailedir.

Few-shot öğrenme, modern temel modellerin belirleyici yeteneklerinden biridir ve istem mühendisliği, bilgi erişim destekli üretim (RAG) ve LoRA gibi hafif ince ayar tekniklerinin merkezinde yer alır. Temel modeller gelişmeye devam ettikçe, güvenilir görev performansı için gereken örnek sayısı azalma eğilimi gösterir; bu da yapay zeka özelleştirmesini, özel veri etiketleme süreçleri olmayan ekipler için erişilebilir kılar.

Az Örnekli Öğrenme nedir?

Few-shot öğrenme nasıl çalışır

Neden önemlidir

Temel türler

Sıkça Sorulan Sorular