Fine-Tuning nedir?

Fine-tuning is the process of further training a pre-trained machine learning model on a smaller, task-specific dataset to adapt its behavior for a particular use case. It adjusts the model's internal parameters so it produces more accurate, relevant, or stylistically aligned outputs than the base model alone.

İnce ayar, geniş bir veri kümesi üzerinde — çoğunlukla GPT veya LLaMA ailesinden büyük bir dil modeli gibi — önceden eğitilmiş bir modeli alıp onu daha küçük, dikkatle seçilmiş bir veri kümesi üzerinde eğitmeye devam etme pratiğidir. Amaç, modeli daha dar bir davranışa yönlendirmektir: tıbbi soruları yanıtlama, belirli bir marka sesinde yazma, belirli bir çerçevede kod üretme ya da yapılandırılmış bir çıktı biçimini güvenilir şekilde takip etme.

Sıfırdan eğitimin aksine, ince ayar rastgele ağırlıklar yerine öğrenilmiş temsillerden başlar. Gramer, muhakeme ve dünya bilgisinin öğrenilmesinin en ağır kısmı çoktan tamamlandığından, ince ayar genellikle hedef görevde anlamlı iyileştirmeler sağlamak için çok daha az veri ve işlem gücüne ihtiyaç duyar.

İnce ayar nasıl çalışır

Pratikte mühendisler, modelin sergilemesini istedikleri davranışı temsil eden örnek girdiler ve istenen çıktılardan oluşan bir veri kümesi hazırlar. Bir müşteri destek asistanı için bu, yüzlerce ya da binlerce geçmiş destek talebi çözümü olabilir; bir kod inceleme aracı içinse çekme istekleri ve inceleme yorumlarından oluşan çiftler olabilir. Önceden eğitilmiş model, bu veri kümesi üzerinde ek eğitim geçişleri yapar ve tahmin edilen çıktılarla hedef çıktılar arasındaki kayıp azalacak şekilde ağırlıkları standart gradyan tabanlı eniyileme ile güncellenir.

Basit bir zihinsel model: genel amaçlı bir temel modeli, her ders kitabını okumuş bir tıp stajyeri olarak düşünün. İnce ayar, onu radyoloji alanında uzmanlaştıran ihtisas eğitimidir. Temel bilgisi yerinde kalır, ancak günlük kararları keskin biçimde tek bir alana odaklanır.

Neden önemlidir

İnce ayar, ekiplerin genel amaçlı bir modeli güvenilir bir ürün bileşenine dönüştürmek için kullandığı birincil kumanda koludur. Niş görevlerde doğruluğu artırabilir, kurumun üslubunu dayatabilir, tanımlı bir kapsamda halüsinasyonları azaltabilir, araç kullanım kalıplarını öğretebilir ve çıktıları güvenlik veya uyumluluk gereksinimleriyle hizalayabilir. Özel verilere ya da alan uzmanlığına sahip kuruluşlar için ince ayar, bu bilgiyi yalnızca istemlere güvenmek yerine doğrudan modelin içine kodlamanın bir yolunu sunar.

Aynı zamanda ekonomik bir değeri de vardır: daha küçük ve ince ayar yapılmış açık kaynaklı bir model, belirli bir iş akışında çok daha büyük genel amaçlı bir modelin kalitesini sıklıkla yakalayabilir ve ölçekte çıkarım maliyetlerini düşürür.

Temel türler

  • Denetimli ince ayar (SFT): belirli bir beceriyi veya biçimi öğretmek için etiketli girdi-çıktı çiftleri üzerinde eğitim.
  • Yönergeye göre ince ayar: modeli birçok görevde doğal dil yönergelerini takip edecek şekilde eğiten SFT'nin geniş bir biçimi.
  • Parametre verimli ince ayar (örn. LoRA, QLoRA): ağırlıkların çoğunu dondurur ve yalnızca küçük bağdaştırıcı katmanlarını eğiterek işlem ve depolama maliyetlerini düşürür.
  • İnsan geri bildiriminden pekiştirmeli öğrenme (RLHF): modeli denetimli örneklerin ötesinde daha da hizalamak için insan tercih sıralamalarını kullanır.
  • Devam eden ön eğitim: göreve özgü SFT'den önce kelime dağarcığı ve bilgiyi aşılamak için ham alan metni üzerinde denetimsiz ince ayar.

İnce ayar, istem ve getirme yöntemlerinin tek başına kalite çıtasını güvenilir biçimde karşılayamadığı, gecikme ya da maliyetin çok büyük modelleri devre dışı bıraktığı ya da istenen davranışın temel modelin seyrek gördüğü kalıplara bağlı olduğu durumlarda en yararlıdır. Erişilebilir bir genel bakış için Hugging Face'in eğitim belgelerine, yönerge takip eden modellerin arkasındaki orijinal tarife ise FLAN makalesine bakabilirsiniz.

Frequently Asked Questions

How is fine-tuning different from prompt engineering?
Prompt engineering steers a model's behavior at inference time by changing only the input text, without altering the model itself. Fine-tuning actually updates the model's weights by running additional training on a curated dataset. Prompting is faster and cheaper; fine-tuning is more powerful when the desired behavior must be applied consistently across many queries or when it depends on patterns the base model doesn't reliably produce.
How much data do you need to fine-tune a model?
It depends on the task and the method. Full fine-tuning of a large model can require thousands to tens of thousands of high-quality examples. Parameter-efficient methods like LoRA can produce useful results with a few hundred well-chosen examples, especially when the base model already has strong general capabilities. Data quality consistently matters more than raw quantity.
What is LoRA fine-tuning?
LoRA (Low-Rank Adaptation) is a parameter-efficient fine-tuning method that freezes the original model weights and trains only small, low-rank matrices added to each layer. This typically reduces the trainable parameters by more than 90%, making fine-tuning feasible on a single GPU and producing adapters that are only a few megabytes in size.
Does fine-tuning make a model forget what it already knows?
It can. Known as catastrophic forgetting, this happens when fine-tuning on a narrow dataset overwrites earlier capabilities. Practitioners mitigate it by mixing in general-domain data, using a low learning rate, limiting training epochs, and evaluating the model on both the new task and a broader benchmark suite before deployment.