📖

Sıcaklık (YZ) nedir?

Temperature, bir yapay zekâ modelinin çıktılarının ne kadar rastgele ya da öngörülebilir olduğunu kontrol eden bir örnekleme hiperparametresidir. Nasıl çalıştığını, neden önemli olduğunu ve nasıl ayarlanacağını öğrenin.

Yapay zekâda temperature, bir sonraki token'ı, kelimeyi veya pikseli seçmek için modelin kullandığı olasılık dağılımını yeniden şekillendirerek model çıktısının rastgeleliğini kontrol eden bir hiperparametredir. En sık büyük dil modelleri (LLM'ler) ve diğer üretken modeller bağlamında ele alınır; burada öngörülebilirlik ile yaratıcılık arasında bir ayar düğmesi işlevi görür. Değeri düşürdüğünüzde model her seferinde en olası seçeneği tercih eder; yükselttiğinizde ise daha az olası seçenekleri denemeye daha istekli hale gelir.

Temperature nasıl çalışır

Model, her token'ı üretmeden önce sözlüğündeki her olasılık için logit adı verilen bir ham puan hesaplar. Bu logit'ler softmax fonksiyonu aracılığıyla olasılıklara dönüştürülür ve temperature devreye girdiği yer burasıdır. Softmax uygulanmadan önce her logit, temperature değeri olan T'ye bölünür.

T = 1 olduğunda dağılım değişmez. T < 1 olduğunda olasılıklar birbirinden uzaklaşır: zaten olası olan token'lar daha da olası hale gelir, böylece örnekleme modelin "en iyi tahminine" yakın kalır. T > 1 olduğunda dağılım düzleşir ve düşük olasılıklı token'lar daha büyük bir pay alır; bu da çıktıları daha çeşitli kılar. Örneğin, model bir sonraki kelimenin "the" olduğuna %60, "a" olduğuna ise %20 güvenle inanıyorsa, 0.2 temperature değeri neredeyse her zaman "the" çıktısını verirken, 1.2 temperature değeri yaklaşık beş denemede bir "a" çıktısını verir.

Neden önemlidir

Temperature, modeli yeniden eğitmeden davranışını şekillendirmenin en basit ve en güçlü kollarından biridir. Düşük temperature değerleri, halüsinasyonların maliyetli olduğu kod üretimi, olgusal soru yanıtlama ve yapılandırılmış veri çıkarma gibi hassasiyet gerektiren görevler için tercih edilir. Daha yüksek temperature değerleri ise özgünlüğün ve çeşitliliğin kesinlikten daha önemli olduğu beyin fırtınası, hikâye anlatımı ve diyalog gibi görevler için kullanışlıdır.

Aynı zamanda prompt mühendisliğinin de temel bir parçasıdır. OpenAI, Anthropic ve Google'ın da aralarında bulunduğu çoğu LLM API'si, temperature'ı top-p (çekirdek örnekleme) ve top-k gibi ilgili kontrollerle birlikte ayarlanabilir bir parametre olarak sunar. Doğrudan kullanıcı deneyimini etkilediği için bir modeli demodan üretime taşırken geliştiricilerin ilk ayarladığı ayarlardan biridir.

Temel temperature aralıkları ve ne zaman kullanılacakları

  • 0.0 — Açgözlü kod çözme (Greedy decoding). Model her zaman en yüksek olasılıklı token'ı seçer. Maksimum determinizm; tekrarlanabilir kod veya matematik için kullanışlıdır.
  • 0.0–0.3 — Düşük ve odaklı. Çeviri, özetleme, sınıflandırma ve olgu temelli yanıtlama için iyidir.
  • 0.4–0.7 — Dengeli. Genel amaçlı sohbet asistanları için yaygın bir varsayılan değerdir.
  • 0.7–1.0 — Daha çeşitli. Yaratıcı yazarlık, pazarlama metinleri ve fikir üretimi için kullanışlıdır.
  • 1.0+ — Yüksek düzeyde rastgele. Çıktılar tutarsız hale gelebilir; araştırma veya deneysel sanat dışında nadiren kullanılır.

Temperature en iyi bir karar değil, bir ayar düğmesi olarak anlaşılır. Top-p veya top-k örneklemesiyle birlikte kullanın ve belirli göreve, modele ve hedef kitleye göre ayarlayın; çünkü aynı değer farklı uygulamalarda çok farklı hissedilebilir.

Sıkça Sorulan Sorular

What is a good temperature value for ChatGPT or other LLMs?
A temperature between 0.2 and 0.7 is a sensible starting point for most tasks. Use the lower end for factual answers, coding, and summarization where consistency matters, and the higher end for brainstorming or creative writing where variety is welcome. Many production systems default to around 0.7 for general conversation.
What is the difference between temperature and top-p in AI?
Temperature rescales the entire probability distribution, making it sharper or flatter before a token is sampled. Top-p (nucleus sampling) instead trims the distribution to the smallest set of tokens whose combined probability exceeds a threshold like 0.9. The two settings are complementary: temperature changes how spread out probabilities are, while top-p changes how many candidates are considered at all.
Does temperature 0 make AI outputs identical every time?
Usually, yes, but not always. Temperature 0 (greedy decoding) makes the model pick the single most probable next token at every step, so on a fixed prompt with no other randomness in the pipeline, the output is reproducible. In practice, parallelism, batching, and floating-point quirks on GPUs can occasionally introduce small variations, which is why some teams still set very low values like 0.01 instead of true zero for strict reproducibility.
Can higher temperature make a model more accurate?
Not in general. Higher temperature increases diversity and creativity but also raises the chance of factual errors and hallucinations. For tasks where accuracy is measured against a known answer, lower temperatures almost always perform better on benchmarks. Higher temperatures can occasionally help on tasks with many valid responses, where exploration unlocks a better answer than the model's first guess.