📖

Token nedir?

Yapay zekâda token: bir dil modelinin okuduğu ve yazdığı temel birim. Tokenizasyonun nasıl çalıştığını, tokenların maliyet ve bağlam için neden önemli olduğunu ve model davranışını nasıl şekillendirdiğini öğrenin.

Token, bir dil modelinin gerçekte üzerinde çalıştığı en küçük metin parçasıdır. GPT, Claude veya Llama gibi bir modele bir istem gönderdiğinizde, metniniz önce bir dizi token'a ayrılır — genellikle tüm kelimeler, yaygın alt-kelimeler veya tek karakterler — ve her token daha sonra modelin işleyebileceği bir sayıya dönüştürülür. Model, çıktıyı da aynı şekilde üretir; durmaya karar verene kadar bir seferde bir token tahmin ederek yayınlar.

Token'lar nasıl çalışır

Token'lar, metninizle model arasında duran ayrı bir program olan bir tokenizer (tokenleyici) tarafından üretilir. En yaygın şemalar byte-pair encoding (BPE) ve WordPiece'tir; bu yöntemler tek karakterlerden başlar ve en sık kullanılan bitişik çiftleri tekrar tekrar daha uzun birimlere birleştirir. Sonuç, kısa yaygın kelimeleri yeniden kullanılabilir alt-kelime parçalarıyla dengeleyen sabit bir sözlüktür — genellikle 30.000 ila 200.000 giriş içerir. the gibi sık kullanılan bir kelime genellikle tek bir token olur; unbelievableness gibi nadir veya uydurma bir kelime ise birkaç parçaya ayrılır: un, believ, able, ness.

İngilizce ortalama olarak token başına yaklaşık dört karakter içerdiğinden, kabaca bir kural olarak 100 token ≈ 75 İngilizce kelime denilebilir; ancak bu, tokenleyiciye ve dile göre değişir. Fiyatlandırma, bağlam sınırları ve üretim hızının tümü kelime veya karakter yerine token ile ölçülür. 200.000 token'lık bağlam penceresine sahip bir model, tek bir istemde yaklaşık olarak uzun bir romanın ve birkaç araştırma makalesinin karşılığını tutabilir.

Neden önemlidir

Token'lar, her kullanıcının önemsediği üç şeyi belirler: maliyet, kapasite ve davranış. API sağlayıcıları milyon token başına ücret alır; bu nedenle verimsiz tokenize edilen bir istem, olması gerekenden daha fazla maliyet oluşturur. Bağlam pencereleri — bir modelin aynı anda dikkate alabileceği maksimum metin miktarı — token olarak sayılır; bu yüzden çok uzun belgeler modele beslenmeden önce parçalara ayrılmalıdır. Davranış da etkilenir: bir kelimeyi farklı şekilde bölen bir tokenleyici, modelin o kelime hakkında nasıl akıl yürüttüğünü değiştirebilir; bazı diller de İngilizce'den çok daha fazla parçaya ayrılarak tokenize edilir; bu da İngilizce dışındaki kullanıcılar için maliyetleri artırır ve etkin bağlamı kısaltır.

Temel token kavramları

  • Tokenizasyon: metni token'lara ayıran algoritma; genellikle BPE, WordPiece veya Unigram kullanılır.
  • Sözlük: modelin bildiği sabit token listesi; her giriş için benzersiz bir tam sayı kimliği bulunur.
  • Özel token'lar: <BOS>, <EOS> ve doldurma işaretleri gibi, içerik yerine sınırları ve yapıyı bildiren ayrılmış semboller.
  • Bağlam penceresi: bir modelin tek bir istekte işleyebileceği maksimum token sayısı; hem girdiyi hem de üretilen çıktıyı kapsar.
  • Token sınırları: sağlayıcılar tarafından bir isteğin içerebileceği token sayısına getirilen sert üst sınırlar; genellikle girdi ve çıktı sınırları olarak ayrılır.

Byte-pair encoding hakkında daha ayrıntılı bir inceleme için Andrej Karpathy'nin minbpe anlatımı pratik bir başlangıç noktasıdır; orijinal Neural Machine Translation of Rare Words with Subword Units makalesi ise çoğu modern tokenleyicinin hâlâ üzerine inşa edildiği yaklaşımı tanıtmıştır.

Frequently Asked Questions

How many tokens are in a word?
It depends on the tokenizer, but English words are usually one or two tokens. A common short word like "the" is typically a single token, while longer or less common words are split into subword pieces — for example, "unbelievableness" might become four tokens. On average, English text runs about 0.75 tokens per word, or roughly 100 tokens per 75 words.
Why do AI models use tokens instead of words?
Words create problems for models: vocabularies balloon, rare words are unseen during training, and similar forms like "run," "running," and "ran" are treated as unrelated. Subword tokens give the model a fixed, manageable vocabulary while still letting it represent any word, including ones it has never seen, by combining familiar pieces.
Do tokens count toward the context window?
Yes. The context window is the total number of tokens the model can process in a single request, and it includes both the input you send and the output the model generates. If a model has a 100,000-token context window, your prompt and the model's reply together must fit within that budget.
Are tokens the same across different AI models?
No. Each model family uses its own tokenizer and vocabulary, so the same sentence can produce different token counts on different models. A prompt that fits comfortably in one model's context window may exceed another's, which is worth checking when switching between providers.