Token nedir, nasıl hesaplanır?
Token, yapay zeka dil modellerinin metni işlerken kullandığı en küçük birimdir. Bir token genellikle bir kelimenin parçası, bir kelime veya bir noktalama işaretine karşılık gelir. Modeller metni doğrudan harf harf değil, token token okur; maliyet ve sınırlar da token üzerinden işler.
- Karaktere göre: Token ≈ Karakter sayısı ÷ 4 (İngilizce) veya ÷ 3,3 (Türkçe)
- Kelimeye göre: Token ≈ Kelime sayısı × 1,3
- Bağlam penceresi: Modelin tek seferde işleyebildiği toplam token (girdi + çıktı) sınırıdır.
Türkçe genellikle daha fazla token üretir. Eklemeli (sondan eklemeli) yapısı ve modellerin çoğunun İngilizce ağırlıklı eğitilmesi nedeniyle aynı anlam, İngilizceye kıyasla daha çok token harcayabilir. Bu yüzden Türkçe için daha yoğun bir tahmin (karakter/3,3) kullanıyoruz.