Token nedir, nasıl sayılır?
Token, dil modelinin metni işlerken kullandığı en küçük birimdir — bir kelime parçası, kelime veya noktalama olabilir. Pratik bir kural olarak Türkçe'de yaklaşık 4 karakter 1 token'a, İngilizce'de ~0,75 kelime 1 token'a denk gelir. Hem gönderdiğiniz istem (girdi) hem de modelin ürettiği yanıt (çıktı) token cinsinden ücretlendirilir.
Girdi (input) ve çıktı (output) fiyatı neden farklı?
Modelin yanıt üretmesi (çıktı), gönderilen istemi okumasına (girdi) göre çok daha fazla hesaplama gerektirir. Bu nedenle çıktı token'ı genellikle girdiden 3-5 kat daha pahalı fiyatlanır. Maliyet tahmininde mutlaka her ikisini ayrı hesaplayın; çok konuşan (uzun yanıt veren) uygulamalarda çıktı maliyeti baskın olur.
LLM API maliyeti nasıl düşürülür?
Gereksiz uzun istemleri kısaltın, sık tekrar eden bağlamı prompt caching ile önbelleğe alın, çıktı uzunluğunu (max tokens) sınırlandırın, basit görevleri Haiku/Flash gibi ekonomik modellere yönlendirin (model yönlendirme), toplu işlerde batch API kullanın ve gereksiz tekrar çağrıları önbellekleyin. Bu araçtaki karşılaştırma tablosu, aynı iş yükü için en ucuz modeli görmenizi sağlar.
Fiyatlar güncel mi?
Listedeki fiyatlar 2026-06 itibarıyla derlenmiştir ve LLM fiyatları sık değişir. Aracın girdi/çıktı fiyat alanları ve USD/TRY kuru düzenlenebilir; güncel rakamları sağlayıcının resmi fiyat sayfasından (anthropic.com, openai.com, ai.google.dev) alıp ilgili alanlara yazarak gerçek maliyetinizi hesaplayabilirsiniz.
Maliyet Türk Lirası olarak nasıl hesaplanıyor?
Önce USD maliyet bulunur: (girdiToken ÷ 1.000.000 × girdiFiyatı) + (çıktıToken ÷ 1.000.000 × çıktıFiyatı). Bu tutar girdiğiniz USD/TRY kuruyla çarpılarak TL'ye çevrilir. Aylık maliyet için tek istek tutarı, ay içindeki istek sayısıyla çarpılır. Kur alanını güncel değere göre düzenleyebilirsiniz.
Hangi model daha ucuz?
Bu, iş yükünüze (girdi/çıktı token dengesi) bağlıdır. Genel olarak Gemini Flash ve Claude Haiku gibi hafif modeller en ekonomik; Opus/GPT gibi güçlü modeller daha pahalıdır. Aracın 'Model karşılaştırması' tablosu, girdiğiniz tam token miktarlarıyla tüm modellerin maliyetini ucuzdan pahalıya sıralayarak sizin senaryonuzda en uygun modeli gösterir.