Bloga dön

Yapay Zekâ

RAG Nedir? Şirket Verisiyle Özel Yapay Zeka Modeli Kurma

RAG (Retrieval-Augmented Generation) nedir, nasıl çalışır? Vektör veritabanı, embedding ve LLM'i bir araya getirerek şirkete özel AI sistemi kurmanın tam rehberi.

RAG Nedir? Şirket Verisiyle Özel Yapay Zeka Modeli Kurma
Yapay ZekâRAG Nedir? Şirket Verisiyle Özel Yapay Zeka Modeli Kurma

RAG (Retrieval-Augmented Generation) Nedir?

RAG, büyük dil modellerinin (LLM) genel eğitim verilerinin ötesine geçerek gerçek zamanlı, şirkete özel bilgilerle yanıt üretmesini sağlayan bir mimari yaklaşımdır. Adı üç adımı özetler: Retrieval (ilgili belgeleri bul), Augmented (modelin bağlamını bu belgelerle zenginleştir), Generation (zenginleştirilmiş bağlamla yanıt üret).

Neden önemli? Çünkü ChatGPT veya Claude gibi LLM'ler belirli bir eğitim kesme tarihine kadar olan bilgiyi biliyor; şirketinizin iç dökümanlarını, ürün kataloğunu, destek geçmişini veya güncel yasal metinleri bilmiyor. RAG bu boşluğu kapatır.

RAG'ın Fine-Tuning'e Göre Avantajları

Kriter RAG Fine-Tuning
Veri güncellemesiAnlık — yeni döküman eklenince sistem güncellenirYeniden eğitim gerekir (maliyetli)
Başlangıç maliyetiDüşük — GPU gerektirmezYüksek GPU maliyeti
Kaynak gösterimiYanıtlar hangi dökümanı kullandığını gösterirKaynak takibi yoktur
Halüsinasyon riskiDüşük — yanıt kaynaklara dayalıModel yine de uydurabilir
Özel ton/formatSınırlıTam kontrol

Sonuç: Şirket bilgi tabanına dayalı chatbot, Q&A sistemi veya döküman asistanı için RAG çoğunlukla doğru tercihtir. Çok özel bir yazım stili veya domain jargonu öğretilecekse fine-tuning devreye alınabilir.

RAG Mimarisi: Adım Adım

  1. Döküman Yükleme ve Parçalama (Chunking):

    PDF, Word, HTML, Markdown veya veritabanı kayıtları gibi kaynaklar okunur. Her döküman anlam bütünlüğünü koruyacak şekilde 300–800 tokenlık parçalara bölünür. Parçalama stratejisi sistemin kalitesini doğrudan etkiler: çok küçük parçalar bağlamı kaybeder, çok büyük parçalar retrieval hassasiyetini düşürür.

  2. Embedding Üretimi:

    Her metin parçası bir embedding modeliyle sayısal vektöre dönüştürülür. OpenAI'ın text-embedding-3-small veya text-embedding-3-large modelleri, açık kaynak sentence-transformers veya çok dilli modeller kullanılabilir. Türkçe içerik için çok dilli modeller daha iyi performans verebilir.

  3. Vektör Veritabanı:

    Üretilen vektörler vektör veritabanına kaydedilir. Popüler seçenekler: pgvector (PostgreSQL eklentisi, ekstra altyapı gerekmez), Pinecone (yönetilen bulut hizmet), Weaviate, Qdrant, Chroma (yerel geliştirme için ideal).

  4. Retrieval (Benzer Belge Arama):

    Kullanıcı bir soru sorduğunda soru da vektöre dönüştürülür ve vektör veritabanında en yakın (semantik olarak en benzer) döküman parçaları bulunur. Bu işlem cosine similarity veya dot product üzerinden milisaniyeler içinde tamamlanır.

  5. Bağlam Zenginleştirme ve LLM Çağrısı:

    Bulunan döküman parçaları kullanıcının sorusuyla birleştirilerek LLM'e gönderilir. "Şu kaynaklara dayanarak yanıtla" talimatıyla model yalnızca verilen bilgiye bağlı yanıt üretir.

  6. Kaynak Gösterimi:

    Yanıtla birlikte hangi dökümanlardan bilgi alındığı kullanıcıya gösterilebilir. Bu şeffaflık güveni artırır ve hatalı yanıtların doğrulanmasını kolaylaştırır.

Retrieval Kalitesini Artırma Teknikleri

  • Hybrid search: Vektör benzerliği (semantic) + keyword search (BM25) birleştirilerek hem anlam hem kelime eşleşmesi yakalanır.
  • Re-ranking: İlk retrieval sonuçları bir cross-encoder modelle yeniden sıralanır; en alakalı parçalar öne alınır.
  • Metadata filtreleme: Döküman tarih, kategori, departman gibi metadatasına göre retrieval alanı daraltılır.
  • Query expansion: LLM, kullanıcı sorusunu daha iyi retrieval için yeniden ifade eder.
  • Chunk overlap: Parçalar arasında bağlam sürekliliği için örtüşme eklenir.

RAG'ın Uygun Olmadığı Durumlar

  • Modelin öğrenmesi gereken çok spesifik bir yazım tonu veya domain jargonu varsa → Fine-tuning.
  • Kaynak döküman olmadan genel muhakeme görevi yapılacaksa → Doğrudan API.
  • Veri boyutu çok küçükse (10–20 sayfa) → Tüm içerik sistem promptuna girilebilir, RAG gerekmeyebilir.

Nexsol RAG Projelerinde Kullandığı Stack

Nexsol Teknoloji olarak RAG projelerinde şu teknolojiyi kullanıyoruz: LangChain veya LlamaIndex (orkestrasyon), pgvector veya Qdrant (vektör veritabanı), OpenAI veya Anthropic API (LLM), Python / .NET backend. Projenin veri gizliliği gerektirmesi durumunda Ollama ile yerel LLM (Llama 3, Mistral) ve tamamen şirket içi RAG stack'i kurabiliyoruz. LLM danışmanlığımız ve yapay zeka çözümlerimiz hakkında daha fazla bilgi alın.

Uygulanabilir plan

Yapay Zekâ için sonraki adımlar

RAG Nedir? Şirket Verisiyle Özel Yapay Zeka Modeli Kurma konusunu yalnızca bilgi yazısı olarak bırakmamak gerekir. Bu başlığın sahada değer üretmesi için teknik kontrol, içerik derinliği, dönüşüm ölçümü ve satış geri bildirimi aynı aksiyon listesinde takip edilmelidir.

Teknik Kontrol

URL, canonical, schema, mobil deneyim, hız, iç linkleme ve indekslenebilirlik kontrol edilmeden içerik performansı sağlıklı ölçülemez.

İçerik Derinliği

Ana başlık, alt sorular, yerel arama niyeti, sık sorulan sorular ve karar vericiye dönük karşılaştırmalar sayfada birlikte ele alınmalıdır.

Dönüşüm Akışı

Okuyucunun sonraki adımı net olmalı; form, telefon, WhatsApp, teklif talebi ve ilgili hizmet sayfalarına geçiş ölçülmelidir.

Raporlama Döngüsü

GSC sorguları, GA4 eventleri, reklam verisi ve satış ekibinden gelen lead kalitesi düzenli okunarak içerik güncellenmelidir.

Bu başlığı projeye çevirelim

Web, SEO, reklam ve yazılım kararlarını aynı masada netleştirelim.

Teklif alınÇözüm danışmanı