robots.txt nedir, nasıl çalışır?
robots.txt, sitenizin kök dizininde yer alan ve arama motoru botlarına hangi adresleri tarayabileceklerini bildiren düz metin bir dosyadır. Tarama yönetimi için standart bir protokoldür (Robots Exclusion Protocol).
- User-agent: Kuralın hangi bota uygulanacağını belirtir (
*tüm botlar). - Disallow: Belirtilen yolun taranmasını engeller.
Disallow: /admin/ - Allow: Engellenen bir blok içinde belirli yola izin verir.
Allow: /admin/yardim/ - Sitemap: XML site haritanızın tam URL'sini bildirir, indekslemeyi hızlandırır.
- Crawl-delay: Bazı botların istekler arasında bekleyeceği süre (saniye).
robots.txt taramayı (crawl) yönetir; indekslemeyi garanti etmez. Bir sayfanın arama sonuçlarında kesinlikle görünmemesini istiyorsanız noindex meta etiketi kullanın — engellenen sayfalar yine de dış bağlantılarla indekslenebilir.