2024 yılında web geliştiricisi ve yapay zeka araştırmacısı Jeremy Howard, basit ama derin bir soruyu gündeme taşıdı: "ChatGPT veya Claude gibi bir model sitenizi tararsa, sizi doğru anlaması için ona ne söylersiniz?"
Bu sorunun yanıtı olarak ortaya çıkan llms.txt, bugün GEO (Generative Engine Optimization) stratejisinin kritik bir teknik bileşeni haline geldi. Yapay zeka model eğitiminde ve gerçek zamanlı web aramasında içeriğinizin nasıl anlaşılacağını, hangi sayfaların önceliklendirilmesi gerektiğini ve marka kimliğinizin nasıl aktarılacağını doğrudan LLM'lere söyleyen bir kılavuz dosyası.
llms.txt Ne Anlama Geliyor?
llms.txt, web sitenizin kök dizinine (example.com/llms.txt) yerleştirilen, yapay zeka modelleri ve crawlerları için tasarlanmış bir düz metin dosyası. 1990'lardan beri kullandığımız robots.txt'nin AI çağındaki muadili olarak tasarlandı.
Aralarındaki temel fark şu:
robots.txt
Arama motoru botlarına hangi sayfaların taranmaması gerektiğini söyler. Erişim kısıtlaması odaklı, yasaklayıcı bir dil kullanır.
llms.txt
Yapay zeka modellerine siteyi kim olduğunuzu anlatır. Hangi içerikler en önemli, hangi sayfalar öncelikli, marka ne yapar — bağlam sağlar.
Kim Önerdi? Standart mı?
llms.txt'yi ilk kez 2024 yılında Jeremy Howard (Fast.ai ve Answer.AI kurucusu) önerdi. [1] Bir W3C standardı değil; daha çok topluluk tarafından benimsenen bir en iyi pratik (best practice) konumunda. Ama bu belirsizlik ona karşı bir argüman değil — robots.txt de başlangıçta standart değildi; kullanım yaygınlaştıkça evrensel norm haline geldi.
2025-2026 itibarıyla Cloudflare, Perplexity, Wix ve çok sayıda büyük platform llms.txt desteğini resmi olarak açıkladı. [2] Akademik çevrelerde de dikkat çekiyor: Oxford Internet Institute gibi kurumlar bu standardın web içerik erişim haklarını nasıl yeniden şekillendirebileceğini araştırıyor.
llms.txt Yapısı Nasıl Görünür?
Dosya Markdown formatında yazılır ve modüler bir yapı izler. Temel bölümler:
Dosya istediğiniz kadar basit veya ayrıntılı olabilir. Önemli olan AI modellerine bağlam sağlamak: siz kimsiniz, içeriğiniz ne hakkında, hangi sayfalar en önemli.
Hangi Yapay Zeka Botları llms.txt'yi Okuyor?
Günümüzde bilinen başlıca AI crawler'lar ve user-agent bilgileri:
Bu botların llms.txt'yi okuyup okumadığı şirket politikalarına göre değişiyor. Perplexity resmi olarak destekliyor. [3] Diğerleri için standart şu an tam oturmamış; ama dosyayı oluşturmak bir zarar vermez, aksine pozisyonunuzu güçlendiriyor.
robots.txt ile İlişkisi
robots.txt ve llms.txt birbirinin yerini almaz; birlikte çalışırlar:
İki Dosyanın Birlikte Kullanım Senaryosu
Disallow: /admin/Not: robots.txt'deki Disallow kuralları etik AI crawler'lar için bağlayıcı. llms.txt'de ise ağırlıklı olarak bağlam ve yönlendirme bilgisi var; henüz katı bir standart yok.
llms-full.txt: Gelişmiş Versiyon
Jeremy Howard'ın önerisinde iki dosya var: llms.txt (kısa özet) ve llms-full.txt (tüm sayfa içeriklerinin ham metin versiyonu). [1]
llms-full.txt, tüm önemli içeriğinizi tek bir düz metin dosyasında birleştiriyor — AI modelleri HTML'yi parse etmek yerine temiz metni okuyabiliyor. Bu, özellikle model eğitiminde ve RAG (Retrieval Augmented Generation) sistemlerinde içeriğinizin doğru anlaşılmasını kolaylaştırıyor.
İçerik Lisanslama: llms.txt'nin Örtük Hukuki Boyutu
llms.txt'nin en önemli ama en az konuşulan boyutu, içerik hakları. Dosyaya şu tür yönergeler eklenebilir:
- Eğitim izni: İçeriklerinizin AI model eğitiminde kullanılıp kullanılamayacağını belirtin
- Atıf gerekliliği: AI yanıtlarında kaynak gösterilmesini talep edin
- Ticari kısıtlama: Ticari amaçlı AI uygulamalarında kullanımı sınırlayın
- Çıkarım hakları: Canlı web aramasında (inference) kullanımı yetkilendirin
Bu yönergeler şu an hukuken bağlayıcı değil — yasal çerçeve henüz netleşmedi. Ama bu alanda düzenleme giderek artıyor; AB AI Act ve ABD AI düzenlemeleri bu boşluğu dolduracak. Bugünden pozisyon almak, yarın avantaj sağlıyor.
llms.txt'nin GEO'ya Etkisi
Peki llms.txt gerçekten fark yaratıyor mu? Erken benimseyenlerin deneyimleri dikkat çekici:
llms.txt Erken Benimseyenlerde Gözlemlenen Etkiler
Kaynak: llmstxt.org topluluk raporları, 2025. Veriler bireysel deneyimleri yansıtmakta olup sistematik araştırma henüz sınırlıdır.
Özellikle hallucination riski kritik bir nokta. Bir AI modeli markanızı yanlış bilgiyle yanıtlara dahil edebilir — yanlış ürünler, hatalı fiyatlar, var olmayan özellikler. llms.txt, modele doğrulanmış bilgi kaynakları sunarak bu riski azaltıyor.
llms.txt Nasıl Oluşturulur? Adım Adım
example.com/llms.txt adresinden erişilebilir olmalı. Content-type: text/plain.LLM-Guidance: /llms.txt satırını robots.txt dosyanıza ekleyerek botları bu dosyaya yönlendirebilirsiniz.# Güncelleme: 2026-04-12.Kimler Kullanıyor?
2026 itibarıyla llmstxt.org dizinine kayıtlı 30.000'den fazla site var. [4] Öne çıkan örnekler:
- Cloudflare — Tüm dokümantasyonunu llms-full.txt formatında sunuyor
- Anthropic (Claude) — Kendi dokümantasyon sitesi için llms.txt destekliyor
- Wix — Platform kullanıcıları için otomatik llms.txt üretimi başlattı
- Fast.ai — Kütüphane ve kurs dokümantasyonu için kapsamlı llms-full.txt
Sınırlamalar ve Eleştiriler
Dengeli bir değerlendirme için llms.txt'nin sınırlamalarını da görmek gerekiyor:
Sonuç: Küçük Dosya, Büyük Strateji
llms.txt, birkaç dakikada oluşturulabilen ama etkisi yıllara yayılan stratejik bir yatırım. Web'in AI ile yeniden şekillendiği bu dönemde, yapay zeka modellerine "sizi doğru tanıtmak" için beklemeye gerek yok.
GEO stratejinizin teknik altyapısında llms.txt, Schema.org işaretleri ve yapısal içerik üçgeni belirleyici olmaya devam edecek. Bugün rakiplerinizin çoğu bu dosyaya sahip değil — benimseme hâlâ düşük. Bu boşluk bir fırsat penceresi.
Kaynaklar
- Howard, J. (2024). llms.txt: A Proposal. Answer.AI. llmstxt.org
- Cloudflare. (2025). Cloudflare's Support for llms.txt. Cloudflare Blog. blog.cloudflare.com
- Perplexity AI. (2025). How Perplexity Handles llms.txt. Perplexity Blog. blog.perplexity.ai
- llmstxt.org. (2026). Site Directory. directory.llmstxt.cloud
- Search Engine Journal. (2025). llms.txt: What It Is and How to Use It for SEO and GEO. searchenginejournal.com