Technische Infrastruktur

Robots.txt

robots.txt ist eine Textdatei im Stammverzeichnis einer Website, die Suchmaschinen-Crawlern anweist, welche Seiten oder Dateien sie anfordern dürfen oder nicht anfordern dürfen. Sie ist die erste Verteidigungslinie bei der Steuerung der Interaktion von Bots mit Ihrer Website-Infrastruktur und hilft bei der Optimierung des Crawl-Budgets.

Technische Infrastruktur
SEO
Crawling-Management

Bots zu Ihren besten Inhalten leiten

Google weist Ihrer Website ein begrenztes „Crawl-Budget“ zu – die Anzahl der Seiten, die seine Bots pro Tag crawlen werden. Wenn Bots Zeit mit dem Crawlen von Admin-Panels, druckfreundlichen Duplikatseiten oder Warenkorb-/Kassenseiten verschwenden, verpassen sie möglicherweise Ihre wertvollen übersetzten Produktseiten. robots.txt teilt Bots mit: „Verschwenden Sie keine Zeit mit /admin/, konzentrieren Sie sich stattdessen auf /en/, /fr/, /de/.“ Für internationale Websites sollten Sie das Crawling von Seiten mit automatischer Spracherkennungsumleitung, API-Endpunkten und technischen URLs, die nicht indexiert werden müssen, verbieten. Blockieren Sie jedoch NIEMALS versehentlich Ihre Sprachverzeichnisse – das ist ein katastrophaler Fehler, der die gesamte internationale SEO zunichtemacht.

Crawling-Zugriff erlauben vs. verweigern

Aspekt
Ohne
Mit Robots.txt
Allow (Standard)
Bots crawlen alles: Inhalte + technische Seiten
Verschwendet Crawl-Budget für unwichtige Seiten
Strategisches Disallow
Disallow: /admin/, /cart/, /api/
Konzentriert Bots auf indexierbare Inhalte
Internationales Beispiel
Allow: /en/, /fr/, /de/ (Sprachverzeichnisse)
Disallow: /lang-detect/ (technische Weiterleitung)
Kritischer Fehler
Disallow: /fr/ (blockiert französische Website)
Französische Inhalte nie indexiert - DESASTER

Auswirkungen in der Praxis

Vorher
Aktueller Ansatz
📋 Szenario

Website hat keine robots.txt, Bots crawlen 10.000 Warenkorb-URLs

⚙️ Was passiert

Crawl-Budget verschwendet, Produktseiten werden langsam gecrawlt

📉
Geschäftliche Auswirkungen

Neue Produkte erscheinen erst nach Wochen in der Suche

Nachher
Optimierte Lösung
📋 Szenario

Robots.txt hinzufügen: Disallow /cart/, /checkout/, /api/

⚙️ Was passiert

Bots konzentrieren sich zu 100 % auf Produkt- und Sprachseiten

📈
Geschäftliche Auswirkungen

Neue Produkte innerhalb von 24 Stunden indexiert

Bereit zu meistern Robots.txt?

MultiLipi bietet unternehmensweite Tools für mehrsprachiges GEO, neuronale Übersetzung und Markenschutz in über 120 Sprachen und allen KI-Plattformen.