Google löscht versteckte Inhalte dank neuer llms.txt Funktion!

Inhaltsverzeichnis

Hey, ich möchte dir erklären, worum es bei einem aktuellen Thema in der digitalen Welt geht, nämlich um das Konzept hinter llms.txt und wie Google darauf reagiert. Dieses Thema könnte für dich interessant sein, besonders wenn du in der Welt der Suchmaschinenoptimierung (SEO) unterwegs bist oder mehr über die Interaktion großer Sprachmodelle mit Webseiteninhalten erfahren möchtest.

Was ist llms.txt?

llms.txt ist ein neues Vorschlagskonzept, das darauf abzielt, eine spezielle Content-Datei für Webseiten zu schaffen. Diese Datei soll großen Sprachmodellen (wie denjenigen, die hinter KI und automatisierten Lösungen stehen) ermöglichen, den Hauptinhalt einer Webseite zu extrahieren, ohne dabei von anderen Daten wie Navigation, Werbung oder ähnlichem beeinträchtigt zu werden.

Die Idee hinter llms.txt ist vergleichbar mit einer optimierten, Markdown-formatierten Version der wichtigsten Inhalte einer Webseite, die von der Website bereitgestellt wird. Diese Datei liegt in der Regel unter „example.com/llms.txt“ und eignet sich hervorragend, um den Inhalt übersichtlicher und leichter für maschinelle Verarbeitung zu gestalten.

Es gibt jedoch ein Missverständnis: llms.txt ist nicht wie robots.txt, da letzteres dazu dient, Bots zu instruieren, welche Teile einer Webseite gecrawlt werden können. Im Gegensatz dazu bietet llms.txt keine Anweisungen zum Crawlen, sondern stellt Inhalte bereit.

Die Sorgen um mögliche doppelte Inhalte (Duplicate Content)

Eine berechtigte Frage wurde in sozialen Netzwerken gestellt: „Könnte llms.txt als doppelte Inhalte gewertet werden?“ Das könnte tatsächlich passieren, wenn jemand auf diese Datei verlinkt, sodass Google diese in den Suchindex aufnehmen könnte, anstatt sich an den originalen HTML-Inhalt zu halten.

Dieses Problem führte zur Überlegung, ob es sinnvoll sei, eine „noindex“-Anweisung für llms.txt hinzuzufügen. Diese Anweisung verhindert, dass der Inhalt der Datei im Google-Index landet.

John Muellers Antwort

John Mueller von Google äußerte sich dazu und erklärte, dass es technisch nur dann als Duplicate Content eingestuft wird, wenn der Inhalt der llms.txt-Datei identisch mit dem einer regulären Webseite ist. Er fügte hinzu, dass es jedoch eine kluge Idee sein könnte, „noindex“ für solche Inhalte zu verwenden, da es sonst passieren könnte, dass Nutzer die Datei in Google-Suchergebnissen finden – und das wäre für sie seltsam.

Warum „noindex“ für llms.txt sinnvoll sein könnte

Die Implementierung von „noindex“ sorgt dafür, dass Seiten oder Dateien wie llms.txt nicht in Googles Suchindex landen. Dies könnte insbesondere für Dateien wie diese hilfreich sein, die eigentlich nicht für reguläre Nutzer sichtbar oder nutzbar sein sollten.

Ein wichtiger Hinweis ist hierbei auch, dass einfache Verbotsrichtlinien in der robots.txt-Datei nicht ausreichen, da Google durch diese Anweisung zwar nicht crawlt, aber auch keine „noindex“-Header sieht. Das bedeutet, dass die Kombination aus erlaubt (zum Crawling) und „noindex“-Header optimal wäre.

Wie gehst du mit llms.txt um?

Falls du llms.txt auf deiner Webseite implementieren möchtest oder es bereits getan hast, solltest du folgende Punkte beachten:

  • Verwende spezifische Header wie „noindex“, um sicherzustellen, dass der Inhalt der Datei für Suchmaschinen nicht im Index auftaucht.
  • Stelle sicher, dass der Inhalt der Datei sich von deinen regulären Webseiten-Inhalten unterscheidet, damit keine Probleme mit doppelten Inhalten entstehen.
  • Informiere dich regelmäßig über Updates zu Standards und Best Practices in der Branche.

Das war ein kurzer Überblick zur Rolle von llms.txt im Hinblick auf große Sprachmodelle und wie du potenzielle Probleme im SEO-Bereich vermeiden kannst. Außerdem gibt es immer noch Raum für Diskussionen, wie dieser neue Standard sich im realen Einsatz bewährt. Vielleicht möchtest du selbst experimentieren oder dazu beitragen?

Unsere Leistungen:

Das könnte Dich auch interessieren:

Aktuelles aus unserem Ratgeber:

Affiliate-Links: Für einige der unten stehenden Links erhalte ich möglicherweise eine Vergütung als Affiliate, ohne dass dir dadurch Kosten entstehen, wenn du dich für den Kauf eines kostenpflichtigen Plans entscheidest.

Picture of Tom Brigl, Dipl. Betrw.

Tom Brigl, Dipl. Betrw.

Ich bin SEO-, E-Commerce- und Online-Marketing-Experte mit über 20 Jahren Erfahrung – direkt aus München.
In meinem Blog teile ich praxisnahe Strategien, konkrete Tipps und fundiertes Wissen, das sowohl Einsteigern als auch Profis weiterhilft.
Mein Stil: klar, strukturiert und verständlich – mit einem Schuss Humor. Wenn du Sichtbarkeit und Erfolg im Web suchst, bist du hier genau richtig.

Disclosure:  Some of the links in this article may be affiliate links, which can provide compensation to me at no cost to you if you decide to purchase a paid plan. These are products I’ve personally used and stand behind. This site is not intended to provide financial advice and is for entertainment only. You can read our affiliate disclosure in our  privacy policy .