Wenn man in letzter Zeit auf die Entwicklungen rund um Googles Forschungsaktivitäten in Richtung KI-gestützte Suche blickt, taucht ein Begriff immer wieder auf – SAGE. Dahinter steckt kein weiteres Sprachmodell, sondern ein komplett neuer Ansatz zur Erzeugung von Trainingsdaten für sogenannte „agentische“ KI-Systeme, die eigenständig recherchieren und begründet antworten können. Was auf den ersten Blick nach akademischer Spielerei aussieht, hat bei näherem Hinsehen weitreichende Folgen – auch für dich, wenn du dich mit SEO beschäftigst und dich fragst, wie Inhalte künftig von solchen Suchagenten wahrgenommen werden.
Was steckt hinter SAGE?
Das Konzept klingt zunächst simpel: Statt Menschen endlos Datensätze mit Beispiel-Fragen und Antworten zusammenstellen zu lassen, erschafft SAGE diese Daten selbst – und zwar durch ein Zweiergespann von KI-Agenten. Einer von ihnen denkt sich herausfordernde Fragen aus, der andere versucht, sie zu beantworten. Dadurch entsteht etwas, das bisher nur unzureichend vorhanden war: Trainingsmaterial für tiefgehende, mehrstufige Recherchen.
Frühere Datensätze wie HotpotQA oder Musique waren in dieser Hinsicht zu oberflächlich. Sie erforderten im Schnitt nur zwei bis drei Suchvorgänge, um eine Antwort zu finden. Für einfache Faktenfragen mag das reichen – für echte Forschung oder komplexe Informationsfragen allerdings nicht. Genau hier setzt SAGE an: Es will das KI-System zwingen, mehrere Recherche-Schritte in einer Kette zu durchlaufen, ähnlich wie ein Mensch, der mehrere Quellen kombiniert, um eine belastbare Antwort zu finden.
Wie das Zusammenspiel funktioniert
Die „Fragesteller-KI“ entwirft eine Frage, die kompliziert genug sein soll, um nicht sofort lösbar zu sein. Der zweite Agent – der sogenannte Search Agent – führt dann reale Suchvorgänge durch, bewertet die Schwierigkeit und sucht sich Schritt für Schritt an die Lösung heran. Falls es dabei zu einfach geht oder Fehler auftreten, erhält der erste Agent ein detailliertes Feedback über den Ablauf der Recherche und verbessert die Frage. So lernen beide fortlaufend, was eine wirklich anspruchsvolle Informationssuche ausmacht.
Dieses Prinzip ist mehr als nur ein eleganter Technik-Kniff. Es spiegelt eine Realität wider, in der Suchsysteme bald nicht mehr nur einfache Resultate ausliefern, sondern selbst wie ein kleiner Forscher agieren – mit Hypothesen, Quellenbewertung und Korrekturschleifen. Und natürlich: Das, was sie dabei finden, stammt von Webseiten wie deiner.
Warum „Abkürzungen“ im Training problematisch sind – und was sie für SEO verraten
Während der Entwicklung von SAGE stießen die Forschenden auf vier typische Fälle, in denen ihr System gar keinen „tiefen“ Suchprozess brauchte, weil es zu schnell zur Antwort kam. Diese Abkürzungen waren eigentlich unerwünscht – doch gerade sie geben faszinierende Einblicke, welche Arten von Inhalten für solche Agenten besonders attraktiv sind.
1. Information Co-Location – alles an einem Ort
Rund ein Drittel aller Abkürzungen entstand dadurch, dass mehrere entscheidende Informationen auf einer einzigen Webseite zu finden waren. Der Agent musste also nicht mehr zwischen verschiedenen Quellen springen. Für die Forschung war das ärgerlich, für dich als SEO-Visionär aber ein Riesengeschenk: Eine rundum vollständige Seite kann einem KI-System die gesamte „Reise“ ersparen. In der Praxis heißt das: Je besser du zusammengehörige Fakten sauber strukturierst und auf einer Seite abbildest, desto wahrscheinlicher wird sie in Zukunft als komplette Antwortquelle herangezogen.
2. Multi-Query-Collapse – mehrere Fliegen mit einer Suche
Manchmal reichte ein einziger Suchvorgang, um alle nötigen Teilinformationen zu finden – weil diese unter demselben Themen-Cluster vorkamen. Das nennt sich „Multi-Query-Collapse“. Für dich bedeutet das: Wenn deine Inhalte logisch aufgebaut sind, Fragen sinnvoll verknüpfen und Synonyme oder verwandte Konzepte abdecken, kann ein Agent viel mehr daraus ziehen. Eine Seite, die mehrere Unterfragen elegant zusammenführt, wirkt attraktiver als viele dünne Einzelseiten.
3. Superficial Complexity – scheinbar kompliziert, tatsächlich einfach
Etwas ironisch: Manchmal war die Frage besonders lang oder verschachtelt, aber trotzdem simpel zu beantworten, weil der Kernbegriff sehr klar war. Der Agent musste gar nicht „denken“, sondern fand die Lösung sofort. Übertragen auf Content kann das heißen: Klarheit schlägt Pseudo-Komplexität. Es ist verführerisch, Fachbegriffe zu häufen, doch für automatisierte Systeme zählt Zielstrebigkeit. Wenn dein Text direkt die Probleme benennt und beantwortet, wird er eher als „nützlich“ eingestuft.
4. Overly Specific Questions – zu viel Detail
Etwa ein Drittel der Fälle fiel in diese Kategorie. Eine übermäßig präzise Frage führte fast automatisch zur richtigen Quelle, ohne Umweg. Für den Agenten großartig – für das Studienziel schlecht. Für uns SEOs wiederum ist das eine Lektion: Wenn deine Seite genau die Nische adressiert, in der bestimmte Details gesucht werden – etwa Zahlen, Namen oder Zeiträume –, erhöht das die Chance, dass eine KI sie direkt als Treffer auswählt.
Was heißt das für deine Inhalte konkret?
Man könnte nun vorschnell glauben, man müsse nur „mehr Informationen“ auflisten, um von KI-Agenten entdeckt zu werden. Doch die Kunst liegt – wie so oft – im Gleichgewicht. Aus all diesen Beobachtungen ergeben sich drei wichtige Prinzipien, die ich dir ans Herz legen möchte:
- Ganzheit, aber Fokus: Eine Seite darf umfassend sein, solange sie einem klaren Thema folgt. Wenn du auf einer Seite alles zur Photovoltaik erklären willst, sei es zum Aufbau, zur Förderung und zu den gängigen Mythen – wunderbar. Aber vermisch nicht Solarzellen mit Windkraftanlagen, nur weil du „mehr Content“ liefern willst.
- Struktur schlägt Länge: KI-Agenten – egal ob sie in Suchergebnisse oder interne Systeme integriert sind – bevorzugen klar segmentierte Inhalte. Verwende Abschnitte, Fragenüberschriften und kurze Erklärungen. Damit signalisierst du: Hier bekommst du alle Antworten an einem Ort.
- Werde zur Abkürzung: Im Forschungsprojekt war eine „Abkürzung“ ein Fehler im Training, im echten Web ist sie der Sieg. Wenn dein Content der einfachste Weg zur richtigen Information ist, gewinnst du.
Agentische Suche funktioniert (noch) über klassisches Ranking
Etwas, das oft untergeht: Auch diese intelligenten KI-Agenten basieren bei ihren Entscheidungen immer noch auf traditioneller Suchtechnik. In der Studie wurde deutlich, dass der Agent seine Informationen bevorzugt aus den drei bestbewerteten Seiten jeder Suchanfrage zieht. Ob das auch in freier Wildbahn so bleibt, lässt sich zwar nicht sicher sagen, aber die Richtung ist klar: Ohne gute klassische Rankings wirst du kaum von solchen Systemen gefunden werden.
Deshalb bleibt eines unverändert: SEO-Grundlagen sind noch lange nicht überholt. Inhalte mit sauberer Onpage-Struktur, nachvollziehbaren Titeln, internen Verlinkungen und thematischer Relevanz bilden die Brücke zwischen menschlicher Suche und maschineller Recherche. Stichworte wie Core Web Vitals, semantische Verknüpfungen und Nutzerintention sind nach wie vor entscheidend.
Ein Gedanke aus der Praxis
Ich habe vor einigen Monaten bei einem Kunden erlebt, wie genau das greift: Eine Seite, die ursprünglich nur als FAQ gedacht war, begann plötzlich, in KI-generierten Antworten aufzutauchen – obwohl wir dafür keinerlei spezielle „Prompt-Optimierung“ betrieben hatten. Der Grund: Die Seite rankte seit Monaten konstant auf Platz zwei zu ihrem Hauptkeyword und beinhaltete fast alle relevanten Fakten in tabellarischer Form. Das reichte offenbar, um von experimentellen Recherche-Agenten aufgegriffen zu werden.
Und das bringt uns zu einem fast ironischen Punkt: Während viele Marketer fieberhaft versuchen, sich auf eine „AI-Suchwelt“ vorzubereiten, genügt es oft, die klassische, handwerkliche SEO sauber zu beherrschen. Agentische Systeme lesen das Web durch die Brille der Google-Suche – sie fangen ja dort an.
Wie du von dieser Entwicklung profitieren kannst
Wenn du jetzt erwartest, eine Checkliste für „SAGE-Optimierung“ zu bekommen – die gibt es nicht. Aber ich kann dir aus dieser Forschungsrichtung ableiten, was dich stärkt:
- Optimiere für Tiefe, nicht für Masse. Eine fundierte, sauber erklärte Seite bringt dich weiter als fünf mäßige Artikel mit ähnlichem Inhalt. KI erkennt Wiederholungen längst besser, als es Menschen tun.
- Verbinde Seiten intelligent. Interne Links sind nicht nur für Benutzer da. Für einen Suchagenten sind sie Wegweiser. Wenn du thematisch passende Seiten untereinander verbindest, kann die KI ihre eigene “Recherchekette” effizienter durchlaufen – inklusive deiner Inhalte.
- Bleib aktuell und zitierbar. Quellenformatierungen, Datumsangaben und Analysen signalisieren Vertrauenswürdigkeit. Künstliche Agenten nutzen genau solche Strukturen, um Informationen zu validieren.
- Ranke bewusst unter den Top 3. So banal es klingt: Wenn das Experiment zeigt, dass Agents genau dort ansetzen, ist das ein starkes Argument, dein Augenmerk wieder stärker auf organisches Top-Ranking zu legen.
Ein Blick nach vorn
Mit SAGE entwickelt Google ein Werkzeug, das es ermöglicht, KI-Systeme in einer neuen Qualität zu trainieren – solche, die selbstständig, kritisch und mehrschichtig recherchieren. Für die Welt der Suchmaschinenoptimierung bedeutet das keine Revolution über Nacht, sondern eine Evolution hin zu Qualität und Vernetzung. Statt Tricks zählen Konsistenz, Inhalte mit Mehrwert und eine klare Struktur, die einem intelligenten Agenten erlaubt, ohne Umwege Antworten zu extrahieren.
Wenn ich ehrlich bin: Das ist seit Jahren eigentlich der Kern guter SEO-Arbeit. Nur dass du künftig nicht mehr nur für Menschen optimierst, sondern gleichzeitig für Maschinen, die denken – oder zumindest überzeugend so tun. Es ist also höchste Zeit, wieder mehr Substanz in Texte zu bringen und strategisch über Themenstrukturen nachzudenken. Denn eines zeigt dieses Forschungsprojekt deutlich: Wer die Informationslandschaft logisch und hilfreich organisiert, wird zur unvermeidlichen Quelle – für Menschen wie für KI.