Ende der vergesslichen KI dank Googles Titans und MIRAS

Manchmal kündigt sich ein großer technischer Sprung nicht durch lautstarke Ankündigungen an, sondern durch zwei scheinbar „trockene“ Forschungsarbeiten. Genau das passiert gerade bei Google: Mit den Konzepten Titans und MIRAS wird eine neue Ära der KI eingeläutet – eine, in der Maschinen endlich den Faden behalten, statt ständig das Gedächtnis zu verlieren.

Mehr als nur längere Kontexte

Seit Jahren stoßen große Sprachmodelle an dieselbe Grenze: Je länger der Kontext, desto schwieriger wird es, Informationen sinnvoll miteinander zu verknüpfen. Erinnern, Zusammenhänge halten, Entscheidungen auf Basis älterer Details treffen – all das fällt Modellen bislang schwer. Genau hier setzen Titans und MIRAS an. Beide Konzepte versuchen, künstlicher Intelligenz ein echtes, strukturiertes Gedächtnis zu geben – nicht nur kurzfristig, sondern über sehr lange Informationsketten hinweg.

Was Titans besonders macht

Das Titans‑Modell ist nicht einfach ein weiterer Transformer‑Abkömmling, sondern eine Architektur mit Langzeitgedächtnis. Ihr Kern ist ein Modul, das laufend mitlernt, welche Daten wirklich wichtig sind. Dabei orientiert es sich an einem sogenannten Surprise Metric: Immer wenn neue Informationen stark von bisherigen Mustern abweichen, wird das als „Überraschung“ registriert – und das Modell entscheidet, dass diese Information womöglich entscheidend ist.

So entsteht eine Art „Aha‑Moment“‑Erkennung innerhalb des Modells. Es speichert nicht stumpf jede Kleinigkeit, sondern merkt sich Auffälligkeiten, die für künftige Schritte relevant sein könnten. Zusätzlich nutzt Titans ein Konzept namens Momentum: Wenn etwas Wichtiges erkannt wurde, bleibt der Fokus eine Zeit lang auf diesem Thema bestehen, selbst wenn die folgenden Daten weniger spektakulär sind. Das erinnert fast an unsere eigene Art, einer Story konzentriert zu folgen, nachdem etwas Spannendes passiert.

Natürlich kann kein künstliches System unbegrenzt Erinnerungen sammeln. Deshalb integriert Titans einen Mechanismus, der Überflüssiges gezielt entfernt – eine Art „Forget Gate“. Ältere, irrelevante Informationen werden abgeschwächt, damit Raum für Neues entsteht. Zusammen ergeben diese drei Mechanismen – Überraschung, Momentum, Vergessen – eine Art dynamisches Gedächtnis‑Management, das weit über klassische Modelle hinausgeht.

MIRAS – der konzeptionelle Überbau

Während Titans eher eine konkrete Architektur beschreibt, bietet MIRAS einen theoretischen Rahmen. Das Kürzel steht für ein Framework zur Gestaltung von Modellen mit assoziativem Gedächtnis. Hier wird jedes KI‑System als eine Kombination aus vier Gestaltungsentscheidungen verstanden:

Memory‑Struktur – also die physische Form der Erinnerung, etwa einfache Vektoren oder tief verschachtelte neuronale Schichten wie bei Titans.
Aufmerksamkeits‑Priorität – das Regelwerk, das bestimmt, welche eingehenden Daten Aufmerksamkeit verdienen.
Stabilität und Vergessensrate – die Balance zwischen „lernen“ und „behalten“.
Lernalgorithmus – beispielsweise Gradientenmethoden, mit denen das System während der Nutzung weiterlernt.

Aus meiner Sicht ist MIRAS das eigentlich Spannende: Es erlaubt Forschenden, neue Gedächtnis‑Modelle gezielt zu konstruieren, statt nach dem Prinzip Hoffnung unzählige Varianten auszuprobieren. So wird aus dem bisherigen Trial‑and‑Error‑Ansatz ein systematischer Baukasten.

Warum heutige KI vergesslich ist

Die meisten Sprachmodelle verarbeiten nur, was sie im Moment sehen. Je mehr Text sie berücksichtigen sollen, desto größer werden Rechenaufwand und Speicherbedarf. Darum nutzen sie Tricks:

Attention‑Fenster – sie schauen bei Bedarf in frühere Passagen zurück, was jedoch teuer und langsam ist;
State Compression – sie fassen Vorangegangenes zusammen, wobei Details verloren gehen.

Beide Methoden funktionieren, aber keine ist wirklich gut, wenn der Kontext Millionen Tokens umfasst. Letztlich fehlt ein aktives Gedächtnismanagement – etwas, das entscheidet, was wirklich bleiben muss. Genau das versuchen Titans und MIRAS zu lösen.

Zwei Forschungsrichtungen, ein Ziel

Dass Google gleich zwei separate Arbeiten veröffentlicht hat, ergibt Sinn: Titans zeigt, dass sich Langzeitgedächtnis praktisch implementieren lässt. MIRAS liefert das theoretische Fundament, auf dem künftig weitere Systeme aufbauen können. Beide ergänzen sich, statt miteinander zu konkurrieren.

Titans in Aktion

Im Einsatz funktioniert Titans als eine Art Gedächtnisschicht über bestehenden Modellen. Es speichert repräsentative Informationen, ohne alles ständig neu berechnen zu müssen. Damit kann es auch auf extrem lange Eingaben reagieren, ohne sich in Rechenkosten zu verlieren. Das Besondere: Titans ist nicht als Ersatz gedacht – eher als Ergänzung, eine zusätzliche Ebene, die bestehende Transformer oder RNN‑Modelle erweitert.

MIRAS als Denkschule

MIRAS wiederum betrachtet jedes Sequenzmodell als Netzwerk von Assoziationen. Der Ansatz hilft, Ähnlichkeiten zwischen unterschiedlichen Architekturen zu erkennen – was Entwickler dabei unterstützt, effektiver neue Varianten zu entwerfen. Es ist so etwas wie eine gemeinsame Grammatik für Gedächtnis‑basierte KI‑Systeme.

Was zeigen die Tests?

Entscheidend ist natürlich, ob das Ganze nicht nur auf dem Papier funktioniert. In ausgedehnten Benchmarks zeigte Titans eine nahezu unglaubliche Fähigkeit, Kontexte von über zwei Millionen Tokens zu verarbeiten – und das, ohne an Präzision zu verlieren. Selbst im Vergleich zu weitaus größeren Modellen (sogar im GPT‑4‑Bereich) lieferte Titans oft bessere Trefferquoten, obwohl es weniger Parameter besitzt. Besonders beeindruckend war der Test auf dem BABILong‑Datensatz, bei dem relevante Fakten in riesigen Dokumenten versteckt waren. Hier konnte Titans Zusammenhänge rekonstruieren, die andere Systeme schlicht vergaßen.

Die MIRAS‑Studie zeigte zusätzlich, dass diese Prinzipien nicht auf ein einzelnes Modell beschränkt sind. Selbst ganz unterschiedlich aufgebaute Netzwerke, die nach demselben Framework entworfen wurden, erzielten durchweg bessere Resultate in Langkontext‑Aufgaben.

Weshalb das so bedeutsam ist

Ich finde spannend, dass die Forschenden nicht einfach versuchen, „mehr Speicher“ einzubauen. Stattdessen verstehen sie Gedächtnis als aktiven Prozess – etwas, das gepflegt, bewertet und aktualisiert wird. In dieser Logik wird eine KI ein Stück weit „bewusster“ ihres eigenen Erfahrungsraums. Das klingt philosophisch, ist aber rein technisch: Ein Modell entscheidet statistisch, was es halten oder verwerfen sollte. Trotzdem entsteht daraus ein Verhalten, das unserem Lernen erstaunlich ähnelt.

Die Quintessenz der Arbeiten

Im Fazit der Titans‑Studie wird betont, dass sich kurzfristige Verarbeitung und langfristige Erinnerung kombinieren lassen, ohne den Aufwand ins Unendliche zu treiben. Das Ziel sei nicht, bestehende Transformer zu ersetzen, sondern sie um eine echte Erinnerungsfähigkeit zu erweitern.

Das MIRAS‑Papier geht noch weiter: Es definiert ein Vokabular und ein System, mit dem sich zukünftige Gedächtnis‑Modelle planen und vergleichen lassen. Damit erhält das Feld der Sequenzmodellierung erstmals ein konsistentes theoretisches Fundament – ähnlich wie vor Jahren die Einführung der Backpropagation die Lernverfahren ordnete.

Eine neue Generation von KI‑Gedächtnis

In Googles eigenen Worten markiert diese Kombination einen Paradigmenwechsel. Die Modelle lernen „on the fly“, also während sie Daten lesen, was einer echten kontinuierlichen Gedächtnisbildung entspricht. Dadurch überwinden sie die bisherigen Grenzen fix definierter Speicherzustände. MIRAS wiederum verknüpft zum ersten Mal Online‑Optimierung, assoziatives Gedächtnis und Architekturdesign zu einem Ganzen.

Oder einfacher gesagt: Die KI lernt nicht nur, was sie sagen soll – sie lernt auch, wie sie erinnern soll. Das ist der entscheidende Unterschied. Damit öffnet sich die Tür zu Systemen, die ohne externe Speichertricks flüssig über lange Dokumente, Gespräche oder Zeiträume denken können.

Meine Einschätzung

Wenn man dieses Konzept weiterdenkt, könnte es das sein, was der Schritt von „Sprachmodell“ zu „denkender Assistent“ wirklich braucht. Bislang war jedes große Modell eher ein erstaunlich guter Kurzzeit‑Denker – brillant für Momentaufgaben, aber vergesslich. Titans und MIRAS deuten an, dass maschinelles Denken bald auch kohärent über Zeit funktionieren kann.

Natürlich ist das alles noch Grundlagenforschung. Kein Produkt, kein fertiges System. Aber wer in der KI‑Entwicklung arbeitet, weiß: Solche Papiere sind die Sprungbretter für das, was in ein, zwei Jahren Alltag sein wird. Wenn Google diesen Ansatz in seine großen Modelle integriert, wird nicht nur deren Kontextlänge steigen – sondern auch die Art, wie sie Informationen aus der Vergangenheit nutzen.

Es bleibt noch zu sehen, wie stabil das Ganze in realen Umgebungen funktioniert. Auch Fragen der Effizienz und Datensicherheit (welche Erinnerungen darf ein Modell langfristig behalten?) werden spannend. Trotzdem lässt sich schon jetzt sagen: Gedächtnis wird zur zentralen Ressource im KI‑Design – und Titans und MIRAS sind der vielleicht überzeugendste Versuch, diese Ressource endlich ordentlich zu organisieren.

So entsteht KI, die nicht nur reagiert, sondern gedanklich mitschreibt. Und genau das dürfte in Zukunft den entscheidenden Unterschied machen.

Aktuelles aus unserem Ratgeber:

News

Google Patent zeigt: AI Landingpage erhöht Shop Conversions Jetzt lesen »

13.03.2026

News

Google Vorschaubilder optimieren: So wählst du das perfekte Vorschaubild Jetzt lesen »

12.03.2026

News

Grounding und RAG: KI Halluzinationen endgültig stoppen Jetzt lesen »

12.03.2026

News

Voiceprint Plugin: KI schreibt in deinem einzigartigen Stil Jetzt lesen »

11.03.2026

Affiliate-Links: Für einige der unten stehenden Links erhalte ich möglicherweise eine Vergütung als Affiliate, ohne dass dir dadurch Kosten entstehen, wenn du dich für den Kauf eines kostenpflichtigen Plans entscheidest.

Tom Brigl, Dipl. Betrw.

Ich bin SEO-, E-Commerce- und Online-Marketing-Experte mit über 20 Jahren Erfahrung – direkt aus München.
In meinem Blog teile ich praxisnahe Strategien, konkrete Tipps und fundiertes Wissen, das sowohl Einsteigern als auch Profis weiterhilft.
Mein Stil: klar, strukturiert und verständlich – mit einem Schuss Humor. Wenn du Sichtbarkeit und Erfolg im Web suchst, bist du hier genau richtig.

Disclosure: Some of the links in this article may be affiliate links, which can provide compensation to me at no cost to you if you decide to purchase a paid plan. These are products I’ve personally used and stand behind. This site is not intended to provide financial advice and is for entertainment only. You can read our affiliate disclosure in our privacy policy .