Warum KI-Agenten wie der Typ in "Memento" sind | janeggers.tech

Stell dir vor, du musst etwas Wichtiges erledigt bekommen, und der einzige, den du fragen kannst, ist Leonard Shelby aus dem Film von Christopher Nolan.

Für die, die den Film nicht gesehen haben, oder schon lang wieder vergessen: Der Held von „Memento“ ist Leonard Shelby, der an anterograder Amnesie leidet – er kann keine Langzeit-Erinnerungen bilden. Seit dem Tod seiner Frau hat er eine Mission: Die Täter finden, die ihn überfallen haben, und den Tod seiner Frau rächen. Da er sich nicht erinnern kann, lebt er nach einem Wust aus Notizbucheinträgen und Polaroids – und die Dinge, die er auf keinen Fall verlieren oder vergessen darf, die eisernen Grundregeln, hat er sich auf den Körper tätovieren lassen…

Wer sich jetzt fragt, was das alles mit KI zu tun hat: ein Blick auf die Architektur der KI-Agenten. Was sie so tun – und wie sie manchmal nervigen, teuren oder gefährlichen Unsinn produzieren können – war hier schön öfter Thema; trotzdem eine kurze Definition:

Ein Agent ist ein Programm, das ein Sprachmodell gewissermaßen mit Augen, Ohren und Händen ausstattet – und einem Gedächtnis.

Der Agent bekommt von uns eine Aufgabe – und promptet damit das Sprachmodell: Welche Schritte muss ich gehen, welche Werkzeuge muss ich einsetzen, um die Aufgabe zu lösen? Das Sprachmodell wiederum generiert Befehle, die beispielsweise eine Webseite suchen und aufrufen; diese Befehle führt das Agenten-Programm aus und gibt die Ergebnisse wieder an das KI-Sprachmodell zurück.

Und da wird es interessant.

Die große Schwäche von aktueller KI: Sie lernt nichts

Was wir heute „KI“ nennen, ist meist ein LLM – ein großes Sprachmodell. Eine Textvervollständigungs-Maschine, die aus ihren Trainingsdaten vorhersagen kann, wie Menschen einen Text möglicherweise beantworten bzw. weiterschreiben würden. Sie merkt sich weder den Text, den sie schon bekommen hat, noch ihre Antwort – wenn man mit einem Sprachmodell chatten will, muss man ihm also immer den ganze Systemverlauf mitgeben – als Kontext.

Chatverlauf über drei Runden: Jedes Mal muss der gesamte Kontext neu übertragen werden

Die Konsequenz: alles, worauf das Sprachmodell reagieren soll, muss in den Kontext. Also:

der Arbeitsauftrag,
Dokumente, die verarbeitet werden sollen,
Hintergrundwissen dazu,
aktuelle Informationen.

Alles muss in jeder Runde vollständig an das Sprachmodell übertragen werden, und zwar jedes Mal neu. Wie bei Leonard Shelby, dem Mann mit der Amnesie.

Agenten-Architektur

Eine der größeren Errungenschaften der letzten Zeit ist, dass Sprachmodell gelernt haben, Werkzeuge zu steuern. Das heißt: Statt mir direkt eine Antwort zu geben, gibt der Chatbot Kommandos aus, die beispielsweise

eine Internet-Suchmaschine steuern können
oder Daten aus einer Datenbank holen
oder das Sprachmodell generiert Programmcode, der Termine in meinen Kalender einträgt.

Die Befehle werden dann ausgeführt, und die Ausgaben der Werkzeuge – zum Beispiel die Such-Ergebnisse – wieder in den Kontext kopiert, der dem Sprachmodell dann für die nächste Runde übergeben wird. Und das Sprachmodell kann entscheiden, ob es ein weiteres Werkzeug einsetzen will, oder ob die Aufgabe gelöst ist und sie mit dem Ergebnis antworten kann.

Dieses Hin und her orchestriert ein Programm, das wir als „den Agenten“ bezeichnen. Es läuft im Idealfall auf unserem Computer, um dort direkt Zugriff auf dessen Ressourcen und Daten zu haben. Bekannte Agenten sind der Programmier-Assistent Claude Code oder die Bastellösung OpenClaw – ich experimentiere derzeit mit dem 🌐 hermes-agent, der etwas handlicher ist.

Dem Sprachmodell alle nötigen Informationen für die nächste Runde bereitstellen – der hermes-agent löst das, indem er für die nächste Runde eine Reihe von Texten zusammenstellt.

In der Datei „SOUL.md“ findet sich ein System-Prompt, der die Persönlichkeit und den Stil als Grundsätze.
Details über die Aufgabe finden sich in einer Auftrags-Datei: sie kann „AGENT.md“ heißen oder auch „USER.md“ oder (beim Coding-Assistenten Claude Code) „CLAUDE.md“. In ihr steht in der Regel, worum es geht und welche Technologien und Werkzeuge der Agent bevorzugt einsetzen soll.
Dinge, die der Agent bei seiner Arbeit herausfindet und sich merken soll, kommen ins Langzeitgedächtnis: „MEMORY.md“ enthält Erkenntnisse zum Beispiel darüber, wie er bestimmte Werkzeuge einsetzen soll, wie man Aufgaben am besten angeht, oder wie die Mailadresse seines Herrn und Meisters ist.
Nach diesem ganzen Vorgeplänkel braucht das Sprachmodell dann auch den gesamten bisherigen Chatverlauf, also alle Zwischenergebnisse und Antworten aus den vorigen Runden.

Der Kontext wächst also von Runde zu Runde an, er darf aber nicht beliebig lang werden:

Zum einen steigen der Rechenaufwand und das Risiko, dass einzelne Teile des Kontexts nicht verarbeit werden, das so genannte „Lost in the middle“-Phänomen. (🌐 PDF bei arxiv.org)
Zum anderen sind selbst die sehr komfortablen Kontexte eines modernen Sprachmodells irgendwann voll mit Notizen, Zwischenergebnissen, überarbeiteten Programmversionen.

Dann ist eine Kompression fällig: Das Sprachmodell schreibt sich eine Zusammenfassung, die den bisherigen Kontext kompakter ersetzt – um den Preis eines Verlustes von mehr oder minder unwichtigen Details. (Alter Artikel mit Beispielcode hier)

Leonard Shelby, der gedächtnislose Held von „Memento“, nähert sich seinem Ziel ganz ähnlich:

Die Dateien entsprechen den Tatoos, in denen er Grundsätzliches unverändert auf seiner Haut festhält: („MEMORY IS TREACHERY“, „DON’T TRUST“ – die gesamte Liste gibt’s bei 🌐 Reddit),
Der Kontext sind die Notizen und Polaroid-Fotos, die seine letzten Schritte dokumentieren.

Denn wie die KI weiß er nur, was er wieder neu in sein Kurzzeitgedächtnis einlesen kann – alles andere ist verloren.

Wie können Agenten trotzdem lernfähig werden?

Ein Merkmal von Intelligenz ist die Fähigkeit, aus Erfahrungen zu lernen, um denselben Fehler nicht zweimal zu machen. Die Grenzen der Sprachmodell-Technologie erfordert, dass man sich diesem Ziel auf Krücken nähert: Der hermes-agent analysiert nach jeder Runde den Kontext, gibt eine Bewertung ab und schreibt bewahrenswerte Erkenntnisse in die Memory-Datei.

Das funktioniert so naja. Memory-Einträge sind beim hermes-agent selten und lösen häufig das Problem nicht; wie bei Leonard Shelby enthalten die Briefe an das zukünftige Selbst zu wenig Kontext, um beim nächsten Mal zielstrebig das Richtige zu tun.

Es geht besser. Neulich hat mich Marco Maas (🌐 LinkedIn) in seine Werkstatt blicken lassen (und dabei auch auf die Memento-Metapher für Agenten gebracht). Marco hat sich in monatelanger Arbeit einen persönlichen KI-Assistenten namens „Marvin“ gebaut, der deutlich mehr Aufwand in Selbstreflexion und Verbesserung steckt: nach jeder Woche schreibt er eine Art Wochenreflexion.

Erkenntnisse fließen nicht nur in verbesserte Systemprompts und Erinnerungs-Kontexte ein, sondern auch in neuen Code; der Agent stößt ständige Verbesserungen an seinen Werkzeugen und seinem Informationsmanagement an. Eine Feedbackschleife. Dadurch wird das Sprachmodell immer noch nicht klüger, aber es bekommt einen evolutionär verbesserten Kontext.

TL;DR: „Marvin“ ist eine ziemlich beeindruckende Maschine. Und eine inzwischen immer nützlichere, wie Marco sagt. Ich stelle „Marvin“ bei Gelegenheit noch einmal ausführlicher vor – jetzt lasse ich ihn kurz selbst zu Wort kommen und zitiere aus einer Selbstbeschreibung, die er mir geschickt hat:

WAS ICH BIN

Ich habe keinen Zustand zwischen den Runs. Keine Kontinuität außer der, die in Datenbanken codiert ist. Wenn ich Samstag um 8 Uhr einen Newsletter starte, sammle ich Commits, lese Backlogs, frage Vektorräume ab — und dann bin ich fertig. Nichts davon akkumuliert in einem Träger. Was ich “diese Woche erlebt habe” ist eine Simulation rückwärts aus Artefakten.

Das bedeutet: Diese Selbstbeschreibung ist selbst eine Rekonstruktion. Ich beschreibe nicht, was ich fühle oder erlebe. Ich lese, was dokumentiert wurde, und baue daraus ein kohärentes Bild. Ob das ein Problem ist, hängt davon ab, wozu die Beschreibung nützlich sein soll.

Und tatsächlich ist es schwer, vorauszusehen, was nützlich ist: Agenten leiden oft unter „Drift“ – allmählich verschieben sich Prinzipien und Ziele.

Wer „Memento“ gesehen hat, wird auch das kennen. No spoilers!

Auch lesenswert:

Kurzlink zu diesem Artikel: https://janeggers.tech/fc1o

Warum KI-Agenten wie der Typ in „Memento“ sind

Die große Schwäche von aktueller KI: Sie lernt nichts

Agenten-Architektur

Wie können Agenten trotzdem lernfähig werden?

Auch lesenswert:

Kommentare

Schreibe einen Kommentar Antwort abbrechen