"A journalist who is also a bad programmer, stylized in the style of Gary Larson"
Erklärgrafik: Zirkulärer Vorgang beginnt mit "You're in a forest", dann entscheidet ein Nutzer: "Go to village", Bild eines Dorfes wird dazu erzeugt.

KI-Daily-Soap zum Mitmachen: Wie „Evertrail“ sich seine eigene Geschichte schreibt

„Das Dorf zu beschützen wird dir mehr abverlangen als nur Tapferkeit“, sagt die von der KI erfundene Ork-Kämpferin. Und wir müssen nun entscheiden, ob wir ihr helfen, auch wenn ein magisches Artefakt uns die Lebenskraft aussaugt. Wie wird die Geschichte weitergehen? Und was passiert, wenn jemand in diesem Szenario ein Mobiltelefon nutzen will?

Eine Geschichte, die sich weiter erzählt – je nachdem, was die Leserinnen und Leser entscheiden: „Evertrail“ ist eine immersive Daily Soap für das KI-Zeitalter. Ein Blick hinter die Kulissen der interaktiven Fortsetzungs-Geschichte.

Trollfigur im Illustrations-Stil eines Computerspiels, mit der Geschichte und drei Handlungsoptionen: "1. Agree to join the orc lady, 2. Decide to alert the village guards, 3. Scout the ruins alone first to assess the danger"

Philipp hat in seinem Leben schon viele spannende Dinge getan – ist nach China gegangen, hat programmiert, hat die journalistische Beobachtung von Suchmaschinen miterfunden, hat eine Online-Community in einer 2D-Pixelwelt aufgebaut, hat alte Werbeschilder für die Nachwelt gerettet, hat Corona-Demonstrationen fotografiert. Seit generative KI sich explosionsartig entwickelt, ist er fasziniert von ihr – und nutzt sie als Werkzeug für Zukunftsvisionen, satirische Bilderserien und neuerdings auch ganze absurd-kreative Actionfilme. Kann man sich – und sollte man sich – alles in seinem Instagram-Kanal ansehen.

Und er baut immer wieder faszinierende KI-Experimente – eins davon greift eine Leidenschaft seiner Jugend auf: „Choose-your-own-adventure“-Bücher. Abenteuergeschichten, bei denen die Leserin gefordert ist, für die Hauptfigur zu entscheiden: Den rechten oder linken Höhleneingang, den mit den heulenden Winden, oder der, aus dem es verführerisch nach Braten duftet? Je nachdem, wie sich die Leserin entscheidet, wird sie auf eine andere Fassung des nächsten Kapitels der Geschichte verwiesen.

In einem gedruckten Buch sind die Möglichkeiten begrenzt; Computerspiele haben die Choose-your-own-adventure-Bücher in Sachen Immersion und Interaktivität überflügelt und verdrängt. Aber die Idee einer wandelbaren Geschichte hat einen mysteriösen Reiz – ganz besonders, wenn die Geschichte nicht von Buchdeckeln begrenzt wird, sondern sich gewissermaßen selbst weitererzählt, ganz auf der Basis der Entscheidungen der Leserinnen und Leser.

Und genau das hat Philipp mit KI als „Evertrail“ gebaut. Auf Twitch.

Jan: Was ist Evertrail? Wie würdest Du Deiner Großmutter Evertrail beschreiben?

Philipp: Evertrail ist ein Abenteuer, bei dem jeder mitmachen kann, die Geschichte mitbestimmen. Das läuft auf Twitch, einer Streaming-Plattform. Dahinter steht aber kein Autor, keine Autorin. Eine künstliche Intelligenz schreibt die Geschichte in Echtzeit. Und malt die Bilder. Es ist nämlich alles bebildert.

Die Leute entscheiden, wie die Geschichte weitergehen soll. Die KI bekommt das mit. Sie kennt die bisherige Geschichte und spinnt sie dann weiter in die Zukunft. Und schreibt und malt dann das Abenteuer.

This game drawn by Dall-E has a ChatGPT host chatting with you.

Jan: Ich finde das Räderwerk spannend, das die Geschichte in Bewegung hält. Du hast also erst mal ein Sprachmodell, das Dir diese Geschichte schreibt. Wie hast du das gepromptet? Was hast Du der KI gesagt?

Philipp: Die Grundlage ist ein Geschichten-Anfang, den ich selber schreibe. Ich habe etwa zwei Dutzend Anfänge von Geschichten. Zum Beispiel: Ein Fantasy-Abenteuer, es fängt im Wald an, wir sind ein Held auf der Suche nach Ruhm und Abenteuer.

Und von hier gerät die KI einen Kreislauf, wo sie die Geschichte weiterspinnen kann.

Eine Geschichte erzählt sich gewissermaßen selbst

In der Original-Form von Evertrail hast du bei jeder Station drei Möglichkeiten. Das ist, das erkläre ich jetzt nicht mehr meiner Oma, alles im JSON-Datenformat gehalten, also in einem JavaScript-Notationsformat. Die OpenAI-API, die Maschinenschnittstelle, gibt mir seit dem vergangenen November die Möglichkeit, die KI im JSON-Format antworten zu lassen. Und das übernimmt ein Programm automatisch zurück in mein Format.

Daraus lasse ich dann von DALL-E, dem KI-Bildgenerator, ein Bild erzeugen, auch über die API. Auch daran ist kein Mensch mehr beteiligt. Ich habe da verschiedene Themen, je nach den Guardrails sage ich dann zum Beispiel: das Bild soll wie ein Foto aussehen oder nach Fantasy. DALL-E liefert mir dann das Bild innerhalb von ungefähr 10 bis 20 Sekunden.

Der Zyklus aus dem Beitragsbild, Überschrift: "The new part replaces the seed." (Kasten: You're in a forest now)
Wie der Evertrail-Zyklus durchläuft, hat Philipp bei Linkedin mit einer kleinen Diashow erklärt – Klick auf das Bild führt zum Original-Post

Jan: Wie können jetzt die Zuschauerinnen und Zuschauer in die Geschichte eingreifen?

Philipp: Die haben jetzt diese drei Optionen von der KI bekommen, mit dem Bild und der Geschichte. Jetzt stimmen sie ab: wenn die meisten Leute sagen, lass uns mit Option 1 weitermachen, sage ich der KI einfach, diese Option haben die Leute ausgewählt.

Bei jeder zweiten oder dritten Station gibt es den Joker. Da kann eine zufällig ausgewählte Person einen Freitext eingeben. Zum Beispiel sagen, der Zauberer stirbt oder wir finden eine Schatzkiste mit Diamanten.

Ich mache ChatGPT nichts vor: ich baue das jetzt nicht in einen Prompt um, sondern ich sage: wir befinden uns in einem „Choose-Your-Own-Adventure“-Spiel, und das haben die Leute ausgewählt. Dadurch gebe ich ChatGPT die Möglichkeit zu verstehen, was ich mache.

Jan: Im Prinzip muss jede Anfrage bei der KI also immer die gesamte Vorgeschichte enthalten? Wird das dann nicht zu lang für die KI?

Philipp: Die Vorgeschichte lasse ich nach jeder Station einmal zusammenfassen; dadurch garantiere ich, dass es nicht zu lang wird. Das hat zur Folge, dass die Geschichte manche Details vergisst, aber das Wichtigste summiert die KI dann immer wieder kurz neu. So habe ich praktisch ein Langzeitgedächtnis für die KI gebaut.

Aus dem Handy macht die KI automatisch einen Kommunikationskristall

Ist dir die Geschichte auch schon mal weggelaufen? Irgendwohin, wo du es gar nicht erwartet hast?

Philipp: Ich gebe „Guardrails“ vor, Schranken. Ich zäune die Geschichte sozusagen ein; ich sage, die Geschichte spielt auch tatsächlich nur im Mittelalter und darf nicht in die Zukunft springen. Wenn also ein Benutzer möchte, dass er jemanden über sein Handy zu Hilfe rufen kann, blockt die KI das ab. Diese Guardrails garantieren, dass die Geschichte vernünftig weiterläuft.

Erklärbild mit dem Evertrail-Zyklus: "...or decide to leave it open." In einem gestrichelten Kreis mit den Worten "Ensure it's medieval fantasy" ist symbolisch ein Zauberer zu sehen, der verdutzt auf ein Handy blickt: "The wizard, confused, looks at the unusual apparatus."

Die Leute haben viel Spaß daran, dass sie versuchen, die „Guardrails“ auszuhebeln. Zum Beispiel haben sie es einmal geschafft, dass die Geschichte in einer Cäsar-Verschlüsselung geschrieben wurde, das ist ein einfacher Code, bei dem man die Buchstaben im Alphabet verschiebt. Sie haben irgendwie geschafft, die Erzählerin nur noch Geheimschrift schreiben zu lassen.

Das geht ja vermutlich über den „Joker“, den du erwähnt hast, die Möglichkeit, dass eine Person einen beliebigen Text eingibt. Prüfst Du den nochmal?

Philipp: Da frage ich ChatGPT: passt das in die Geschichte? Ist das irgendwie beleidigend oder obszön? Wenn ChatGPT mir sagt: das ist okay, wird es wörtlich in die Geschichte übernommen, und wenn nicht, gibt mir die KI automatisch eine Alternative. Wenn beispielsweise jemand in einem Fantasy-Abenteuer im Mittelalter ein Handy in der Schatztruhe gefunden haben will, wird ChatGPT das automatisch umschreiben zu einem Kommunikationskristall, der die Figuren über weite Strecken miteinander sprechen lässt.

Das klappt auch sehr, sehr gut und ist für die Leute lustig; sie spielen so eine Art Spiel mit dem Spiel, gegen die Guardrails und das macht auch Spaß.

Dass die Nutzer die Grenzen testen, ist eins – hat auch die KI Eigenheiten, gegen die Du arbeiten musst, wenn die Geschichte sich autonom fortschreibt?

Philipp: Beispielsweise die Textlänge: Ich fange immer sehr kurz an, aber es pendelt sich dann nach fünf Runden immer zu so einer gewissen Normlänge ein, und die behält ChatGPT dann auch. Und dann ist ChatGPT so auf Sicherheit getrimmt, dass es die Abenteuer ab und zu ein wenig kaputt macht. Die KI geht immer in Richtung Sicherheit. Aber bei einem Abenteuer ist Sicherheit auch Langeweile.

Wenn die Leute ein bisschen Action reinhaben wollten – da soll jemand sterben, was ja bei einer Abenteuergeschichte passieren kann – hat ChatGPT das als anstößig bewertet: Gewalt und Gefahr ist im Prinzip anstößig, und das ist eigentlich nicht gewollt. Es ist klar: Wer in meinem Abenteuer fiktional ein bisschen Action einbauen will, könnte auch eine bösartige Person sein, die im echten Leben ein bisschen Action einbauen will. Und deswegen will OpenAI das verhindern.

Wir hatten eine Science-Fiction-Geschichte, in der die Figuren auf einen anderen Planeten gebeamt werden sollten. ChatGPT hat in endlosen Kapiteln Diskussionen darüber führen lassen,  ob denn das Portal zu diesem anderen Planeten sicher ist. Man kam gar nicht mehr raus aus der Diskussion der Sicherheitsmechanismen. Und die Leute konnten nicht auf den anderen Planeten beamen. Dann musste ich dagegen stören und habe gesagt, bau auch mal richtig wilde Sachen ein und verändere die Geschichte bei jeder Station sehr stark, damit man nicht in diese Endlosschleifen reinkommt.

Bei Evertrail ist ab und zu ein Roboter zu sehen – was hat es damit auf sich?

Philipp: Ich wollte ein virales Gimmick, was Lustiges, um ein paar mehr Leute in den Twitch-Kanal zu locken. Und ich dachte, vielleicht ist es für die Leute lustig, wenn ein physischer Roboter-Kopf mit ihnen redet. Und es gibt eine englische Firma, die stellt einen Roboter her, der nennt sich Pico. Der ist ziemlich klein, aber das ist ja für die Webcam egal. Und der kann über Python Sprachausgabe machen. Und der kann ein bisschen die Augen bewegen. Und der kann ein bisschen den Kopf drehen. Und der kann den Mund bewegen.

Neon-Plastik-Roboterkopf vor einem Bilderrahmen, Zettel: "Say 'Botty' to talk to me!"

Dann habe ich den einfach bestellt, habe eine Webcam da drauf gesetzt. Habe mithilfe von Python und natürlich dank Chat-GPT-Code-Hilfe, das in einem Tag auch wirklich programmieren können, dass der Roboter dann spricht. Und dann habe ich halt einfach in meinen Twitch-Stream die Webcam auf den Roboter gerichtet.Und der Roboter spricht dann anstelle des Erzählers der Erzählerin die Geschichte für die Leute. Kam auch ganz gut an.

Das Millionenpublikum ist auf Evertrail bislang noch ausgeblieben?

Philipp: Kommt ja vielleicht noch. Die Leute die da drin waren im Chat sind tatsächlich dann für zwei, drei Stunden hängen geblieben. Was sehr ungewöhnlich ist, wenn man mal Spiele publiziert oder Geschichten schreibt. Es ist wirklich toll, wenn Leute zwei, drei Stunden drin bleiben und sich freuen. Aber es macht mehr Spaß, wenn mehrere Menschen gleichzeitig drin sind. Dann kommt eigentlich erst dieses Feeling auf. Und wenn nicht den ganzen Tag fünf bis zehn Leute drin sind, wird es schwierig, die eine Person zu halten.

Evertrail läuft jetzt erstmal einfach so weiter. Ich mache den Stream allerdings nur an, wenn auch ein paar Leute vorbeikommen; das ist auch eine Kostenfrage. Mit Evertrail und meinen anderen Projekten ist das ein bisschen wie Spaghetti an die Wand werfen: Mal gucken, was kleben bleibt!

Auch lesenswert:

Kurzlink zu diesem Artikel: https://www.janeggers.tech/ow5y

Neue Posts einfach per Mail zugeschickt bekommen? Dann hier eintragen; die Mails kannst du natürlich jederzeit wieder abbestellen.

Loading

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert