Ein Radiosender, der völlig ohne Menschen auskommt – wo ein Sprachmodell Meldungen aussucht, schreibt, in den Sendeplan einpasst und die Moderationen dann von einer Stimm-KI gesprochen werden: Das funktioniert, und es funktioniert richtig gut. Der Entwickler ist Sohn einer Radiolegende – und es sendet nicht im Silicon Valley, sondern auf der deutschesten aller Inseln.
Bild: Dall-E3 – gepromptet mit: „Erstelle das Bild eines KI-gesteuerten digitalen Radio-Butlers, der moderiert und Nachrichten redigiert“ – Das von ChatGPT erstellte DallE3-Prompt ist im Alt-Text des Bildes zu finden.
Geschockte Radiomacher auf den Prager Radiodays
Aber vielleicht lassen wir Thore Laufenberg, die Hauptfigur dieser Geschichte, noch ein wenig beiseite. Die Geschichte beginnt auch nicht auf Helgoland, sondern in Prag, bei der Hörfunk-Branchenmesse „Radiodays Europe“. Dort präsentierte sich am 27. März 2023 ein US-Startup namens Futuri Media. Ich war nicht dabei, aber David Anstandig, der Chef von Futuri, muss einen beeindruckenden Auftritt hingelegt haben – ich hatte jedenfalls kurz danach einen Termin mit immer noch tief verstörten Radiomacherinnen und -machern, die sich mühten, das Gesehene und Gehörte zu verarbeiten.
Ein Radiosender ganz ohne Menschen? Genau das hatte ihnen David Anstandig nämlich gezeigt – sein Produkt „RadioGPT“. Wer’s nicht kennt – hier kann man mal reinhören: Glatte AC-Musik von der Best-Of-Liste, geschmeidige Zwischenmoderatoren von souveränen Stimmen, gelegentlich unterbrochen von der einen oder anderen Sponsorenbotschaft – es könnte irgendein gesichtsloses, aber professionelles Lokalradio im Mittelwesten sein. Nur dass die Texte und Stimmen eben allesamt künstlich generiert sind.
Wie gesagt, das hat die Radioschaffenden in Prag tief beeindruckt. (So sehr, dass binnen weniger Monate ein deutscher Pop-Kommerzsender sich bei Futuri einkaufte und mit einem KI-Stream auf Sendung ging – das dürfen wir hier kurz und schmerzlos als Selbstmord aus Angst vor dem Tod abhandeln.) Ich durfte dann bei meinem Treffen mit einigen der Radiochefs noch einen draufsetzen. Meine gar nicht so steile These: Das Bemerkenswerte an RadioGPT ist nicht, wie ausgefeilt es ist – sondern, wie einfach das Konzept dahinter mit der bestehenden Technologie umzusetzen
Ein Kochrezept für KI-Radio
Eigentlich, behauptete ich vor den Radiochefs, ist so ein KI-Radio nichts anderes als ein paar handelsübliche digitale Dienste, zusammengehalten von etwas Klebstoff-Code, und ein paar halbwegs clevere Prompts: Die Musik kommt von einem Rotationsserver, die Infos über Musik und Band kann man sich für die Moderation von Spotify holen, Meldungen aus einem Feed (ebenso wie Wetter, Verkehr und die Sponsorenhinweise), dann promptet man GPT-4 und lässt das Ganze von einem Stimmgenerator sprechen: Für meine Demo vor den Radioleuten – hier das Colab – hatte ich „Bard“ genutzt, das open source ist und auf Deutsch auch ganz passabel klingen kann. Piece of cake.
Jetzt ist es eins, zu behaupten, dass man so was schnell bauen kann – was ganz anderes ist, einen „proof of concept“ vorzulegen oder gar ein fertiges Produkt. Und jetzt kommt Thore Laufenberg ins Spiel – für ihn ging es nicht darum, mit einer Technikdemo anzugeben, er kämpfte um das Überleben eines Traums.
Sein Vater ist eine Radiolegende – er baut das erste deutsche Radio völlig ohne Menschen
Thore Laufenberg ist Sohn von Frank Laufenberg, einem legendären Musikmoderator bei SWF3 und RPR und im ZDF – ausweislich der Wikipediaseite macht er heute noch Internet-Radio, und vermutlich kann man nicht über Frank Laufenberg reden, ohne diesen Clip zu verlinken. Jedenfalls, sein Sohn Thore. Von Beruf ist er freier IT-Entwickler, und seit 2017 betreibt er „Radio Helgoland“ als kleines Community-Webradio.
Das jetzt komplett KI-basiert sendet, ohne menschliche Intervention – hier kann man es sich anhören.
Einem NDR-Reporter hat Thore Laufenberg erzählt, dass nach Corona und ein paar Differenzen niemand mehr übrig war, der das Radio machen konnte – „deswegen war die Frage: Gibt’s Radio Helgoland mit KI? Oder gibt es gar kein Radio Helgoland?“ Mir hatte ein Kollege und Freund von Radio Helgoland erzählt, also habe ich gedacht: ich rufe den Macher mal an. Es antwortet eine freundliche und äußerst gut gelaunte Stimme, deren Besitzer gern bereit ist, über das KI-Radio zu plaudern.
Wie Radio Helgoland funktioniert
Well, RadioGPT it is not. Es funktioniert meines Erachtens deutlich besser. Meldungen zieht sich das System aus insgesamt 30 Quellen – zwei davon sind bezahlte Agenturen – die rund 2.000 Meldungen, die so pro Tag zusammenkommen, beurteilt ein entsprechend gepromptetes GPT-3.5 mit Blick auf die definierte Zielgruppe. Dann schreibt es sie in Meldungen um – und dann werden sie mit ElevenLabs-Klonstimmen gesprochen.
Das ist verdammt gut. Ab und zu kriegt der vor allem mit US-Daten trainierte Stimmgenerator was durcheinander; wird beispielsweise ein Straßenname in einer Meldung aus Kiel falsch ausgesprochen. Aber bis zu diesem Moment war ich fest überzeugt davon, dass da ein Mensch am Mikro sitzt.
200.000 Zeilen Code hat er inzwischen für das Projekt geschrieben, erzählt mir Thore in unserem Telefongespräch – und dass es ihn etwa ein halbes Jahr Entwicklungszeit gekostet hat. Das Herzstück ist der „Scheduler“, die Sendeplanverwaltung, die die ausgewiesenen Kästchen nach Zielgruppen-Vorgabe füllt.
Halten wir fest: Radio Helgoland nutzt
- KI als Nachrichtenredakteur
- KI als Nachrichtenautor
- KI als CvD
- KI als Sprecher
Wer sein eigenes KI-Radio aufziehen will, dem bietet der Entwickler über radiobutler.com KI-Radio zum Mieten an – beziehungsweise nach dem Pay-as-you-go-Prinzip. Dabei sieht er sich gegenüber dem US-Startup Futuri an einer entscheidenden Stelle klar im Vorteil: „Wissen Sie, was RadioGPT ist? Teuer.“ Auf radiobutler.com kostet ein Reporter-Aufsager (bis 1000 Worte) gerade mal 6 Cent plus ElevenLabs-Stimmgenerator-Gebühren. Automatisierte Wetter- und Verkehrsnachrichten – ein Szenario, das derzeit bei Radiomachern für reges Interesse sorgt – sind für 5 bzw. 8 Cent je Meldung zu haben.
Aber ein KI-Vollprogramm, wer braucht so was?
Die Frage muss man stellen. In den Zeiten von Spotify und Content-Feeds, die an den Nutzer und an die Nutzungssituation perfekt angepasst sind, hat Radio noch genau drei Stärken:
- Erstens, dass ein UKW-Radio beim Zähneputzen immer noch leichter zu nutzen ist als ein digitales Gerät.
- Zweitens, der Lagerfeuercharakter – dass man sich mit anderen Mitgliedern einer Community um ein und dieselben Inhalte sammelt.
- Und drittens, die Menschen, die dieses Lagerfeuer am Brennen halten: Vertraute, denen man jeden Tag zuhört, und die einem ans Herz gewachsen sind.
Den dritten Punkt räumt KI-Radio mal gepflegt ab – weshalb meine erste Reaktion auf RadioGPT war, dass ich nicht daran glaube – nicht als KI-Blogger, sondern als Radiomacher. Was soll an einem Radio ohne Menschen attraktiv sein? Und das Szenario, das Futuri mit RadioGPT verkauft – die Station im Hinterland von Bumfuck, Neverwhere, wo die Leute außer dem KI-Radio keine anderen regionalen Medien haben – das gibt’s ja so bei uns nicht. Dachte ich. Radio Helgoland bringt mich ein wenig ins Grübeln, ob es ähnliche Communities mit ähnlichen Bedürfnissen nicht doch auch bei uns gibt.
Nicht, dass ich mit Radio Helgoland kein Problem hätte. KI, die völlig ohne menschliche Kontrolle und Verantwortung Inhalte produziert – das gäbe es in öffentlich-rechtlichen Sendern nicht, schon gar nicht im hr, wo ich an den KI-Regeln fürs Haus beteiligt war: Keine KI-generierten Inhalte ohne menschliche Abnahme. Dafür gibt es einen Grund: Systeme, die auf Sprachmodellen wie GPT-4 aufsetzen, produzieren zu oft gefährlichen Unsinn; wir haben das zusammen mit Algorithmwatch ja gerade im hessischen Wahlkampf nachgezeichnet.
Trotzdem finde ich gut, was Thore Laufenberg da macht – weil es ein kühnes Projekt ist, aber auch, weil wir daraus lernen können, was wir vielleicht besser nicht nachahmen.
Update, 1.11.: Hörbeispiel
Hier mal ein kurzer Mitschnitt einer Zwischenmoderation aus einer Nachrichtenmeldung:
Weshalb ich mir sicher bin, dass das wirklich eine KI-Stimme ist? Nun, zum einen findet sich die Stimme auch in den Hörbeispielen auf der radiobutler.com-Seite, zum zweiten verspricht sie sich: Es müsste [va´ʁiːn] heißen, mit Betonung auf der zweiten Silbe, nicht [´vaʁɪn]. Kann man sich beim NDR anhören, von dem vermutlich die Ursprungsmeldung stammt – einige Formulierungen sind auch in der GPT-Zusammenfassung noch wiederzufinden.
Interessantes Randdetail: Die KI-Reporterstimme fängt anscheinend gern mit einem „Äh“ oder „Also“ an.
Auch lesenswert:
- Besser prompten: Gib der KI gut strukturierte ROMANE!
- Barcamps: Digital vernetzen, real treffen. Ein Feature.
- OpenAI und die Urheberrechte: Ist KI trainieren wie Radkappen klauen?
Schreibe einen Kommentar