Die Zukunft der Medien ist synthetisch – eine These, die in der Content-Branche kaum noch angezweifelt wird. Doch wie viele Inhalte werden in Zukunft wirklich durch künstliche Intelligenz erstellt und was ist heute schon möglich? Das haben wir gemeinsam mit Tatjana Anisimov von RTL und Pascal Schröder von Gipfelstürmer Film bei unserer nextMedia.Session diskutiert und konkrete Use Cases besprochen. Für alle, die nicht dabei sein konnten, haben wir die Ergebnisse noch einmal zusammengefasst.
„Synthetische Medien fungieren als Sammelbegriff für Medien wie Video, Bild und Audio, die mit Technologien aus dem Bereich der Künstlichen Intelligenz (KI) verändert oder sogar erzeugt werden“, so steht es im WDR-Zukunftsreport. Im Bereich Audio hat RTL ein Experiment gestartet und die Stimmen von zwei Nachrichtensprecher*innen synthetisiert. Tatjana Anisimov ist Product Innovation Managerin bei RTL, sie hat das Projekt bei der Session vorgestellt und Learnings mit uns geteilt.

„Wie wäre es, wenn sich ntv-Artikel von unseren Moderator*innen vorlesen lassen könnten?“
RTL hat genau das in einem neuen Innovationsprojekt getestet: Mit insgesamt über fünf Stunden Material der Sprecher*innen Maik Meuser und Inken Wriedt hat RTL eine KI von Microsoft gefüttert, um ihre Stimmen zu synthetisieren. Die These: „Nutzer*innen vertrauen unseren TV-Gesichtern und assoziieren ihre Stimmen auch auf auditiver Ebene mit RTL“, erklärt Tatjana Anisimov. Mögliche Anwendungsfelder seien das Vorlesen von Nachrichten, das Vertonen von Videos, Nachrichtenansagen im Radio zu Randzeiten sowie personalisierte und lokalisierte Voice Briefings. Anisimov betont, dass bei jeglichem Einsatz der synthetischen Stimmen jedoch ein vertrauensvoller Umgang mit der Technologie wichtig sei. In ihrem Beispiel bedeute das, den Einsatz der Technologie an den passenden Stellen zu Kennzeichen, erklärt sie.
Nach erstem Einsatz der synthetischen Stimmen und einer anschließenden Befragung der Nutzer*innen, konnte Tatjana Anisimov erste Takeaways mit uns teilen:
- Custom Voice macht den Unterschied
Die Vorlesefunktion werde fast durchgehend als gut bis sehr gut bewertet. Die synthetischen Stimmen von New Hosts würden als natürlicher empfunden in diesem Kontext.
- Prominenz ist sekundär
Prominente Stimmen hätten keinen entscheidenden Einfluss, könnten gegebenenfalls sogar ablenken oder der Glaubwürdigkeit schaden. Wenn der Inhalt nicht zur Stimme passe oder die Stimmen für politische Zwecke genutzt würden, könnten sie zu Vertrauensverlust oder Unsicherheit führen. Beispiel: Kader Loth liest die Nachrichten vor.
- Qualität schlägt Bekanntheit
Wichtiger als die Bekanntheit einer Stimme sei die Aussprachequalität: Pausen, Emotionen, angenehme Stimmlagen und Betonung sowie korrekte Aussprache.
- Barrierefreiheit wird anerkannt
Zuspruch von Menschen mit Seheinschränkungen, die die Funktion gegenüber Browser Readern bevorzugen
- Fremdwörter aktuell noch herausfordernd
Neue Nachrichtenlagen bringen neues Vokabular mit sich, das die Stimmen erst durch menschliches Zutun richtig aussprechen. Beispiel: „King Charles III“ wird als „King Charles drei“ vorgelesen.
- Marathon kein Sprint
Technisch wie auch ethisch wurden sie bei RTL vor neue Herausforderungen gestellt: Wer hat Rechte an den Stimmen? Wie vergütet man Sprecher*innen für diese Leistung?
„Toll, eine AI macht`s“
So lautete der Titel des Impulsvortrages von Pascal Schröder, er ist Geschäftsführer von Gipfelstürmer Film und experimentiert in seinem Arbeitsalltag viel mit künstlicher Intelligenz.

Als Filmemacher weckte das Forschungsprojekt „The Relightables“ von Google sein Interesse: Informatiker bei Google haben ein System für hochwertige, wiederbeleuchtbare Leistungsaufnahmen entwickelt. Das Aufnahmesystem kann die Ganzkörperreflexion menschlicher 3D-Darbietungen erfassen und sie nahtlos in eine neue Umgebung durch Augmented Reality (AR) oder in digitale Film-Szenen einfügen. Die Beleuchtung der Charaktere kann in Echtzeit angepasst werden. Eine Technologie mit enormem Potenzial für die Medienbranche, so Schröder. Nutzer*innen könnten sich zum Beispiel ihre Wunsch-Nachrichten-Moderator*innen aussuchen und sie in ihrem Wunsch-Outfit die Nachrichten vortragen lassen.
Ein passendes Beispiel aus dem WDR-Zukunftsreport, das Schröder zitierte: „Es ist 2023. Ihr öffnet die Nachrichten-App auf Eurem Tablet, tippt auf die Tagesthemen, und Tom Buhrow begrüßt Euch zur aktuellen Ausgabe … persönlich – und mit der Krawatte, die Euch am besten gefällt. Ja, Tom Buhrow hat die Tagesthemen schon 2013 verlassen, aber sein digitaler Zwilling präsentiert sie weiterhin. Das ist nur ein Zukunftsszenario für das Potenzial von synthetischen Medien“
Ein weiteres Phänomen, das Pascal Schröder mit uns teilte: Digitale Menschen. So zum Beispiel der für immer 19-jährige Avatar Lil Miquela, eine computergenerierte Kunstfigur, die bei Instagram drei Millionen Follower*innen hat und schon für Marken wie Calvin Klein und Prada gemodelt hat.

Diese Phänomene und technischen Entwicklungen werfen laut Schröder einige Fragen für die Medienbranche auf:
- Wie sollten Medien mit der rasanten Zunahme von Deepfakes umgehen?
- Wie verändern sich Jobprofile und Tätigkeiten durch synthetische Medien?
- Wie entwickelt sich die Vertrauensbeziehung zwischen Medien und Konsument*innen?
- Welche neue Konkurrenz kommt durch synthetische Medien auf Medienhäuser zu?
- Welche lizenzrechtlichen Fragen entstehen durch Erfassung und Generierung von Daten im Kontext von synthetischen Medien, zum Beispiel bei der Digitalisierung von Gesichtern, Körpern oder Stimmen von Moderator*innen?
Inspirationssuche und Bildgenerierung durch AI
Im zweiten Teil seines Vortrages teilte Pascal Schröder konkrete Use Cases aus seinem Arbeitsalltag mit uns. Wie in den folgenden Beispielen zu sehen ist, nutzt er synthetische Medienproduktion bereits für die Inspirationssuche und Bildgenerierung mithilfe der Programme Dalle-E und Midjourney.


Sein Fazit:
- AI hilft, sich Inspiration zu holen, als würde man googlen
- AI kann dein Grafik-Assistent sein, der die Vorschläge nach deinen Vorgaben erstellt, um Zeit zu sparen
- Ai kann dir komplexe Mood-Bilder erstellen, um deine Vision zu visualisieren, selbst wenn du die Grafikprogramme wie Photoshop nicht gut beherrschst
Verbesserungspotenzial sieht er jedoch in dem intensiven Zeitaufwand: Sobald man sehr klare Vorstellungen habe, würde das richtige Füttern der KI viel Zeit beanspruchen. Zudem resümiert er: „Ohne die menschliche Vision, bleibt es ein Zufallsprodukt.“
Wir haben die sechste nextMedia.Session gemeinsam mit der MOIN Filmförderung durchgeführt. Ihr möchtet die nächste Session mitgestalten? Dann meldet euch gern bei uns.
Weitere Artikel

Europäische Fördergelder 2024: Gelegenheiten für Innovation und Wachstum in der Medien- und Digitalbranche
Für 2024 gibt es bereits wieder einige spannende Förderangebote der EU für die Contentbranche – vorrangig in den Bereichen Journalismus,
Mediennutzung und Medienkompetenz sowie cross-sektorale Innovationen. Hier haben wir die wichtigsten Informationen für euch zusammengestellt.

Ein Baukasten für Medienorganisationen: NeueMedien.org ist live!
Wilde Zeiten für Medienmacher*innen: Trotz der vielen Herausforderungen für Medienhäuser glauben wir an guten Journalismus. Um in der Krise zu helfen und das Ökosystem zu stärken, haben wir einen offenen Baukasten entwickelt. Er hilft dabei, eine robuste Medienorganisation zu bauen.

oneGuide erweckt Denkmäler mit KI zum Leben
Das MEDIA LIFT-Startup bietet Content für unzählige Sehenswürdigkeiten weltweit und bringt so jede Reise auf das nächste Level „Mehr als 80% der globalen Sehenswürdigkeiten und

Plattform NeueMedien.org unterstützt die Branche bei der digitalen Transformation
Pressemitteilung als PDF • Die Plattform NeueMedien.org bietet Medienunternehmen eine Vielzahl kostenloser Hilfen für die Entwicklung, Planung und das Projektmanagement neuer Geschäftsfelder.• Die Stadt unterstützt

Übersicht unserer Angebote für Journalist*innen
Du bist Journalist*in und möchtest mit deiner Geschäftsidee ein eigenes Medienunternehmen aufbauen? Du suchst nach Inspiration oder Orientierung um dein eigenes Projekt voranzubringen oder du möchtest dich mit anderen Journalist*innen vernetzen? Wir haben für dich Angebote für Journalist*innen von nextMedia.Hamburg und der Hamburg Kreativ Gesellschaft gesammelt.

fuse.space sichert geistiges Eigentum mit Blockchain-Technologie
Ein Raum für Zusammenarbeit und Filesharing und das mit maximaler Datensicherheit? Das Hamburger Start-up fuse.space macht es möglich – und weist der Contenbranche damit den