Synthetische Medien: Unsere Zukunft?

| | Blog

Die Zukunft der Medien ist synthetisch – eine These, die in der Content-Branche kaum noch angezweifelt wird. Doch wie viele Inhalte werden in Zukunft wirklich durch künstliche Intelligenz erstellt und was ist heute schon möglich? Das haben wir gemeinsam mit Tatjana Anisimov von RTL und Pascal Schröder von Gipfelstürmer Film bei unserer nextMedia.Session diskutiert und konkrete Use Cases besprochen. Für alle, die nicht dabei sein konnten, haben wir die Ergebnisse noch einmal zusammengefasst.

„Synthetische Medien fungieren als Sammelbegriff für Medien wie Video, Bild und Audio, die mit Technologien aus dem Bereich der Künstlichen Intelligenz (KI) verändert oder sogar erzeugt werden“, so steht es im WDR-Zukunftsreport. Im Bereich Audio hat RTL ein Experiment gestartet und die Stimmen von zwei Nachrichtensprecher*innen synthetisiert. Tatjana Anisimov ist Product Innovation Managerin bei RTL, sie hat das Projekt bei der Session vorgestellt und Learnings mit uns geteilt.

Tatjana Anisimov, RTL

 „Wie wäre es, wenn sich ntv-Artikel von unseren Moderator*innen vorlesen lassen könnten?“

RTL hat genau das in einem neuen Innovationsprojekt getestet: Mit insgesamt über fünf Stunden Material der Sprecher*innen Maik Meuser und Inken Wriedt hat RTL eine KI von Microsoft gefüttert, um ihre Stimmen zu synthetisieren. Die These: „Nutzer*innen vertrauen unseren TV-Gesichtern und assoziieren ihre Stimmen auch auf auditiver Ebene mit RTL“, erklärt Tatjana Anisimov. Mögliche Anwendungsfelder seien das Vorlesen von Nachrichten, das Vertonen von Videos, Nachrichtenansagen im Radio zu Randzeiten sowie personalisierte und lokalisierte Voice Briefings. Anisimov betont, dass bei jeglichem Einsatz der synthetischen Stimmen jedoch ein vertrauensvoller Umgang mit der Technologie wichtig sei. In ihrem Beispiel bedeute das, den Einsatz der Technologie an den passenden Stellen zu Kennzeichen, erklärt sie.

Nach erstem Einsatz der synthetischen Stimmen und einer anschließenden Befragung der Nutzer*innen, konnte Tatjana Anisimov erste Takeaways mit uns teilen:

  1. Custom Voice macht den Unterschied

Die Vorlesefunktion werde fast durchgehend als gut bis sehr gut bewertet. Die synthetischen Stimmen von New Hosts würden als natürlicher empfunden in diesem Kontext.

  1. Prominenz ist sekundär

Prominente Stimmen hätten keinen entscheidenden Einfluss, könnten gegebenenfalls sogar ablenken oder der Glaubwürdigkeit schaden. Wenn der Inhalt nicht zur Stimme passe oder die Stimmen für politische Zwecke genutzt würden, könnten sie zu Vertrauensverlust oder Unsicherheit führen. Beispiel: Kader Loth liest die Nachrichten vor.

  1. Qualität schlägt Bekanntheit

Wichtiger als die Bekanntheit einer Stimme sei die Aussprachequalität: Pausen, Emotionen, angenehme Stimmlagen und Betonung sowie korrekte Aussprache.

  1. Barrierefreiheit wird anerkannt

Zuspruch von Menschen mit Seheinschränkungen, die die Funktion gegenüber Browser Readern bevorzugen

  1. Fremdwörter aktuell noch herausfordernd

Neue Nachrichtenlagen bringen neues Vokabular mit sich, das die Stimmen erst durch menschliches Zutun richtig aussprechen. Beispiel: „King Charles III“ wird als „King Charles drei“ vorgelesen.

  1. Marathon kein Sprint

Technisch wie auch ethisch wurden sie bei RTL vor neue Herausforderungen gestellt: Wer hat Rechte an den Stimmen? Wie vergütet man Sprecher*innen für diese Leistung?

„Toll, eine AI macht`s“

So lautete der Titel des Impulsvortrages von Pascal Schröder, er ist Geschäftsführer von Gipfelstürmer Film und experimentiert in seinem Arbeitsalltag viel mit künstlicher Intelligenz.

Pascal Schröder, Gipfelstürmer Film

Als Filmemacher weckte das Forschungsprojekt  „The Relightables“ von Google sein Interesse: Informatiker bei Google haben ein System für hochwertige, wiederbeleuchtbare Leistungsaufnahmen entwickelt. Das Aufnahmesystem kann die Ganzkörperreflexion menschlicher 3D-Darbietungen erfassen und sie nahtlos in eine neue Umgebung durch Augmented Reality (AR) oder in digitale Film-Szenen einfügen. Die Beleuchtung der Charaktere kann in Echtzeit angepasst werden. Eine Technologie mit enormem Potenzial für die Medienbranche, so Schröder. Nutzer*innen könnten sich zum Beispiel ihre Wunsch-Nachrichten-Moderator*innen aussuchen und sie in ihrem Wunsch-Outfit die Nachrichten vortragen lassen.

Ein passendes Beispiel aus dem WDR-Zukunftsreport, das Schröder zitierte: „Es ist 2023. Ihr öffnet die Nachrichten-App auf Eurem Tablet, tippt auf die Tagesthemen, und Tom Buhrow begrüßt Euch zur aktuellen Ausgabe … persönlich – und mit der Krawatte, die Euch am besten gefällt. Ja, Tom Buhrow hat die Tagesthemen schon 2013 verlassen, aber sein digitaler Zwilling präsentiert sie weiterhin. Das ist nur ein Zukunftsszenario für das Potenzial von synthetischen Medien“

Ein weiteres Phänomen, das Pascal Schröder mit uns teilte: Digitale Menschen. So zum Beispiel der für immer 19-jährige Avatar Lil Miquela, eine computergenerierte Kunstfigur, die bei Instagram drei Millionen Follower*innen hat und schon für Marken wie Calvin Klein und Prada gemodelt hat. 

Diese Phänomene und technischen Entwicklungen werfen laut Schröder einige Fragen für die Medienbranche auf:

  • Wie sollten Medien mit der rasanten Zunahme von Deepfakes umgehen?
  • Wie verändern sich Jobprofile und Tätigkeiten durch synthetische Medien?
  • Wie entwickelt sich die Vertrauensbeziehung zwischen Medien und Konsument*innen?
  • Welche neue Konkurrenz kommt durch synthetische Medien auf Medienhäuser zu?
  • Welche lizenzrechtlichen Fragen entstehen durch Erfassung und Generierung von Daten im Kontext von synthetischen Medien, zum Beispiel bei der Digitalisierung von Gesichtern, Körpern oder Stimmen von Moderator*innen?

Inspirationssuche und Bildgenerierung durch AI

Im zweiten Teil seines Vortrages teilte Pascal Schröder konkrete Use Cases aus seinem Arbeitsalltag mit uns. Wie in den folgenden Beispielen zu sehen ist, nutzt er synthetische Medienproduktion bereits für die Inspirationssuche und Bildgenerierung mithilfe der Programme Dalle-E und Midjourney. 

Sein Fazit:

  • AI hilft, sich Inspiration zu holen, als würde man googlen
  • AI kann dein Grafik-Assistent sein, der die Vorschläge nach deinen Vorgaben erstellt, um Zeit zu sparen
  • Ai kann dir komplexe Mood-Bilder erstellen, um deine Vision zu visualisieren, selbst wenn du die Grafikprogramme wie Photoshop nicht gut beherrschst

Verbesserungspotenzial sieht er jedoch in dem intensiven Zeitaufwand: Sobald man sehr klare Vorstellungen habe, würde das richtige Füttern der KI viel Zeit beanspruchen. Zudem resümiert er: „Ohne die menschliche Vision, bleibt es ein Zufallsprodukt.“

Wir haben die sechste nextMedia.Session gemeinsam mit der MOIN Filmförderung durchgeführt. Ihr möchtet die nächste Session mitgestalten? Dann meldet euch gern bei uns

Weitere Artikel
Konstruktiver Journalismus _ Constructive Journalism Day ©Jann Wilken/NDR

Konstruktiver Journalismus in Krisenzeiten

Konstruktiver Journalismus weicht von einer rein negativen, konfliktbeladenen Berichterstattung ab und bietet Lösungen und tiefergehende Erklärungen an. Wie wirkungsvoll dies gerade in Krisenzeiten, wie dem Krieg in der Ukraine, der Corona-Pandemie oder dem Klimawandel, ist, zeigten Expert*innen bei dem Constructive Journalism Day 2022 (CJD). Wir waren für euch dabei und haben die wichtigsten Erkenntnisse zu konstruktivem Journalismus in Krisenzeiten festgehalten.

Mehr lesen
Predictions 2023

Predictions 2023

Das Format Predictions 2023 zeigt die relevantesten Technologien, Innovationen und Trends der Medienbranche für das Jahr 2023 auf.

Mehr lesen
Start-ups Förderung

Übersicht von Förderprogrammen für Start-ups in Hamburg 

Du möchtest mit deiner Geschäftsidee ein Start-up gründen und suchst Finanzierungsmöglichkeiten oder individuelle Beratung? Du hast bereits ein Start-up gegründet und möchtest dich mit Investor*innen vernetzen? Wir haben für dich Förderprogramme und Beratungsmöglichkeiten für Start-ups im Bereich Content mit Tech und der Kreativwirtschaft in Hamburg gesammelt.

Mehr lesen
XRC22 nextReality.Contest Fotocredit: Benjamin Ulrich

XRC – nextReality.Contest 

Wir waren für euch vor Ort auf dem nextReality.Contest und haben uns die Gewinner-Projekte aus den AR-, VR- und Mixed-Reality-Bereichen angeschaut.
Der diesjährige Award fand in der Astor Filmlounge mit Hamburger Hafencity-Flair statt. Organisiert wurde die Preisverleihung zum 6. Mal vom nextReality.Hamburg e.V.

Mehr lesen
Katja Fleischmann

Das Erfolgsrezept von DRIVE

In der Digital Revenue Initiative (DRIVE) arbeiten die Nachrichtenagentur dpa und die Unternehmensberatung SCHICKLER gemeinsam mit rund 20 regionalen Medienhäusern aus Deutschland und Österreich sowie der österreichischen Nachrichtenagentur APA an der Steigerung digitaler Abonnements. Katja Fleischmann, Produktmanagerin DRIVE, erzählt im Interview, wie die Zusammenarbeit in der Initiative abläuft und welche Erkenntnisse die Verlage bereits durch das Teilen ihrer Nutzungsdaten gewinnen konnten.

Mehr lesen
20 Trends für 2023 – Jetzt Predictions entdecken!
This is default text for notification bar