Maschine, Mensch, Meinung: KI für Journalisten und Content Creator – Was wir jetzt lernen müssen

In unserer neuen Blogreihe „Maschine, Mensch, Meinung“ zeigt Prof. Dr. Andreas Moring, Professor für Innovation & Digital Management an der International School of Management ISM in Hamburg, die Möglichkeiten und Entwicklungschancen auf, die sich durch den Einsatz von Künstlicher Intelligenz ergeben. Zum Start dieser Serie widmet er sich dem Einfluss von KI auf den Journalismus und prognostiziert, wie die Art der Arbeitsteilung zwischen Mensch und Maschine in Zukunft aussehen könnte.

Früher Utopie, heute viel gehört: Maschinen sind besser als Menschen. Zumindest suchen und finden sie schneller, rechnen schneller, können sogar schon ganze Prozesse und Fabriken besser steuern und sicherer Auto fahren. Und Content können sie auch produzieren: Texte, Bilder, Musik. Und zwar immer besser. Zeit zum Einpacken also? Wenn Künstliche Intelligenz autonom Autos steuern kann, geht das dann auch bei journalistischer Recherche oder bei TV Übertragungen? Ja – aber nur bis zu einem gewissen Punkt. Und genau mit diesem müssen wir uns auseinandersetzen.

Guter Journalismus bedeutet Genauigkeit, Wahrheit, Spannung und Emotion. In den ersten beiden Punkten sind Maschinen und Methoden, die wir unter Künstlicher Intelligenz zusammenfassen, deutlich besser als Menschen, sie sind sogar überlegen. Einen eigenen Spannungsbogen aufzubauen, Menschen emotional zu erreichen und zu fesseln, das ist eine Domäne des Menschen, der einen Text verfasst, Bilder macht oder Filme dreht. Trotzdem oder vor allem deshalb wird Künstliche Intelligenz die Art wie Media Worker arbeiten in weiten Teilen neu definieren. Deswegen sollten alle von uns folgende Methoden und Technologien zumindest grundsätzlich kennen. Sie sind so wichtig wie andere Methoden und Grundfertigkeiten im Journalismus auch.

KI verändert die Grundfertigkeiten im Journalismus und in der Kreation


Unsere Grundfertigkeiten werden sich durch den Einsatz von KI gründlich ändern. Recherche ist für Menschen ein mühsamer Prozess. Nicht weil es per se langweilig wäre, sondern weil die Flut an potenziell wichtigen Informationen für Menschen schon sehr früh nicht mehr zu bewältigen ist. Maschinen können das besser. Je mehr Daten, desto besser und genauer die Ergebnisse. Computer Vision und Resolutionen, spielen hier eine besondere Rolle. Doch was passiert da?

Die Resolution ist ein Verfahren der formalen Logik, um eine logische Formel auf Gültigkeit zu testen. Das Resolutionsverfahren ist ein Widerlegungsverfahren: Statt direkt die Allgemeingültigkeit einer Formel zu zeigen, leitet es einen logischen Widerspruch aus deren Verneinung ab. Mit Hilfe von Resolutionsverfahren können Datenbestände ausgewertet und bestimmte Zusammenhänge und Fakten erkannt und bewiesen werden. Anwendungen im Journalismus finden sich beispielsweise bei der New York Times im „Editor Project“, das Informationen mit Hilfe Künstlicher Intelligenz für Menschen schneller und einfacher auswertet und darstellt. Die BBC hat mit ihrem „Juicer“-Tool ebenfalls KI im Einsatz, um große Datenmengen schnell auszuwerten und für Menschen verständlich und nutzbar zu machen. Reuters bietet gleich zwei Services in diesem Bereich. Mit „Graphiq“ können Datenbestände visualisiert und leicht verständlich aufbereitet werden. „Lynx Insight“ geht sogar ein Stück weiter und analysiert Datenbestände, schlägt Ansätze für Storys vor und schreibt schon mal ein paar Sätze eines möglichen Artikels vor. Nur als Vorschlag natürlich.

Mit Hilfe von Computer Vision können nicht nur „reine“ Daten ausgewertet werden, sondern es lassen sich auch komplexere Herausforderungen bewältigen, wie beispielsweise das Erkennen und verifizieren von Bildern oder realen Objekten. Es ist also prinzipiell möglich, dass Maschinen mit entsprechender Technologie selbständig Objekte finden, verifizieren und fotografieren oder filmen. Die Übertragung eines Fußballspiels könnte also durchaus ohne Kameramänner und Assistenten auskommen. Nur für die Interviews nach dem Spiel bräuchte es dann noch menschlichen Einsatz.

Der sogenannte Roboterjournalismus beruht auf genau solchen Methoden der Computer Vision und des maschinellen Lernens. Associated Press ist hier einer der Vorreiter. Seit rund fünf Jahren werden Artikel und Meldungen, hauptsächlich im Sport und bei Finanznachrichten, automatisch erstellt. Auch Yahoo und die Washington Post nutzen diese Art der Medienproduktion in verschiedenen Zusammenhängen. In Deutschland sind Aexea und Retresco die wohl bekanntesten und profiliertesten Anbieter. Auch große Agenturen und Medienhäuser nutzen automatische Textgenerierung – geben es aber eher ungern zu. Wahrscheinlich aus Angst vor mangelnder Akzeptanz. Und diese Vermutung ist auch nicht unbedingt falsch. Laut einer aktuellen Statista Studie im Auftrag von nextMedia geben 49 Prozent der Befragten an, Roboterjournalismus kritisch zu sehen. 28 Prozent halten den so erzeugten Content für unglaubwürdig.

In einem weiteren Schritt werden nicht nur Texte generiert, sondern diese gleich in Sprache (Voice) übertragen. Hier kommen Conversational Interfaces und Intelligente Agenten zum Einsatz.
Als Conversational Interface bezeichnet man ein System zur Mensch-Computer-Interaktion, das einer menschlichen Konversation nachempfunden ist. Die Konversation kann entweder als Sprach-Variante erfolgen, oder auf Textbasis, die wir im allgemeinen Sprachgebrauch dann Chatbots nennen. Das Conversational Interface ist dabei die visuelle oder auditive Oberfläche über die Menschen mit intelligenten Agenten interagieren können, die dann sozusagen im Hintergrund die eigentliche Arbeit erledigen. Diese Intelligenten Agenten sind schon heute sehr gut darin, bestimmte Probleme nicht nur zu „besprechen“ sondern auch zu lösen, und können dies oft besser als Menschen. Beispiele für Intelligente Agenten im Medienbereich sind Alexa, Siri und Co. oder auch die Bots von Quartz oder dem Guardian. Solche Agenten sind zwar noch keine selbstlernenden Systeme, da sie auf festen Algorithmen basieren, aber sie finden in fortgeschrittenem Stadium selbständig die Lösung für jedes Problem ihrer Domäne, auch wenn sie es vorher noch nie gesehen haben. Das bedeutet für Journalisten, dass beispielsweise das Abarbeiten von Standardrecherchen oder das journalistische „covern“ von langfristigen Entwicklungen von solchen Agenten übernommen werden kann. Beispiele dafür wären etwa der Fortgang von Verhandlungen, der Stand von Projekten, die Verkehrslage oder Transfers im Sport. Die Frage wäre dann, ob so ein intelligenter Agent nur den aktuellen Zwischenstand an den Journalisten zum Schreiben oder Senden weitergeben soll – oder gleich selber Texte produziert, die dann vielleicht noch von einem Menschen redigiert werden.

Neuronale Netze und Deep Learning können selbst Content produzieren

Alle oben genannten KI-Anwendungen in Medien beruhen letztlich auf neuronalen Netzen und Deep Learning. Doch wie funktioniert das nun genau? Die Neuronen (auch Knotenpunkte) eines künstlichen neuronalen Netzes sind schichtweise in sogenannten Layern angeordnet und in der Regel in einer festen Hierarchie miteinander verbunden. Zwischen den Schichten ist jedes Neuron der einen Schicht immer mit allen Neuronen der nächsten Schicht verbunden. Beginnend mit der Eingabeschicht fließen Informationen über eine oder mehrere Zwischenschichten bis hin zur Ausgabeschicht. Die sogenannten Gewichte beschreiben die Intensität des Informationsflusses entlang einer Verbindung in einem neuronalen Netzwerk. Jedes Neuron vergibt dazu ein Gewicht für die durchfließende Information und gibt diese dann gewichtet und nach der Addition eines Wertes für die neuronen-spezifische Verzerrung (Bias) an die Neuronen der nächsten Schicht weiter. Die Gewichte und Verzerrungen werden während des Trainingsprozesses so angepasst, dass das Endresultat möglichst genau den Anforderungen entspricht. Ein Trainingsprozess kann zum Beispiel bedeuten, einem neuronalen Netz „beizubringen“, Bilder zu erkennen und zuzuordnen. Dabei werden Bilder im Grunde in kleinstmögliche Muster zerlegt und diese dann als Zahlen dargestellt. Jedes Bild ergibt also letztlich sozusagen eine bestimmte Endsumme, die von den jeweiligen Mustern im Gesamtbild abhängt. Wird ein Bild in das Netz eingespeist, wird es also zerlegt, die Summe berechnet, diese Summe mit den Summenwerten der dem Netz „bekannten“ Bildern abgeglichen und dann ein Ergebnis ausgegeben: „Das ist eine 8“ oder „das ist ein Mann auf einem Motorrad“ oder „das ist der Hamburger Hafen vom Südufer der Elbe aus gesehen“. Der gleiche maschinelle Lernprozess kann auch für Texte angewandt werden. Fortgeschrittene neuronale Netze erreichen eine Treffergenauigkeit von bis zu 97 Prozent und schlagen damit in manchen Bereichen die Ergebnisse von Menschen
.  
Deep Learning ist dabei in der Lage, nicht nur Texte oder Bilder zu erkennen, sondern auch eigene, neue zu erzeugen und das sogar mit einem ganz bestimmten Stil. Das ist aber in vielen Fällen noch zu komplex. Das heißt: Es kommen zwar Texte in einem bestimmten Sprachstil heraus oder Bilder mit bestimmten, typischen Stilmerkmalen, ob die allerdings auch Sinn machen, ist noch nicht gesagt. Bei einfachen Berichten, also alles was unter dem Begriff der „Chronistenpflicht“ läuft, funktioniert das schon ganz gut, in Wort und Bild. Doch eine spannende Reportage,  ein packendes Drama oder ein hintergründiges Feature können auch die besten Deep Learning-Technologien nicht erzeugen. Hier werden Media Worker aus Fleisch und Blut weiter gebraucht.

Es zeichnet sich also eine neue Art der Arbeitsteilung zwischen Mensch und Maschine ab. Diese Verschiebungen hat es aber immer gegeben. Der Einsatz neuer Technologien hat in der Vergangenheit zu einer Explosion von Formaten, Nutzungsformen und unterschiedlichen Jobs und Aufgaben in den Medien geführt. Darin liegen große Chancen. Nutzen kann die am besten, wer neue Technologien zumindest grundsätzlich versteht und kreative und innovative Ideen zu ihrer Anwendung entwickelt. Und genau das können Menschen, vor allen Dingen „Medienmenschen“, doch wohl mit am besten.

Zum Autor: Professor Doktor Andreas Moring ist Professor für Innovation & Digital Management an der International School of Management ISM in Hamburg. Die Schwerpunkte seiner wissenschaftlichen Arbeit sind Digitale Geschäftsmodelle für Medien und Innovationsmanagement. Vor seiner aktuellen Professur arbeitete er für die Axel Springer AG, Schickler Unternehmensberatung und die Deutsche Druck- und Verlagsgesellschaft. Er wurde für seine journalistische Arbeit und von ihm entwickelte Produkte und Formate in den letzten Jahren mehrfach ausgezeichnet.

KI, Journalismus, Innovation