Die KI-Revolution: Darauf müssen Redaktionen aufpassen

Man muss nicht von Technik besoffen sein, um sich all die Potenziale auszumalen, die in der Entwicklung von Bots wie ChatGPT stecken – auch für den Journalismus. Der in dieser Woche erschienene Trend-Report des Reuters Institutes for the Study of Journalism erwartet gar ein „Jahr des Durchbruchs“ für den Einsatz Künstlicher Intelligenz in Redaktionen. Schon länger setzen viele von ihnen KI ein, vor allem für Leseempfehlungen, aber auch für automatisierte Textproduktion. Nun könnte der „Roboterjournalismus“ aber ein neues Level erreichen. 

Der im November gelaunchte Bot von Open AI beantwortet in Windeseile Fragen und hilft sogar bei der Erstellung von Interviewfragen. Er fasst Texte zusammen oder redigiert sie, er spuckt Literaturlisten aus und komponiert sogar Cartoons. Die Möglichkeiten sind grenzenlos. Der Bot von Open AI ist das, was man auf Englisch einen Game Changer nennt. Nimmt man dazu noch die Möglichkeiten, auf Basis von Recherchen animierte Filme zu produzieren, wie das zum Beispiel die Redaktion von Semafor ausprobiert, drängt sich der Eindruck auf: Bald ist alles möglich. 

Und genau hier liegt eine riesige Herausforderung für den Journalismus. Denn schon heute fehlt es in den meisten Medienhäusern vor allem an Fokus und an Klasse, keinesfalls an Masse. Je mehr möglich ist, umso wichtiger wird es zu entscheiden, was man tut, und was man lieber lässt. Einer Branche, die ohnehin lieber mit Bauchgefühl arbeitet als mit Strategie, wird genau das besonders schwerfallen. 

Die Chancen

Unter dem Strich dürfte KI dem Journalismus deutlich mehr nützen, als dass sie ihm schadet. Das JournalismAI Project an der London School of Economics ist ein Fundus entsprechender Innovationen, inklusive Trainingsprogramm. Gerade kleine Redaktionen profitieren von KI, weil sie kleineren Teams mehr leisten können. Software wird Routinearbeiten erledigen, während Reporter tiefer recherchieren – und auch das mit Hilfe von KI. Der Faktencheck wird einfacher, hyperlokale Berichterstattung möglich, Personalisierung von Inhalten und Kundenbindung leichter zu automatisieren.

Vielfalt und Inklusivität lassen sich besser erreichen, wenn Algorithmen dies kontrollieren oder gar steuern. Bei der kanadischen Globe and Mail zum Beispiel bestückt die Software Sophi die Homepage und stellt unter anderem sicher, dass ethnische Minderheiten inhaltlich repräsentiert sind. Anderswo machen automatisierte Übersetzungen auch in seltene Sprachen Beiträge neuen Zielgruppen zugänglich. Für diejenigen, die schlecht lesen können, gibt es Text-to-speech- Software, für solche mit Gehörproblemen maschinelle Transkription. Avatare können dieselbe Nachricht je nach Zielgruppe im entsprechenden Look, Stil, und Komplexitätsgrad vermitteln. Software wie Dall-E hilft dabei, komplexe Inhalte in Bilder zu pressen. Das bedeutet auch, dass verschiedene Audiences präziser bedient werden können. Die Hoffnung besteht, mit neuen Mitteln einen größeren Teil derjenigen zu erreichen, die das Nachrichtengeschehen bislang ignoriert haben – womöglich, weil sie sich nicht angesprochen fühlten.

Die Risiken

Natürlich bestehen auch Risiken. Die Gefahr wächst, auf manipulierte Inhalte hereinzufallen, denn davon wird es reichlich geben. Journalisten werden ihre Rolle als Gatekeeper neu ausfüllen müssen. Bislang sind die Bots darauf trainiert, plausible Inhalte abzuliefern, nicht 100 Prozent Faktentreue. Fachleute sagen, die Lernkurve der KI sei steil, die Fehlerquote sinke rasant. Aber derzeit kann vermutlich niemand mit Sicherheit sagen, ob die maschinellen Möglichkeiten zu mehr Lügengeschichten oder akkuraterer Qualitätskontrolle führen werden. Und natürlich fragen sich Journalisten, wie ihre Aufgaben und Arbeitsperspektiven sich entwickeln werden in einer Welt, in der Maschinen schneller und womöglich verständlicher schreiben und produzieren, als sie das je könnten.

Die Sorgen sind berechtigt. Vor allem jene Kolleg:innen, denen es an Lust, Zeit, Ressourcen und Energie zum Lernen fehlt, könnten am Ende leer ausgehen. Viele Jobs werden sich verändern. Viele Fähigkeiten, die früher nachgefragt waren, stellt die Technik über Nacht in den Schatten. Aber der Einzug von KI in Redaktionen birgt auch Gutes für den Arbeitsmarkt. Gelten Verlagshäuser zum Beispiel heute für Tech-Talente noch als angestaubt, könnten sie zu verlockenden Arbeitgebern werden, wenn KI-Versiertheit künftig zum Job-Profil gehört. Entsprechendes Know-how macht Journalisten auch für andere Branchen attraktiv und damit leichter vermittelbar. Redaktionsarbeit dürfte interessanter werden, wenn Roboter die Routine-Jobs erledigen. 

KI werde Medienunternehmen dabei helfen, „mehr mit weniger zu erreichen und Möglichkeiten in der Produktion und Verteilung besserer Inhalte zu eröffnen“, schreibt Nic Newman im Trend-Report des Reuters Institutes, der auf einer nicht-repräsentativen Umfrage unter Top-Führungskräften in Medienhäusern weltweit beruht. „Aber sie wird auch zu neuen Dilemmata führen, wie diese machtvollen Technologien ethisch und transparent genutzt werden können“, so Newman weiter. 

Eine Frage der Ethik

Wenn sich Journalisten künftig mehr mit Ethik beschäftigen müssen, um nicht von KI überrumpelt zu werden, ist das zunächst einmal eine gute Sache. Tatsächlich ist es zwingend überall dort, wo lernende Software Menschen ersetzt, denn werden Fehler und Vorurteile maschinell skaliert, sind die Schäden potenziell immens. Genauso wichtig wird es aber sein, dass Medienhäuser und Redaktionen ihre Ziele und die dazu passende Strategie penibel entwickeln. Schon bei der digitalen Transformation haben das viele versäumt. Etliches, was nach Innovation klang, wurde gemacht, ohne vorher zu überlegen, auf welche Weise es zum Erfolg von Produkten, Marken oder Missionen beitragen könnte. Man pilgerte lieber zur New York Times, als sich mit den Bedürfnissen der potenziellen Nutzer in der Nachbarschaft zu beschäftigen. So wurde viel Geld und Energie verbrannt. Diese Fehler gilt es zu vermeiden.

Die Versuchung, immer noch mehr zu produzieren, schlicht, weil es möglich ist, könnte eines der größten Probleme des Journalismus noch verschärfen. Laut dem Trend-Report macht die wachsende Nachrichtenmüdigkeit ihres Publikums schon jetzt 71 Prozent der befragten Führungskräfte Sorgen. Dieser kann man nicht mit mehr Masse begegnen, sondern mit Angeboten, die relevant und bedürfnisgerecht sind. Ob sie mit oder ohne KI erstellt werden sollten, das müssen Menschen entscheiden. 

Diese Kolumne erschien bei Medieninsider am 11. Januar 2023

Die Sprache der anderen: Automatisierte Übersetzungen könnten den Journalismus revolutionieren, aber wie?

Man kann „Fake News“ bekämpfen, indem man sie identifiziert, mit einem Warnhinweis versieht und richtigstellt. Man kann aber auch mit so viel vertrauenswürdigem, faktentreuem und anschaulichem Journalismus dagegen antreten, dass er den Lügen die Luft zum Atmen nimmt. Für Redaktionen ist das natürlich keine Entweder/Oder-Entscheidung, sie versuchen beides. Die European Broadcasting Union hat nun kürzlich ein Projekt aus der Abteilung „Oder“ vorgestellt: Sie will Klasse in Massen liefern und wird dazu Inhalte mit Hilfe von automatischen Übersetzungen über Länder- und Sprachgrenzen hinweg skalieren.

Das Projekt verspricht viel: Zehn öffentlich-rechtliche Sender aus Europa werden ab Juli besonders gute Stücke zu global wichtigen Themen wie Covid-19, Klimawandel und Migration einspeisen, die dann per Künstliche Intelligenz übersetzt und europaweit zur Verfügung gestellt werden sollen. In einer achtmonatigen Pilotphase hatten 14 Anstalten mehr als 120 000 Artikel auf diese Weise geteilt. Das hatte so gut geklappt, dass die EU nun mit einer Finanzspritze hilft. Die Bürger*innen könnten also künftig nicht nur von mehr verlässlichen Informationen profitieren, sondern auch von mehr Vielfalt, wenn die Sache gut läuft.

Tatsächlich könnten automatisierte Übersetzungen den Journalismus revolutionieren. Wer sich schon lange nicht mehr mit Texten abgemüht hat, die von Software in andere Sprachen übertragenen wurden, weil er die Ergebnisse eher unbefriedigend fand, möge das ruhig einmal wieder probieren. Künstliche Intelligenz, die nach dem Prinzip deep learning funktioniert, übersetzt mittlerweile Texte wie diesen hier binnen Sekunden ins Englische. Mit ein wenig Redigieren lesen sie sich dann – das muss hier leider gesagt werden – sehr viel besser als das, was man früher zuweilen von Übersetzer*innen zurückbekommen hat, die zwar einer Fremdsprache aber nicht unbedingt der journalistischen Form mächtig waren. Die KI-Produkte sind im wahrsten Sinne des Wortes erschreckend gut.

Noch bewegen sich die Roboter nur in wenigen Sprachräumen sicher, aber sie lernen. Und das Ergebnis wird den Journalismus prägen – allerdings in verschiedene Richtungen. Einerseits eröffnen die Tools den Verlagen neue Möglichkeiten. Waren bislang nur Redaktionen aus dem englischsprachigen Raum in der Lage, ihren Journalismus weltweit anzubieten, können dies künftig theoretisch alle tun, für die das kommerziell oder qua Mission sinnvoll ist. Nicht jedes Medienhaus wird sich so zu einer New York Times oder einem Guardian mausern können, aber die Optionen gerade für europaweite News-Portale wachsen rasant. Bei der Neugründung Forum.eu zum Beispiel übernimmt KI nach Schätzung von Mit-Gründer Paul Ostwald mittlerweile 60 Prozent der gesamten Übersetzungsleistung. Redaktionen könnten im eigenen Land Menschen mit anderen Muttersprachen leichter erreichen. Und die internationale Recherche dürfte deutlich leichter werden, wenn Reporter*innen auf diese Weise besseren Zugang zu Original-Dokumenten bekämen. Das Ganze funktioniert ja nicht nur für das geschriebene, sondern auch für das gesprochene Wort (was im Fernsehen derzeit noch zuweilen für lustige Untertitel sorgt).

Redaktionen haben allerdings schon begriffen, dass hier nicht nur ein gewaltiges Expansions-, sondern auch ein Sparpotenzial schlummert. Die Nachrichtenagentur Reuters schichtet schon länger Ressourcen um, zum Beispiel aus dem deutschsprachigen Dienst in Teile der Welt, die das wache Auge des internationalen Journalismus nötiger haben. Und natürlich ist das sinnvoll: Statt in Berlin einen deutsch- und einen englischsprachigen Kollegen auf dieselbe Pressekonferenz zu schicken, kann eine zusätzliche Kollegin beispielsweise auf den Philippinen echten Mehrwert schaffen. Schließlich lässt sich das Werk vom deutschen Termin auch schnell mal in die eine oder andere Richtung übersetzen.

Allerdings wird es genau an dieser Stelle kritisch. Sprache ist schließlich immer nur eine Verpackung für Inhalte, die im Kontext einer Kultur entstehen. Der exakt gleiche Sachverhalt kann sich komplett anders lesen je nachdem, wer ihn beschreibt. Als zum Beispiel Star-Dirigent Simon Rattle kürzlich bekannt gab, er werde 2023 als Chefdirigent zum Symphonieorchester des Bayerischen Rundfunks wechseln, begeisterte das die deutschen Feuilletonist*innen. Las man am selben Tag den britischen Guardian, erfuhr man, dass Rattle seinen Vertrag beim London Symphonie Orchestra bis 2022 verlängert habe, ach so, und irgendwann werde er nach München gehen. Ein Ereignis, zwei Reporter*innen, zwei Welten, eine Übersetzung hätte in diesem Fall nicht geholfen.

Eine*n Auslandskorrespondent*in wird ein Übersetzungstool nicht ersetzen können – ihr oder ihm die Arbeit erleichtern allerdings schon. Das ist schlecht für all jene Stringer, Fixer und Lokaljournalist*innen, die rund um den Globus dafür sorgen, dass Journalist*innen die richtigen Informationen, Kontakte und Zugänge bekommen, ohne die sie auf fremdem Terrain oft aufgeschmissen wären. Es könnte ja jemand auf die Idee kommen, dass man sie erst als Übersetzer*innen und schließlich überhaupt nicht mehr braucht. Schon jetzt leisten sich nur noch wenige Redaktionen ein Netz an Reporter*innen fern der Heimat. Ein leichterer Zugang zu allen Sprachen der Welt dürfte diese Entwicklung beschleunigen – verursacht hat er sie nicht. 

Wie bei vielem, was neue Technologien bieten, gilt es, im Besonderen einer Versuchung zu widerstehen: Dass man machen muss, was man machen kann. Inhalte per KI zu übersetzen, nur weil es funktioniert, ist noch keine Strategie. Welches Publikum will man mit welchen Inhalten erreichen, und was soll das bewirken? Hat man eine Mission, ein Geschäftsmodell oder einfach nur Spaß daran? Schon sind sie wieder da, diese Fragen, die keine KI beantworten kann.

Diese Kolumne erschien im Newsletter des Digital Journalism Fellowship an der Hamburg Media School am 5. Februar 2021.

Job Titel: Managing Roboter

Automatisierung in der Redaktion, für manch einen mag das nach Arbeitsplatzabbau klingen. Tatsächlich kann sie Medienhäusern beim Überleben helfen und den Journalismus verbessern. Es kommt ganz darauf an, was man damit macht.   

Wenn Unternehmen jetzt für Produkte werben, die Corona im Titel tragen, stellt sich zuweilen Misstrauen ein. Schließlich gilt: Keine Krise ohne Krisengewinnler, und nicht jeder hat das Gewinnen verdient. Brauchen Redaktionen also „Corona Watch“? Der Bot wertet automatisch wichtige Quellen zur Krisenlage aus und alarmiert Redakteure und Reporter über einen Slack Channel. Die Redaktion legt vorher Quellen und Kriterien fest.

Die Redaktion der schwedischen Tageszeitung Aftonbladet findet: ja. Chef vom Dienst Michael Poromaa sagt, das Tool entlaste sein Team nicht nur, es verschaffe ihm auch einen Wettbewerbsvorteil. Man hätte sonst 21 Seiten der lokalen Gesundheitsbehörden ständig selbst aktualisieren müssen, so Poromaa. „Vorher waren wir oft maximal die zweiten, die über neue Fälle berichtet hatten, jetzt sind wir die ersten.“

Entwickelt hat „Corona Watch“ die schwedische Firma United Robots, die diverse automatisierte Lösungen für Redaktionen anbietet. Aftonbladet sei mit der Idee gekommen, innerhalb eines Tages habe man sie umgesetzt, sagt Cecilia Campbell. Campbell berät United Robots, zuvor hat die Journalistin Redaktionen für die World Association of News Publishers (Wan-Ifra) beim Aufbau von Bezahlangeboten unterstützt. In Skandinavien hat man wenig Berührungsängste, was den Roboter-Journalismus angeht, im Gegenteil. „Wer es sich noch leisten kann Journalisten einzustellen, setzt sie lieber auf größere Recherchen an“, sagt Campbell. Viele einfache Aufgaben hingegen könne man gut an Roboter auslagern.

Viele Verlage glauben, dass Automatisierung der Branche beim Überleben helfen kann. Stefan Aberg zum Beispiel leitet ein Team von gerade einmal zwei Dutzend JournalistInnen beim schwedischen Medienhaus VK Media. Es sei unmöglich, damit alle Kundenbedürfnisse zu erfüllen, sagte er 2019 auf einer Konferenz. Die Lösung: „Wir bauen eine Armee von Robotern.“ Man habe Bots für alles Mögliche: Wetter, Verkehr, Grundstücksverkäufe, Sportwettkämpfe. Seitdem die Redaktion sie großflächig verwende, sei die Zahl der Digital-Abonnenten um 70 Prozent gestiegen.

Schon heute setzen Redaktionen überall auf der Welt künstliche Intelligenz ein. Die größte Rolle spielt sie bislang im Marketing. Bots machen Leserinnen und Lesern automatisiert Abo-Angebote oder beliefern sie mit personalisierten Inhalten. Manch einer sagt, sie hören dem Publikum besser zu als Journalisten, weil sie Daten entsprechend schnell auswerten können. Einige Redaktionen trauen künstlicher Intelligenz zu, ihre Homepages besser und vorurteilsfreier zu bestücken, als sie das selbst schaffen würden. Die kanadische Globe and Mail zum Beispiel lässt von Software sicherstellen, dass täglich auch Inhalte „vorne“ spielen, die für Minderheiten interessant sind. Auch bei Projekten des Datenjournalismus und bei der Überprüfung von Fakten kommt Automatisierung häufig zum Einsatz. Manch eine Redaktion lässt von Bots feststellen, ob das Geschlechterverhältnis der zitierten Quellen ausgewogen ist.

Deutlich weniger Medienhäuser delegieren das Texte-Schreiben an Roboter. Diese Möglichkeit setzen vor allem Nachrichtenagenturen ein, denn sie müssen eine Grundversorgung bieten und deshalb viele Routine-Arbeiten erledigen. Die amerikanische AP gehörte zu den ersten Anwendern, die Quartalsberichte von Unternehmen automatisch erstellen ließ. Wo Reporter früher ein paar Hundert Firmen abdeckten, kommen Roboter heute auf ein paar Tausend im Vierteljahr. Die Washington Post hat ihre Wahlberichterstattung mit Hilfe von KI-Tools massiv ausgebaut.

Droht den Redaktionen damit ein Kahlschlag? Es sagt viel über den Zustand der Branche aus, dass nicht einmal die Gewerkschaften den Roboter-Journalismus als Teufelszeug verdammen. Job-Abbau und Sparprogramme gibt es schon seit Jahren, jetzt geht es darum zu retten, was zu retten ist. Und das schaffen Redaktionen am besten, indem sie ihre Kunden flächendeckend bedienen – mit exklusiven, von Reportern recherchierten Geschichten und beliebter Standardware gleichermaßen. Zu letzterer Kategorie gehören die lokal angepassten Wetter- und Stauberichte, um sie zu erstellen, muss niemand jahrelang zur Journalistenschule gehen.

Je früher sich Redaktionen mit den Möglichkeiten von KI und Roboter-Journalismus befassen desto besser. Denn wer sich gut auskennt, lässt sich seltener Lösungen andrehen, die kein Mensch braucht. Es geht schließlich darum, den eigenen Journalismus besser zu machen. Und das wird er nicht, wenn man Leserinnen und Leser nur mit Masse erdrückt. Außerdem hilft ein Blick auf eine Ethik-Checkliste, wie sie der ehemalige AP-Journalist und Berater Tom Kent erarbeitet hat. KI-Journalismus ist immer nur so gut, wie die Daten sind, mit denen er gefüttert wird und die Vorgaben, die ihm gemacht werden.     

United Robots bietet übrigens auch ein Tool für Sportredaktionen an. Nach dem Spiel schickt es Trainern automatisch Interview-Fragen, sie orientieren sich am Spielverlauf. Aus den Antworten bastelt der Bot einen Text. Sportreporter müssten sich also gar nicht groß umstellen, sobald es wieder Wettkämpfe gibt. Sie könnten sich weiterhin auf all die hintergründigen Geschichten konzentrieren, die ihnen gegenwärtig so gut gelingen. Den Nach-dem-Spiel-Bericht schriebe Kollege Roboter. Dem Journalismus täte das gut.

Copyright: Alexandra Borchardt 2020, Beitrag für einen Newsletter des Digital Journalism Fellowship an der Hamburg Media School.

Zum Weiterlesen:

Vom guten Ton – Wie Sprachassistenten die Gesellschaft verändern könnten

Wie sich das mit der Höflichkeit entwickeln wird, ist noch nicht ganz ausgemacht. Die einen vermuten, dass wir uns die Welt künftig nur noch im Befehlston erobern. „Alexa, bestell mir Pizza Funghi!“, „Google, weck mich morgen um sieben!“ – noch verstehen die Sprachroboter, die uns zunehmend umgeben, klare Ansagen am besten. Und wenn man nicht aufpasst, kann das leicht zu „Martin, bring den Müll runter!“ werden, was Martin nicht ganz so entspannt kommentieren dürfte wie die nette Stimme aus dem Off.

Andere hingegen meinen zu beobachten, dass Nutzer der Spracherkennung ihre Wünsche von sich aus gerne mit einem „Bitte“ beenden. Und schließlich sei es kinderleicht, dem Roboter einzuprogrammieren, dass er einem ein solches Höflichkeits-Signal abverlangt, bevor er im Sinne des Auftraggebers tätig wird. Das werde eine neue Generation von höflichen Kindern heranziehen, die der Oma dann sprachlich mit genauso viel Respekt begegnen würden wie Alexa und Co., vermuten manche. Beide Thesen werden sich in wissenschaftlichen Arbeiten überprüfen lassen, denn Daten dürften bald reichlich zur Verfügung stehen.

Wie die Voice Technologie den Umgang mit dem Internet und damit womöglich die Gesellschaft verändern kann, wird sich schwieriger überprüfen lassen. Einerseits könnte sie zum großen Demokratisierer werden, den digitalen Graben überbrücken und alle ans Netz anschließen, denen das Digitale bislang zu fremd, zu kompliziert oder aus anderen Gründen verschlossen war. Andererseits könnte es uns zu noch beflisseneren Vasallen der mächtigen Plattform-Konzerne machen: durchschaubar, denkfaul und orientierungslos.

Die optimistische Variante geht so: Künftig muss man sich weder über ein Smartphone beugen noch auf einen Bildschirm starren, um sich in der vernetzten Welt kompetent zu bewegen, ja man muss noch nicht einmal lesen und schreiben können. Wer sich sprechenderweise bemerkbar machen und Wünsche äußern kann, hat Zugang zu allen Dienstleistungen, die über das Internet zur Verfügung stehen – vorausgesetzt, der Roboter erkennt nicht nur die Sprache sondern auch den jeweiligen Dialekt. Damit könnten auch Analphabeten online tätig werden. Geschätzt haben 700 Millionen Menschen mehr oder weniger große Schwierigkeiten mit dem Lesen und Schreiben, also etwa jeder zehnte.

Aber auch diejenigen, denen „all der Digitalkram“ bislang zu kompliziert war, könnten Gefallen daran finden. Das betrifft übrigens nicht nur Großeltern. Deren digitale Beweglichkeit ist, getrieben von der Sehnsucht nach den Enkeln, mitunter erstaunlich ausgeprägt. Nutzer jeden Alters, denen das geschriebene Wort noch nie viel bedeutet hat, denen Fingerfertigkeit, Sehkraft oder schlicht die Muße fehlen, mit kleinen Bildschirmen zu hantieren, lassen sich womöglich lieber auf eine Art Dialog mit Maschinen ein.

Hinzu kommt, dass der Blick aufs Gerät bei manchen Tätigkeiten schlicht gefährlich sein kann. Das betrifft vor allem das Navigieren im Straßenverkehr. Fast jeder hat schon diese vermeintlich lustigen Videos gesehen, bei denen Fußgänger, den Blick gen Smartphone gesenkt, gegen Laternenpfähle donnern oder in Tümpel stolpern. Allerdings zeigt auch die Kurve tödlicher Autounfälle nach Jahrzehnten des Absinkens wieder nach oben. Ablenkung durchs Handy gilt als ein gewichtiger Grund dafür.

„Spracherkennung lässt die Technik in den Hintergrund treten, ja unsichtbar werden“, sagt Nic Newman, Tech-Forscher und Autor der Studie „The Future of Voice and the Implications for News“des Reuters Institutes for the Study of Journalism. Das werde den Umgang mit dem Internet spielerischer machen und viele neue Angebote hervorbringen.

Die schlauen Geräte lenken nicht so ab wie ständig blinkende Screens, sie bleiben stumm und unaufdringlich, solange man nichts von ihnen will. Sie machen deshalb vermutlich auch weniger süchtig als Smartphones, wenn man denn in diesem Zusammenhang von Suchtverhalten sprechen kann. Mal schnell nachschauen, ob es nicht doch irgendetwas Neues gibt, diesen Reflex sollten sie jedenfalls weniger auslösen als ein Gerät, das mit visuellen Reizen arbeitet. „Wir verbringen alle viel zu viel Zeit mit Bildschirmen. Unsere Augen und Gehirne sind müde, wir sind von kleinen rechteckigen Geräten abhängig geworden“, sagt Newman, „Spracherkennung wird uns davon befreien und dem Menschen die Kontrolle zurückgeben.“       

Aber Experten wie Newman halten die Technik nicht nur deshalb für transformativ. Insbesondere Menschen, die motorisch eingeschränkt sind, könnten massiv von ihr profitieren. Der britische Landkreis Hampshire testet gerade in einem Pilotprojekt, in welchem Ausmaß smarte Hör-Geraete und ihre Chatbots Behinderten und Betreuungsbedürftigen als Ansprechpartner zur Verfügung stehen können, um sie zum Beispiel an Medikamente zu erinnern, Hausgeräte zu steuern oder im Notfall Botschaften weiterzuleiten – nicht, um Pflegepersonal zu ersetzen, sondern Hausbesuche zu ergänzen, wie das zuständige Amt versichert.

Generell senkt die Technik die Hemmschwelle für Bürger, sich an ihre Gemeinde oder andere öffentliche Stellen zu wenden. Es kostet die meisten Menschen weniger Überwindung, mal eben in ein Gerät zu sprechen, um etwas zu fragen oder zu melden, anstatt sich zu dem zuständigen, womöglich schlecht gelaunten Sachbearbeiter durchzufragen oder ein Formular auszufüllen. Wenn es denn funktioniert.

Die Chancen dafür stehen recht gut. Der technische Fortschritt auf dem Feld ist gewaltig, die Software der Geräte wird dank der ständigen Fütterung mit Daten immer besser. Vor allem im Handel ist ein Wettlauf im Gange, um den Kunden mit Sprach-Dienstleistungen abzuholen, wie es so schön heißt, und das hoffentlich schneller als die Konkurrenz. Der Marktforscher Gartner prognostiziert, dass die Firmen, die früh in Voice Technologie investieren, ihren Einzelhandels-Umsatz um 30 Prozent steigern können. 2021 dürfte jede zweite Firma mehr in Bots und Chatbots investieren als in Apps.

Allerdings, und jetzt kommen die Warnhinweise, gibt es auch ein paar Risiken. Das bekannteste betrifft den Datenschutz. „Smart talking: are our devices threatening our privacy“, überschreibt der britische Guardianeinen Text von James Vlahos, und man möchte rufen: „Ja was denn sonst?“ Dass die Smart Speaker das Smartphone in seinen Spionage-Fähigkeiten noch um einiges übertreffen, ist mehr als offensichtlich. Denn weil sie passiv im Hintergrund „lauern“, vergisst man gerne, dass es sie gibt. Ausschalten geht zwar, aber es beraubt sie ihrer Funktion. 

Vlahos‘ Stück ist ein Vorabdruck aus seinem Buch, dessen Titel „Talk to Me: Apple, Google, Amazon and the Race for Voice-Controlled AI“ (Random House Penguin, 2019) auf einen Blick klar macht, wer diese neuen Zufahrtsstraßen zum Internet kontrolliert. Zwar beteuern die genannten Konzerne auf allerlei Weise, wie sie die Privatsphäre ihrer Kunden zu schützen gedenken, aber dennoch ergeben sich einige ethische und juristische Probleme aus der rasant wachsenden Anwendung der Geräte. So zitiert Vlahos einen Jura-Professor der Fordham Law School in New York, Joel Reidenberg, der sagt: „Wenn Sie ein Gerät installiert haben, das zuhört und Daten an Dritte überträgt, haben Sie Ihr Recht auf Privatsphäre verwirkt.“ So schnell kann es dahingehen mit den Bürgerrechten.

Und wer ist dafür verantwortlich, eventuell Hilfe zu alarmieren, wenn zum Beispiel ein Kind seiner mit einem Sprachempfänger ausgestatteten Barbie-Puppe anvertraut, jemand habe es seltsam angefasst? Man kann gewiss sein, dass sich bereits jetzt reihenweise Anwälte mit dem Thema beschäftigen. Wie man weiß, übernehmen die großen Datenkonzerne ungerne Verantwortung für das, was sie auslösen, wenn die Folgen denn negativ sind. Ganz abgesehen davon, dass die Gefahr des Hackens mit der Zahl der Gegenstände wächst, die kontinuierlich Daten zum Nutzerverhalten übermitteln, ob das nun die Mikrowelle, die Heizung oder das Auto ist.

Allerdings gibt es noch ein paar weniger offensichtliche Fragezeichen zur Voice Technologie als die Sorge um die Privatsphäre. Denn einerseits ist es natürlich wunderbar, wenn Dinge einfacher werden. Andererseits könnte es auch dazu führen, dass wir bestimmte Hirnregionen nicht mehr trainieren, wenn wir uns nur noch in den Wunsch- und Erwartungsmodus begeben. Schon heute werden ohne Google Maps selbst diejenigen unter uns schnell orientierungslos, die jahrzehntelang problemlos mit Hilfe von Stadtplänen und Landkarten ihren Weg gefunden haben. Bestimmte kognitive Kompetenzen bilden sich offenbar schnell zurück. Und das könnte auch für das Lesen und Verstehen von Texten gelten. Nicholas Carr hatte sich über diesen Effekt in seinem Buch „The Shallows – What the internet is doing to our brains“ (W. W. Norton, 2011) schon lange vor dem Siegeszug der Spracherkennung ein paar Gedanken gemacht.  

Die Vermutung liegt nahe: Wer sich regelmäßig von Alexa oder Google Home den Nachrichten-Überblick vorlesen lässt – der natürlich je nach Auswahl von der BBC, der Tagesschau oder anderen Redaktionen stammt – mag sich womöglich nicht mehr mit ausführlicherer Lektüre zum Tagesgeschehen beschäftigen. Zwar haben Radio und Fernsehen diesen Effekt auch schon geliefert, aber der smarte Lautsprecher lässt sich wie das Smartphone für so viele Funktionen nutzen, dass die Information nur eine davon ist. Laut Newmans Studie interessieren sich zwar eine ganze Menge Voice-Nutzer für die Nachrichten, aber nur ein Prozent von ihnen findet dieses Angebot auch wichtig. Der weit überwiegende Teil der Konsumenten nutzt die Geräte bislang vor allem fürs Musikhören auf Kommando.

Ein Trend dürfte sich verstärken: Vieles im Netz befeuert unsere Bequemlichkeit und unsere Ungeduld gleichermaßen, alles muss schnell und ohne viel Mühe in unsere Nähe gelangen. Das offensichtlichste Zeugnis davon sind vermutlich die Fahrradboten von Lebensmittel-Bring-Diensten, die sich in vielen Städten so schnell vermehren, wie man es von den dazu passenden Radwegen gerne hätte. Der Weg vom Hunger zum Essen führt immer seltener über den Supermarkt und die Küche zum Teller, mundgerechte Lieferung wird zum Standard und das durchaus auch im übertragenen Sinne.

Absehbar ist zudem, dass sich die Macht im Internet weiter auf wenige große Plattform-Konzerne konzentriert. Eine Google-Suche am Bildschirm fördert zuweilen Tausende, sogar Millionen Treffer zutage, selbst wenn sich die Wenigsten die Mühe machen, auf die vierte Seite der Suchergebnisse zu gehen. Das Voice-Gerät hingegen lässt exakt eine Antwort zu, wenn man keine weitere anfordert. Scott Galloway, Professor der New York University, hat deshalb schon prognostiziert, dass Spracherkennung der Tod des Markenartikels sein könnte. Der Kunde werde vermutlich eher Produktkategorien ordern („Ich brauche Zahnpasta“) als Markenartikel, der dahinterliegende Händler könne dann seine Lieferanten entsprechend preislich unter Druck setzen. Das Ergebnis ist ein Verdrängungswettbewerb, der sich zugunsten der ohnehin schon Starken entscheiden dürfte, doch die werden in Maßen profitieren. Denn der Kunde wird Markennamen im akustischen Raum kaum noch wahrnehmen.

Eine große Herausforderung dürfte die Sprache selbst sein. Im englischsprachigen Raum mag die Spracherkennungs-Technik als rundum positiv gesehen werden, dort setzt sie sich rasant durch. In den USA und Großbritannien nutzt schon mindestens jeder Zehnte einen Smart Speaker, immerhin sind die Geräte derzeit schon für 21 Sprachen in 36 Ländern erhältlich. Aber es wird noch eine Weile dauern, bis auch der letzte Dialekt verstanden wird. Außerdem haben die Lautsprecher noch Schwierigkeiten damit, Stimmen zuzuordnen oder Wünsche im Zusammenhang zu begreifen. (Wer daheim Alex oder gar Alexa gerufen wird, stiftet vermutlich besonders viel elektronische Verwirrung.)  

Ob die Boxen ihre Nutzer wirklich verstehen, hängt stark davon ab, wieviel sich diese mit ihnen abgeben. Denn die Technik lernt umso besser, je mehr Daten sie verarbeiten kann. Ob sie den Menschen allerdings jemals in der ganzen Komplexität seiner Kommunikation „begreifen“ wird, lässt sich getrost bezweifeln. Zu der gehört schließlich viel mehr als nur die Sprache. Manchmal verstehen wir uns schließlich nicht einmal selbst.      

Dieser Text erschien in leicht veränderter Form in „ada – Heute das Morgen verstehen“, Ausgabe 02/2019