Prof. Dr. Wolfgang Wahlster gilt als einer der Väter der Industrie 4.0. Wie sind die neuesten Entwicklungen in dem Bereich und wo steht Berlin heute? Und wie treiben KI und IoT die nächste Generation der Industrie 4.0 voran? Darüber und mehr sprach Deep Tech Berlin mit dem KI-Experten und Gründungsdirektor des DFKI.
Hallo Herr Prof. Dr. Wahlster, vielen Dank, dass Sie sich Zeit für dieses Interview nehmen! Als Gründungsdirektor des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) im Jahr 1988 sind Sie einer der Vorreiter auf dem Gebiet in Deutschland und in Berlin. Wann hatten Sie Ihren ersten Berührungspunkt mit KI?
Ich habe mich schon als Gymnasiast in einem parallelen Fernstudium mit den Grundlagen der automatischen Sprachanalyse beschäftigt und dann als erster Student in Deutschland Informatik mit mathematischer Linguistik als Anwendungsfach kombiniert. Mein Ziel war es schon in den 70er Jahren mit Hilfe von KI neuartige Softwaresysteme zu entwickeln, welche die menschliche Sprache verstehen können und die als künstliche Dialogpartner dem/der menschlichen Computernutzer*in einen Zugang ohne Tastatur und Maus ermöglichen.
Die Sprachtechnologie hat der KI im Massenmarkt zum Durchbruch verholfen: Die meisten Bürger*innen haben sicherlich schon KI-Systeme zur maschinellen Übersetzung, für natürlichsprachliche Anfragen an Suchmaschinen oder zur Bedienung von Mobiltelefonen und Fahrerassistenzsystemen benutzt. Schon meine Diplomarbeit und später auch die Dissertation in Informatik habe ich vor mehr als 40 Jahren bereits auf dem Fachgebiet KI geschrieben und habe die Entwicklung der deutschen KI-Forschung von ihren Anfängen bis heute aktiv mitgestaltet. Ich hatte auch das Privileg, noch den Berliner Erfinder des ersten voll funktionsfähigen digitalen Computers (Z3 im Jahr 1941) persönlich in mehreren Fachgesprächen kennenzulernen. Er war ohne Zweifel der erste Berliner Ingenieur, der sich schon in den 40er Jahren mit KI beschäftigte, indem er erste Computerschachprogramme und KI-Verfahren zum automatischen Beweisen mathematischer Sätze in seinem Plankalkül vorschlug.
Sie sind einer der führenden Köpfe Deutschlands im Bereich KI. Sie befassten sich schon früh mit Sprachdialogsystemen. Wie beurteilen Sie die Entwicklungen, die sich diesbezüglich seit den 1980er Jahren getan haben? Ist schon viel passiert oder sehen Sie noch viel Spielraum?
Sprachdialogsysteme sind heute für viele Dienstleistungen über Telefon oder Internet eine wesentliche Komponente. Während in den ersten Systemen nur einzelne Kommandowörter verstanden wurden, kann heute ein Anliegen in spontaner Umgangssprache formuliert werden. Wenn einmal etwas nicht sicher verstanden wurde, geht das KI-System wie ein menschlicher Dialogpartner in einen Klärungsdialog über.
Aufbauend auf unseren Forschungsergebnissen aus dem groß angelegten VERBMOBIL-Projekt, für das ich im Jahr 2001 den Deutschen Zukunftspreis des Bundepräsidenten erhielt, gibt es heute zahlreiche maschinelle Übersetzungssysteme für Texte, die recht brauchbare Ergebnisse liefern, auch wenn sie noch nicht zu 100 Prozent fehlerfrei arbeiten. Selbst das KI-basierte Simultandolmetschen von Dialogen, wie es bei VERBMOBIL erprobt wurde, ist heute in einer rudimentären Form kommerziell verfügbar.
Die aktuelle KI-Forschung in der Sprachtechnologie nutzt auch die großen Fortschritte beim Maschinellen Lernen aus Massendaten. Für das Deutsche haben wir natürlich weltweit hier die besten Datensammlungen und können dies nun als Vorteil nutzen.
Seit einigen Jahren hat sich unsere Forschung auch den sogenannten multimodalen Sprachdialogsystemen zugewandt. Das bedeutet, dass die Spracheingabe mit einer Auswertung der Gestik, Mimik, Blickbewegung und Körpersprache verbunden wird, um uns bei der Mensch-Computer-Interaktion an die Kommunikationssituation zwischen Menschen anzunähern.
Ich bin auch etwas stolz, dass seit Anfang dieses Jahres Mercedes für seine PKW-Serie ein Assistenzsystem anbietet, das freie Spracheingabe mit Gestik und Umgebungsinformation kombiniert, um z. B. Auskünfte für interessante Landmarken am Straßenrand für eine*n Reisende*n auf Anfrage jederzeit und aktuell bereitzustellen. Die Grundlagen dazu habe ich mit meinem Team am DFKI schon vor zehn Jahren veröffentlicht und erste Demonstratoren für Daimler und BMW entwickelt. Danach haben wir zusammen mit den Spracherkennungsexpert*innen von Nuance und Cerence den Prototypen weiterentwickelt, bis er dann mit Ingenieur*innen von Mercedes und einem vom DFKI zu Cerence gewechselten Spezialisten für multimodale Dialogsysteme bis zum Produkt entwickelt wurde. Der immer wieder gelingende Transfer unserer Forschungsergebnisse in marktgängige und nützliche Produkte ist die größte Motivation, sein Berufsleben der KI zu widmen.
In Zukunft werden immer mehr der sozialen und emotionalen Aspekte der Kommunikation auch in Sprachdialogsystemen eine Rolle spielen. Schon heute haben wir KI-Systeme entwickelt, die aufgrund des sprachlichen Verhaltens die emotionale Lage des/der Gesprächspartner*in grob einschätzen und sich somit in ihrem Antwortverhalten auch etwas an dessen Gefühlslage anpassen können.
Sie waren 2011 einer der Mitinitiatoren der Industrie 4.0 und entwarfen in einem weiteren Schritt Handlungsempfehlungen an die Politik. Wurden diese seitdem so umgesetzt, wie Sie sich das erwünscht hatten? Wie weit ist die Industrie 4.0 heute?
Im Jahr 2021 können wir eine Halbzeitbilanz für die Industrie 4.0 ziehen. Nach zehn Jahren ist dieser Begriff weltweit nicht nur unter Digitalisierungsexpert*innen, sondern auch bei Unternehmer*innen und Politiker*innen als deutsche Prägung wie „Kindergarten“ und „Autobahn“ bekannt. Über 90.000 Veröffentlichungen zur Industrie 4.0 sind inzwischen seit unserer Erstpublikation des Konzeptes am 1. April 2011 erschienen.
Wichtiger ist aber für den Erfolg der vierten industriellen Revolution, dass es nun die ersten Fabriken gibt, die vollständig nach den Prinzipien der Industrie 4.0 arbeiten und, dass es auch Migrationstechnologien gibt, mit denen man alte Industrie 3.0-Anlagen mit angemessenem Aufwand auf das neue Produktionsparadigma umstellen kann. Dass die Plattform Industrie 4.0 mit der Wirtschaft, Wissenschaft, Gewerkschaft und Politik gut zusammenarbeitet, hat sehr viel zur ausgezeichneten Halbzeitbilanz beigetragen. Unsere Handlungsempfehlungen wurden besonders vom BMBF und BMWi aufgegriffen und umfangreiche Förderprogramme haben die Einführung der ersten Smart Factories nachhaltig unterstützt, sodass Deutschland immer noch einen Vorsprung vor Asien und Amerika auf diesem für unsere Volkswirtschaft so wichtigen Feld hat.
Wir wollen aber auch in der nächsten Phase von Industrie 4.0, die stark durch die Einführung von KI-Technologien in der Produktion bestimmt sein wird, weiterhin Leitmarkt und Leitanbieter bleiben. Die Kombination von industrieller KI, Edge Computing und dem Internet der Dinge wird die nächste Generation von Industrie 4.0-Systemen in den kommenden zehn Jahren vorantreiben und völlig neuartige Geschäftsmodelle ermöglichen. Wir dürfen uns jetzt aber nicht auf den Erfolgen der letzten Jahre ausruhen, sondern es sind auch in Zukunft sogar noch mehr Forschungsanstrengungen auf dem Gebiet notwendig, um den Innovationsvorsprung – besonders gegenüber China, Japan und Korea – halten zu können.
Ich hoffe daher sehr, dass im nächsten Koalitionsvertrag die Förderung der zweiten Phase der vierten industriellen Revolution explizit als Ziel für die nächste Dekade festgehalten wird.
Gibt es Entwicklungen der Industrie 4.0 aus Berlin, die Sie als Paradebeispiel anführen würden? Welche Entwicklungen wünschen Sie sich noch für die Zukunft?
Im BMBF-Projekt SemProm haben wir aktive semantische Produktgedächtnisse zusammen mit unseren Berliner Standardisierungsexpert*innen am DFKI entwickelt, welche die heute als „digitale Zwillinge“ bezeichneten virtuellen Abbilder physischer Objekte vom Werkstück bis zur Werkzeugmaschine erstmals realisiert haben. Dr. Jens Haupert hat am DFKI Berlin dann im Rahmen seiner Dissertation bei mir das „Object Memory Model (OMM)“ entwickelt, das die Grundlage für digitale Tagebücher aller Gegenstände im industriellen Umfeld bildet. Ein Vorteil für Berlin war dabei, dass das Büro des World Wide Web Consortiums (W3C) für Österreich und Deutschland auch vom DFKI Berlin betrieben wird, sodass die notwendigen Standardisierungaktivitäten für das Web of Things von Berlin aus gestartet werden konnten. Die Grundlagen für digitale Zwillinge, den Austausch von Daten über den gesamten Lebenszyklus eines Produktes hinweg und zwischen allen mit dem physischen Objekt befassten Akteur*innen ist mit OMM vorbereitet worden und wird heute international in der GAIA-X-Initiative weiter vorangetrieben.
Am Standort Berlin arbeiten inzwischen sehr viele Unternehmen in den Deep-Tech-Bereichen KI, IoT und Industrie 4.0. Was macht die Stadt so attraktiv für die (Weiter-) Entwicklung von Technologien?
Es war in den letzten Jahren sicherlich die Möglichkeit, junge IT-Expert*innen aus der ganzen Welt zu gewinnen, die Berlin vor allem wegen der Lebensqualität mit all seinen kulturellen Angeboten und der weltoffenen Atmosphäre anzog. Der Mangel an Fachkräften im Bereich KI, IoT und Industrie 4.0 ist ja immer noch das Haupthindernis für die weitere Entwicklung dieser Gebiete der Informatik. Aber mit dem DFKI als international unter Expert*innen bekannter Marke im Verbund mit den T-Labs der Deutschen Telekom ist es gelungen, auch aus dem Ausland Top-Expert*innen am Anfang ihrer Karriere nach Berlin zu holen, zumal auch die Lebenshaltungskosten noch vor zehn Jahren in Berlin für Berufsanfänger*innen sehr günstig waren. Auch die Universitäten in Berlin und Potsdam konnten einige Spitzenwissenschaftler*innen auf den für KI relevanten Gebieten berufen, sodass sich auch das akademische Umfeld stark verbessert hat. Da das DFKI seine Mitarbeitenden immer wieder dazu ermutigt, eigene KI-Firmen zu gründen, wurde es schon frühzeitig in verschiedenen Innovationswettbewerben mit seinen mehr als 90 nachhaltigen Ausgründungen als das gründungsaktivste Institut, bezogen auf die Anzahl seiner Forschenden, ausgezeichnet.
In der letzten Dekade ist in Berlin ein für Europa einzigartiges Innovationsökosystem für KI entstanden, das auch ausländische Investor*innen und Venture Capital stark anzieht. Die Gründung des KI-Campus und des Software-Campus zur Ausbildung wissenschaftlich exzellenter IT-Führungskräfte sowie die Gründung der nationalen Zentrale von EIT Digital in Berlin waren wichtige Meilensteine, um Berlin zu einem Hotspot für Gründer*innen zu machen.
Inzwischen sind auch KI-affine Industrielabore u. a. von Alibaba, Amazon, Bosch, Google, VW und Zalando zu wichtigen Attraktoren für junge KI-Expert*innen in Berlin geworden. Schließlich hat auch die starke Achse Berlin/Saarbrücken mit dem renommierten Informatik-Zentrum im Saarland dazu beigetragen (führender Informatik-Fachbereich an der Universität, größter DFKI-Standort, zwei Max-Planck-Institute für Informatik, Helmholtz-Institut für Cybersicherheit, Leibniz-Zentrum für Informatik Schloss Dagstuhl). Die enge Zusammenarbeit und der stetige Personalaustausch zwischen der Berliner und der Saarbrücker KI-Szene haben sich sehr bewährt und eine Win-Win-Situation geschaffen.
Welche Technologie oder Entwicklung im Bereich KI, die aus Berlin kommt, halten Sie derzeit für die vielversprechendste? Wovon werden wir in Zukunft noch mehr brauchen?
Hier möchte ich nochmals auf die KI-basierte Sprachtechnologie zurückkommen. Die zweite Welle der Digitalisierung ermöglicht ja nicht nur die Bereitstellung maschinenlesbarer Daten, sondern durch KI-Verfahren erstmals auch die Auswertung maschinenverstehbarer Daten. Damit können die Inhalte digitaler Dokumente erschlossen werden und zu automatisierten Reaktionen führen. Neuartige Technologien zur Informationsextraktion aus Texten und Bildern oder multimodalen Dokumenten sind eine der vielversprechendsten KI-Entwicklungen, die aus Berlin kommen, wofür u. a. in der Firma GIANCE, am DFKI und an der TU Berlin sehr leistungsfähige Verfahren entwickelt wurden.
Auch die Firma ACROLINX in Berlin hat großen internationalen Erfolg mit ihren KI-Technologien für die Einhaltung sprachlicher Firmenrichtlinien für die Formulierung von Inhalten in der Außenkommunikation. Das System passt den Inhalt an die Firmenvorgaben an und verkürzt den Redaktionsprozess durch Automatisierung. Die sehr anspruchsvolle Vision eines „semantischen Webs“, das nicht mehr auf Schlüsselwortsuche beruht, sondern einem tiefen Verständnis der Inhalte des Webs wird damit zukünftig realisierbar: Das wäre dann auch für die Bekämpfung von Fake News und Hass-Sprache ein wichtiger gesellschaftlicher Beitrag der KI.
In Zukunft brauchen wir noch mehr Forschung zur Kombination von statistischem Maschinellen Lernen mit wissensbasierten Methoden in hybriden KI-Systeme. Diese dominieren die nächste Generation von kognitiven KI-Systemen. Besonders das Thema der Zertifizierbarkeit vertrauenswürdiger KI-Systeme wird künftig von größter Bedeutung für die Akzeptanz von KI-Lösungen in der breiten Bevölkerung sein. Dieses Jahr wollen wir mit der Umsetzung der Handlungsempfehlungen der deutschen KI-Normungsroadmap Künstliche Intelligenz beginnen, wobei diese von Berlin aus zusammen mit einer Geschäftsstelle des DIN koordiniert wird.
Vielen Dank für das spannende Interview, Herr Prof. Dr. Wahlster!