Maschinelles Lernen: Der Aufstieg der generativen KI in Wirtschaft, Forschung und Bildung
Ein besonderer Fokus gilt derzeit den Fähigkeiten der generativen künstlichen Intelligenz (GKI). Viele sind erstaunt darüber, was Sprachmodelle (sog. large language models) wie ChatGPT zu leisten vermögen, wie etwa Romane zu schreiben, Kochrezepte vorzuschlagen oder komplexe Forschungsergebnisse zusammenfassen. Diese Modelle sind erst der Anfang, denn es werden bereits noch wesentlich leistungsfähigere Werkzeuge entwickelt. Es gibt jedoch auch Bedenken: Werden sie im großen Stil Arbeitsplätze überflüssig und Menschen arbeitslos machen? Können Maschinen irgendwann die Welt beherrschen?
Lou D’Ambrosio, Leiter des Goldman Sachs Value Accelerator, sprach kürzlich mit Dave Ferrucci, einem vielfach ausgezeichneten KI-Forscher. Von 2007 bis 2011 leitete Dr. Ferrucci ein Team von IBM-Experten und Wissenschaftlern, die den IBM Watson entwickelten. Dieses Computersystem besiegte die größten Champions der Fernseh-Quizshow Jeopardy! Im Jahr 2015 gründete er Elemental Cognition, ein KI-Unternehmen, das sich mit Natural Language Understanding, also dem Verstehen natürlicher Sprache, befasst.
Wo kommen diese Sprachmodelle, von denen alle reden, plötzlich her?
Ferrucci: Sie sind zweifellos ein großer Schritt für die Künstliche Intelligenz. Nicht alle realisieren jedoch, dass dies ein langer Weg war. Sie sind nicht aus dem Nichts aufgetaucht. An der KI wird schon seit Jahrzehnten gearbeitet. Aber das, was wir jetzt sehen, ist ein Wendepunkt. Die Fähigkeit, Sprache zu beherrschen, ist eng mit menschlicher Intelligenz verbunden, und genau das können diese großen Sprachmodelle. Wir sehen jetzt Maschinen, die so zusammenhängend und fließend sprechen wie die Besten von uns.
Wie funktionieren diese Modelle?
Ferrucci: Große Sprachmodelle (sog. large language models) sind eine Anwendung des Deep Learnings. Sie arbeiten vorausschauend und untersuchen große Mengen von Trainingsdaten auf Wortmuster. Daraus berechnen sie die Wahrscheinlichkeiten, dass bestimmte Wörter auf eine bestimmte Sequenz anderer Wörter folgen. Sie können das so gut, weil die Menge der Daten, mit denen sie trainiert werden, riesig ist. Das ermöglicht eine unglaubliche Sprachgewandtheit, die nicht nur mit der Sprache in den Trainingsdaten übereinstimmt, sondern auch mit der Aufforderung, die Nutzende eingeben. Darauf können Nutzende dann natürlich reagieren, und so entsteht ein Dialog. Die Modelle denken zwar nicht so wie Menschen, aber dennoch ist ihre Wirkung dramatisch und signifikant. Das Ergebnis ist die Mensch-Maschine-Kommunikation.
Welche Auswirkungen hat das für Unternehmen?
Ferrucci: Sprache ist entscheidend für den Erwerb von Wissen. Der Austausch von Ideen unter Menschen erfolgt durch Sprache. Es ist daher möglich, dass Sprachmodelle grundlegende Funktionen in Unternehmen beeinflussen, z.B. rund um die Zusammenfassung, Synthese, Erklärung und Bereitstellung wichtiger Daten und Erkenntnisse. Die Aufgabe des Reportings, die mittlere Führungskräfte zwischen den Führungsebenen innehaben, könnte betroffen sein. Die Wertschöpfung beginnt sich zu verschieben, weil Entscheidungsträger die Synthese, Zusammenfassung, Sammlung und Bereitstellung von Informationen von einer Maschine deutlich kostengünstiger durchführen lassen können. Die Kunden von Unternehmen können nun viel einfacher und mit weniger menschlicher Expertise auf dieses Wissen zugreifen.
Könnte ein Unternehmen sein eigenes Sprachmodell entwickeln, um all diese Möglichkeiten zu nutzen, aber eine gewisse Kontrolle über die Trainingsdaten zu behalten?
Ferrucci: Man kann wohl damit rechnen, dass Sprachmodelle entwickelt werden, die sich auf einen bestimmten Bereich spezialisieren und innerhalb eines Unternehmens für dessen spezifische Inhalte trainiert werden. Mit sogenannten Foundational Language Models können sie darin geschult werden, wie allgemeine Sprache strukturiert ist. Aber man setzt noch eine Schicht darauf, um sie mit dem spezifischen Wissen eines Unternehmens zu trainieren. Man kann sie auch bereichsspezifisch nur für bestimmte Themen trainieren.
Wie sollten Unternehmen das Potenzial nutzen, das Sprachmodelle bieten?
Ferrucci: Sie können es sich meines Erachtens nicht leisten, die Entwicklung zu ignorieren. Die richtige Lösung hängt von der Art des Unternehmens ab. Unternehmen müssen experimentieren. Ein wichtiges Kriterium ist, ob das Produkt oder die Dienstleistung eines Unternehmens mit KI direkt repliziert werden kann. Darüber hinaus müssen Unternehmen ihre Workflows und Prozesse möglicherweise überdenken, um anhand risikoarmer Experimente realisierbare Chancen zu erkennen. Das Hauptrisiko besteht meiner Ansicht nach darin, die KI zu ignorieren oder nicht alle Möglichkeiten in Betracht zu ziehen, wie die KI Geschäftsprozesse beeinflussen könnte.
Welche Tätigkeiten werden davon betroffen sein?
Ferrucci: Alle reden über die Auswirkungen auf kreative Rollen. Denken wir nur an die Rolle von Schreibenden in Vertriebs- und Marketingfunktionen. Vieles von dem, was sie tun, ist möglicherweise repetitiv und schablonenhaft. Die Modelle können solche Aufgaben extrem kostengünstig ausführen. Schreibende könnten sich auf die 20 % ihrer Rolle konzentrieren, die darin besteht, neue Ideen zu entwickeln und einen echten Mehrwert zu schaffen.
Bestehende Datenbanken und Computersysteme verfügen bereits über leistungsstarke, effektive und zuverlässige Rechentechniken. Sie brauchen aber eine Person, die dem Entscheidungsträger und der Nutzung dieser Technologie zwischengeschaltet ist. Große Sprachmodelle können Entscheidungsträgern nun helfen, fließend mit diesen Systemen zu kommunizieren, um Analysen durchzuführen und Schlussfolgerungen zu ziehen. Nehmen wir die Logistik, wo komplexe Sachverhalte wie Reisen, Gesundheitsversorgung, Finanzen oder Design früher Interaktionen mehrerer Personen erforderten. Jetzt kann eine Maschine diese Probleme lösen und fließend mit jemandem interagieren, der nicht unbedingt alle Prozesse versteht. Callcenter beispielsweise setzen jetzt Maschinen ein, um 90 bis 95% der eingehenden Anrufe zu bearbeiten. Vorher waren es nur 40 bis 50%.
Wie wirkt sich die KI in Bereichen wie Forschung und Biopharmazeutik aus?
Ferrucci: Unternehmen kombinieren große Sprachmodelle mit Such- und semantischen Analysen. Dadurch reduziert sich der Bedarf an Desktop-Recherchen drastisch. Gut fundierte, qualitativ hochwertige Forschung in Bereichen wie Investments oder Arzneimittelentwicklung, die früher Monate gedauert haben, kann nun vielleicht innerhalb von Tagen, Stunden oder sogar Minuten durchgeführt werden.
Ein anderes Gebiet ist die Proteinfaltung. Wie Proteine sich falten folgt vorhersehbaren Mustern, die im Wesentlichen einer Sprache ähneln. Große Sprachmodelle verwenden leistungsstarke Deep-Learning-Techniken, um diese Sequenzen von Mustern zu erlernen. So können sie uns helfen, Proteine und Proteinfaltung zu verstehen. Sie spielen daher eine wichtige Rolle bei der Entdeckung neuer Medikamente und dem Verstehen von Krankheiten.
Bei Sprache geht es um mehr als nur Wörter. Sprache umfasst Sequenzen und Muster, die Bedeutung verleihen. Die Struktur eines Proteins basiert quasi auf Sprache. Sprachmodelle können uns helfen, die typischen Muster dahinter viel effizienter zu erkennen.
Welche Rolle spielt die KI in der Bildung?
Ferrucci: Heutzutage kann man sich zu jedem Thema bilden. Das Hauptproblem ist jedoch, dass Bildung nicht auf die einzelnen Lernenden zugeschnitten ist. Aber stellen wir uns einmal vor, man könnte alle verfügbaren Inhalte nehmen und sie dynamisch, interaktiv und ganz individuell gestalten. Dadurch würden enorme Verbesserungen in der Bildung erzielt werden, sowohl in der akademischen Welt als auch in Unternehmen.
Wo müssen wir vorsichtig sein?
Ferrucci: Wir müssen vorsichtig sein, wie diese Tools missbraucht werden könnten. Es gibt z.B. Bedenken hinsichtlich der Sicherheit, geistigem Eigentum und den Auswirkungen dieser Tools auf die Wirtschaft. Wir kennen einfach noch nicht alle möglichen Implikationen.
Diejenigen, die diese Modelle am besten verstehen, haben legitime Bedenken hinsichtlich Datenschutz, Sicherheit, Zuverlässigkeit und Vertrauenswürdigkeit. Die Technologie ist bereits einfach zu benutzen und schon weit verbreitet. Daher weiß ich nicht, wie praktikabel es ist, den aktuellen Fortschritt und die Entwicklung aufzuhalten, wie manche vorschlagen.
Es ist wichtig, diese Bedenken anzuerkennen. Man muss sich ihrer bewusst sein, innehalten und gründlich darüber nachdenken. Viele davon können gelöst werden. Aber wir dürfen nicht vergessen, dass es sich um generative Systeme handelt – d.h. sie generieren Neues. Sie könnten Informationen aufgreifen, die nicht wahr sind, und Dinge aus diesen falschen Informationen entwickeln. Es ist nicht dasselbe wie eine Suche.
Wo werden wir Ihrer Ansicht nach in 10 Jahren stehen?
Ferrucci: Ich bin generell optimistisch. Allerdings gibt es viele Vorbehalte zu berücksichtigen. Heute befinden wir uns immer noch in der Phase, in der Menschen Maschinen trainieren. Aber diese Modelle werden so fließend sein und Sprache so gut synthetisieren können, dass Maschinen möglicherweise irgendwann Menschen trainieren. Maschinen könnten uns neue Fähigkeiten beibringen, uns in einer Vielzahl von Themen unterrichten. Die Maschine bietet vielleicht den personalisierten, interaktiven Zugang zu Lerninhalten. Gleichzeitig können normale Menschen Computer programmieren, um eine Vielzahl von Aufgaben nur durch Sprechen mit der Maschine zu erledigen.
Tatsächlich sehe ich keine Zukunft für die Menschheit ohne Künstliche Intelligenz. Aus meiner Sicht ist sie das grundlegendste Werkzeug für den menschlichen Fortschritt. Das bedeutet nicht, dass es keine Herausforderungen geben wird oder dass wir nicht noch viel lernen müssen. Die Menschen werden experimentieren müssen. Wir müssen vorsichtig sein und brauchen sorgfältige, passende Regulierung. Aber es ist eine leistungsstarke Technologie, und ich sehe es als unsere Bestimmung an, sie zu meistern.
Wie viel können sich große Sprachmodelle noch verbessern?
Ferrucci: Ich glaube, wir werden an einen Punkt kommen, an dem der Nutzenzuwachs abnimmt. Der Nutzen wird dann davon abhängen, wie effektiv wir Modelle anpassen, um spezifische Probleme zu lösen. Wir können die Modelle mit einer riesigen Menge menschlicher Sprache trainieren, aber wie nutzen wir sie effektiv im Unternehmen? Wie integrieren wir sie mit anderen Techniken und Technologien, um wirksam zu sein? Dort wird in der Zukunft voraussichtlich das spannendste Potenzial liegen.