Künstliche Intelligenz: Differenzierung durch Daten
Dank ihres schnellen Aufstiegs und transformativen Potenzials kann sich die generative KI (GenKI) zum Wahrzeichen der modernen Wirtschaft entwickeln. Je mehr die KI Volkswirtschaften und Wirtschaftszweige transformiert, desto größer wird das Spektrum an Chancen und Risiken. Der Abstand zwischen Gewinnern und Verlierern wird zunehmen. Wir haben bereits darauf hingewiesen, dass es auch außerhalb der wenigen großen US-Unternehmen, die den Aktienmarkt bisher beflügelt haben, potenzielle Nutznießer geben wird. Dazu gehören in erster Linie Unternehmen wie Halbleiterhersteller, die wir „Enabler“ nennen. Die nächste Gruppe der potenziellen Gewinner wird voraussichtlich im Bereich „Daten und Sicherheit“ zu finden sein.
Die Menge der generierten Daten wächst exponentiell. Datensätze werden immer größer, unstrukturierter und komplexer. Das sind ideale Voraussetzungen für die Entwicklung innovativer KI-Technologien wie große Sprachmodelle. Studien zufolge gibt es jedoch eine große Herausforderung, die Unternehmen an der Skalierung ihrer KI-Ambitionen hindert: das Datenmanagement – von der Erfassung und Speicherung bis hin zur Bereinigung und Sicherung.1 Unternehmen aus dem gesamten Technologieökosystem, die andere Firmen bei diesen Aufgaben unterstützen, können von der Ausbreitung der KI überproportional profitieren.
Quelle: Domo, im September 2022 erstmals veröffentlicht und danach aktualisiert. Verweise auf ein bestimmtes Unternehmen oder Wertpapier stellen keine Empfehlungen dar, das betreffende Unternehmen oder dessen Wertpapiere zu kaufen, zu halten oder zu verkaufen oder sich direkt an dem Unternehmen zu beteiligen oder in dessen Wertpapiere zu investieren.
Von der Erfassung bis zur Sicherung
Datensammlung
Die Einführung kommerziell zugänglicher großer Sprachmodelle wie ChatGPT erfordert eine erhebliche Rechen- und Speicherleistung. Aber vor allem brauchen diese Modelle Daten. Während der Trainingsphase erkennen sie Muster und Zusammenhänge in den eingegebenen Daten und treffen darauf basierend Vorhersagen. Um ein Modell optimal für die gewünschte Größe und den Umfang der Anwendungsfälle vorzubereiten, muss es mit einer Vielzahl an relevanten, akkuraten und umfassenden Daten trainiert werden. Dennoch sind CEOs besorgt, dass die Herkunft und Verlässlichkeit von Daten ein Hindernis für die Akzeptanz der generativen KI darstellen.2
Es gibt zwei Kategorien von Daten: strukturierte und unstrukturierte. In ihrer Rohform sind strukturierte Daten quantitativ und daher organisiert. Unstrukturierte Daten hingegen sind qualitativ – wie etwa Audio-, Video- oder Social-Media-Beiträge – und müssen erst noch ausgewertet werden. Obwohl strukturierte Daten leichter zu entschlüsseln sind, bieten unstrukturierte Daten bei effektiver Analyse tiefere Einblicke in Gewohnheiten und Verhalten. Sie sind daher aussagekräftiger und führen zu besseren Ergebnissen.
Um das volle Potenzial von Modellen zu heben, sammeln Data Engineers für das Training sowohl strukturierte als auch unstrukturierte Daten. Was dabei herauskommt, hängt letztendlich von den Mustern ab, die von den eingegebenen Daten gelernt werden. Ein KI-Modell kann nur so effektiv sein wie die Trainingsdaten. Repräsentative, hochwertige und akkurate Datensätze sind daher unerlässlich. Unternehmen, die unstrukturierte Daten effektiv nutzen, erzielen Effizienzsteigerungen und folglich bessere Ergebnisse.
Datenspeicherung
Die Speichermöglichkeiten für die gesammelten Daten reichen von On-Premise-, Public- und Private-Cloud-Umgebungen bis hin zu hybriden Lösungen. Jede Option hat unterschiedliche Vorteile und Einschränkungen.
- On-Premise-Speicher bieten Autonomie und Kontrolle über die Hardware, was besonders bei sensiblen Daten oder regulatorischen Anforderungen ein Vorzug sein kann. Die Investitionskosten sind zu Beginn allerdings hoch und die Skalierbarkeit ist begrenzt.
- Cloud-Umgebungen hingegen bieten Skalierbarkeit, Zugänglichkeit und ein Kostenmodell, das in der Regel auf der Nutzung basiert. Durch die Abhängigkeit von externen Dienstleistern kann es jedoch Bedenken in puncto Datenschutz geben.
- Hybride Lösungen kombinieren die Vorteile von On-Premise- und Cloud-Umgebungen. Zwar bietet ein hybrider Ansatz hohe Flexibilität in Bezug auf Skalierung, Kosten und Effizienz, aber die komplexe Integration erfordert Expertise.
In den letzten Jahren hat ein Wandel hin zu Cloud-Umgebungen stattgefunden, an dem nicht nur die Pandemie schuld war. Auch die zunehmende Dynamik bei KI-Workloads und KI-Diensten wird zum Wachstum und den Margen im Cloud-Computing beitragen. Davon werden Unternehmen des Cloud-Ökosystems voraussichtlich profitieren. Das sind zum Beispiel Netzwerkinfrastruktur-Anbieter, die den Wechsel von On-Premise-Lösungen zu Cloud-Plattformen erleichtern.
Quelle: Goldman Sachs Global Investment Research. Stand: 18. März 2024. 100 befragte IT-Führungskräfte von Global-2000-Unternehmen. Frage: „Wie viel Prozent Ihrer Anwendungen haben Sie bisher auf Public-Cloud-Plattformen migriert (z. B. Amazon AWS, Microsoft Azure, Google Cloud) und wie hoch wird dieser Anteil in 3 Jahren voraussichtlich sein?“ Verweise auf ein bestimmtes Unternehmen oder Wertpapier stellen keine Empfehlungen dar, das betreffende Unternehmen oder dessen Wertpapiere zu kaufen, zu halten oder zu verkaufen oder sich direkt an dem Unternehmen zu beteiligen oder in dessen Wertpapiere zu investieren.
Datenbereinigung
Entscheidend für Unternehmen ist, dass sie sich auf die Ergebnisse von KI-Modellen verlassen können. Die Zuverlässigkeit der Modelle, sprich: zu wissen, wo die Daten herkommen und ob sie richtig sind, ist unerlässlich für das Vertrauen von Nutzenden und Stakeholdern. Wir rechnen damit, dass Firmenlenker sich bei wichtigen Entscheidungen – seien es Bonitätsratings oder Wahlmöglichkeiten im Gesundheitswesen – zunehmend auf die KI stützen. Je mehr auf dem Spiel steht, desto wichtiger ist es, dass KI-Modelle auf hochwertigen Daten basieren.
Werden KI-Modelle mit unorganisierten und ungenauen Daten gefüttert, kann das teuer werden. Kostspielige Fehler und zeitraubende Korrekturen beeinträchtigen die Leistung. Datenbereinigungsdienste können helfen, die Integrität der Wertkette zu wahren und die Anforderungen an die Nachverfolgbarkeit der Datenherkunft zu erfüllen. Wir sehen enorme Investmentmöglichkeiten bei Unternehmen, die Dienstleistungen zur Aufbereitung und Bereinigung von Daten anbieten.
Datenschutz
In einer Welt, in der sich Cyberangriffe ständig weiterentwickeln und Hacker immer neue Schwachstellen finden, ist der Schutz von Trainingsdaten entscheidend. Dass Cyberangriffe immer häufiger und komplexer werden, ist auf die weltweit fortschreitende Digitalisierung und das schwierige geopolitische Umfeld zurückzuführen. Die immer besser werdenden Fähigkeiten der KI werden möglicherweise auch für Cyberangriffe und Datenmissbrauch genutzt. Ebenso wichtig sind sie jedoch für eine erfolgreiche Abwehr, denn sie können verborgene Aktivitäten und komplexe Muster von bösartigem Verhalten aufdecken.
Wenn sich die Bedrohungslage ändert, müssen die Entscheidungsträger, die in Unternehmen für Informationssicherheit verantwortlich sind, neue Lösungen für den Schutz der Firmendaten finden. Anbieter der nächsten Generation von Cybersicherheitslösungen können ihren Kunden helfen, ihr wertvollstes Gut zu schützen. Durch Innovationen und Marktwachstum werden in den kommenden Jahren Investmentmöglichkeiten bei robusten Cyberabwehrtechnologien entstehen.
Die Macht liegt in den Daten
KI-Modelle werden immer ausgefeilter und komplexer. Die GenKI-Fähigkeiten eines Unternehmens hängen jedoch von der Qualität seiner Daten und der effektiven Verwaltung dieser Daten über den gesamten Lebenszyklus ab. Dazu gehören die Herkunft der Daten, die Speicherinfrastruktur, Bereinigungsprotokolle und Sicherheitsmaßnahmen.
Wir schauen uns nach Unternehmen um, die anderen helfen, ihre Daten effektiv zu verwalten und Beeinträchtigungen durch fehlerhafte Daten zu vermeiden. Als aktive Anleger beurteilen wir Investmentmöglichkeiten danach, ob Daten eingesetzt werden, um die betriebliche Effizienz zu steigern, Kunden besser zu verstehen, personalisierte Erlebnisse bereitzustellen und mit KI fundiertere Entscheidungen zu treffen. Mit zunehmender Reife von KI-Technologien werden sich solche Unternehmen 2024 und auch in Zukunft von dem breiter werdenden Spektrum der Investmentmöglichkeiten abheben.
1 McKinsey. The data dividend: Fueling generative AI (Die Datendividende: Was die generative KI beflügelt). Stand: 15. September 2023.
2 IBM Institute for Business Value. Pulsbefragung unter CEOs über generative KI. 200 CEOs in den USA. Stand: April/Mai 2023.