Skip to main content

Wie funktioniert das Training von KI-Modellen?

Dan O'Keefe, Appian
January 24, 2024

Das menschliche Gehirn ist eine prädiktive Maschine. Es erkennt Muster und erstellt dann Vorhersagen auf Basis früherer Erfahrungen. Dieser Teil der menschlichen Intelligenz ist für unser Überleben von zentraler Bedeutung. Beispielsweise hat vor vielen Jahren ein Sammler vielleicht eine bestimmte Beere gegessen, ist krank geworden, und hat dadurch die Anzeichen dafür erlernt, dass eine Beere giftig ist. Das geschieht ganz automatisch – wir fühlen uns elend, wenn wir die Beere wiedersehen, was dazu führt, dass wir sie vermeiden. In anderen Worten: Unser Gehirn und Nervensystem machen eine Vorhersage, die unsere Ergebnisse vorbestimmt.

Künstliche Intelligenz funktioniert auf dieselbe Weise. Sie durchläuft einen Trainingsprozess, lernt durch Ausprobieren – Trial and Error – (kann jedoch auch andere Deep-Learning-Techniken einsetzen) und sagt dann Ergebnisse voraus. Genau, wie wir lernen, giftige Beeren zu vermeiden (oder den Kaffee abkühlen zu lassen, bevor wie unsere Geschmacksnerven einen halben Tag lang ausschalten), bringt das Training des KI-Modells dem KI-System bei, wie es auf bestimmte Bedingungen reagieren soll. So können Unternehmen repetitive Aufgaben an die KI auslagern. Und wenn sie mit anderen Automatisierungs-Tools kombiniert wird, kann KI eine Vielzahl von Geschäftsprozessen verbessern, von besserem Kundenservice bis hin zur schnelleren Markteinführung von Produkten.

Durch das korrekte Training von KI-Modellen kann KI für Ihr Unternehmen eine transformative Bedeutung erhalten. In diesem Artikel beschreiben wir die wichtigsten Schritte beim Training von KI-Modellen und die verschiedenen Ansätze für den Einsatz von künstlicher Intelligenz in Unternehmen.

[Die KI-Revolution basiert auf der Verbreitung von generativer KI und großen Sprachmodellen. Erfahren Sie mehr über die Beziehung zwischen den beiden: Generative KI im Vergleich zu großen Sprachmodellen (LLMs): Was ist der Unterschied?]

So wird ein KI-Modell trainiert

Die Trainingsmethoden für KI-Modelle hängen von verschiedenen Faktoren ab, darunter der Anwendungsfall sowie Umfang und Art der verwendeten Daten. Aber während die Einzelheiten variieren, bleiben die Grundzüge beim Training aller KI-Modelle gleich, egal, ob Sie ein persönliches Modell als Hobby erstellen oder ein Fachmann sind, der an der KI-gestützten tiefen digitalen Transformation eines Unternehmens arbeitet.

1. Datenerfassung

Daten sind das Lebenselixier der KI. Starke Daten führen zu starken Modellen. Die Entwicklung eines robusten KI-Modells beginnt mit der Auswahl von Datenquellen und deren anschließender Zusammenführung an einem Ort.

Nehmen Sie ein Beispiel aus dem Bereich der Finanzdienstleistungen – Risiko- und Darlehensverarbeitung. Die Datenquellen hierfür könnten Folgendes umfassen:

  • Persönliche Daten zum Antragsteller (Kredithistorie, Adressen oder Einkommensstufe, um nur einige zu nennen)

  • Finanzielles Verhalten wie Banktransaktionen, große Bargeldabhebungen oder große einmalige Einnahmen

  • Marktdaten und wirtschaftliche Faktoren, die die Fähigkeit einer Person zur Darlehensrückzahlung beeinflussen könnten

  • Weitere Datensätze wie Gerichtsunterlagen, Immobilieneigentum, Räumungsklagen oder Hypotheken

  • Datenbanken mit Namen und Pseudonymen bekannter Wirtschaftsstraftäter und Betrüger

  • Unternehmensdaten zur Kreditrückzahlung, um Ihre eigenen Risikomarker besser zu erkennen

Die Integration dieser Daten hilft, das Modell so zu trainieren, dass es individuelle Risikomarker gewichtet, um Vorschläge und Vorhersagen treffen zu können, wenn später jemand einen Kredit beantragt.

[Daten aus verschiedenen Quellen zu erfassen, kann schnell komplex werden. Eine Data Fabric kann helfen. Erfahren Sie mehr: Der Vorteil einer Data Fabric: Befreien Sie Ihre Daten für eine schnellere Innovation aus dem Silo.]

2. Vorverarbeitung der Daten

Im nächsten Schritt werden die Daten für das Training vorbereitet. Wenn wir das Ganze aufs Kochen übertragen, bestünde der erste Schritt in der Sammlung der Zutaten und der zweite Schritt darin, diese zu schneiden, um sie auf den Kochtopf vorzubereiten. Die Vorverarbeitung umfasst:

  • Prüfung der Daten auf Angemessenheit und Vollständigkeit

  • Formatierung der Daten für das Training

  • Bereinigung der Daten

Die Vorverarbeitung ist von entscheidender Bedeutung. KI-Modelle benötigen mehrere Datenquellen, deren Daten häufig in stark voneinander abweichenden Formaten vorliegen. Durch die Vorverarbeitung werden diese Datenelemente so strukturiert, dass eine künstliche Intelligenz leichter darauf zugreifen, sie verarbeiten und mit ihnen trainiert werden kann.

Profi-Tipp: Dies ist der perfekte Zeitpunkt, um über Verzerrungen und Vorurteile nachzudenken. Entfernen Sie in diesem Schritt alle Datenelemente, die dazu führen könnten, dass das Modell fehlerhafte Vorhersagen macht oder, noch schlimmer, Menschen diskriminiert. Überprüfen Sie beispielsweise Datenquellen auf Informationen, die jemanden auf Grundlage geschützter demografischer Merkmale identifizieren könnten.

Das Letzte, was Sie wollen, ist ein KI-Modell, das auf Basis dieser Faktoren schlechte Entscheidungen trifft. Auch wenn mögliche Vorurteile unbeabsichtigt sind, können Unternehmen dennoch zum Ziel von Geldstrafen werden und Rufschaden erleiden. Die Vermeidung von Verzerrungen und Vorurteilen ist ein fortlaufender Prozess, aber dieser Schritt schafft eine gute Grundlage.

3. Die Auswahl des Modells

Die Einzelheiten beim Training eines KI-Modells hängen von Ihrem Anwendungsfall ab. Für die Auswahl der ML-Trainingsmodelle ist der Data-Science-Experte verantwortlich. Über die Arten von KI-Trainingsmodellen könnte ein eigener Artikel geschrieben werden, aber hier sind ein paar Beispiele.

Reinforcement-Learning-Modelle führen eine Reihe von Simulationen aus, in denen die KI versucht, durch Ausprobieren eine Ausgabe zu erzeugen oder ein Ziel zu erreichen. Das Modell führt Aktionen aus und erhält im Gegenzug eine positive oder negative Verstärkung, basierend darauf, ob sie das gewünschte Ziel erreicht hat.

Deep-Learning-Modelle verwenden neuronale Netze, um aus Daten zu lernen. Sie nehmen Informationen auf und beginnen innerhalb jeder Wiederholung damit, diese Informationen zu klassifizieren und Unterschiede zu erlernen. Beispielsweise könnten Sie Bilder in ein Deep-Learning-KI-Modell einspeisen und es könnte in einem ersten Durchlauf lernen, dass ein bestimmtes Bild Möbel zeigt. In einem darauffolgenden Lernzyklus könnte es dann lernen, zwischen verschiedenen Arten von Möbeln zu unterscheiden, beispielsweise zwischen einem Stuhl mit Sitzkissen und einem Tisch.

Sie können aus verschiedenen Arten von KI-Modellen wählen. Die Auswahl des passenden Modells für eine bestimmte Aufgabe hängt von Ihrem Ziel ab. Im vorherigen Beispiel macht Reinforcement Learning mehr Sinn für die Vorhersage von Geschäftszielen, während Deep Learning besser für die Entwicklung von Modellen geeignet ist, die Dinge wie Bilder, Dokumente oder Texte erkennen sollen. Häufig werden für eine Aufgabe mehrere verschiedene Methoden eingesetzt.

4. Training

Zu guter Letzt wird das Modell trainiert. Dabei findet maschinelles Lernen statt. Wie das Training erfolgt, hängt natürlich davon ab, welches ML-Modell im vorherigen Schritt gewählt wurde. Aber im Allgemeinen führt die KI eine Reihe von Tests oder Simulationen durch, trifft Vorhersagen und vergleicht diese Vorhersagen dann mit einem erwarteten Ziel oder Ergebnis. Das Modell passt sich über mehrere Trainingsrunden hinweg an. Im Laufe der Zeit sollte der Unterschied zwischen Vorhersage und erwartetem Ergebnis kleiner werden, was zu korrekteren Vorhersagen führt.

5. Bewertung

Nach dem Training werden die Ergebnisse getestet. Wie in jedem anderen Geschäftsbereich ist auch für eine KI eine gewisse Qualitätssicherung nötig. Testen Sie das Modell mit einem kleinen Satz an Aufgaben aus der echten Welt, um sicherzustellen, dass es gut funktioniert. Wenn Sie zufrieden sind, können Sie es in einer höheren Umgebung bereitstellen. Falls nicht, geht es zurück zum Training.

Aber die Modellbewertung ist kein einmaliges Ereignis. Unternehmen müssen ihre KI-Modelle kontinuierlich bewerten, um sicherzustellen, dass sie die richtigen Ergebnisse produzieren. Beispielsweise waren mehrere große US-Krankenversicherungen starker Kritik ausgesetzt und sehen sich Klagen gegenüber, weil Schadensansprüche exzessiv abgelehnt wurden. Menschliche Aufsicht, durch die sichergestellt wird, dass Modelle keine falschen Entscheidungen treffen, ist entscheidend, um schlechte Leistungen, Reputationsschäden, geringe Kundenzufriedenheit oder sogar Compliance-Strafen zu vermeiden.

Training von KI-Modellen: Der öffentliche im Vergleich zum privaten Ansatz

Ich habe mehrmals erwähnt, dass für die Entwicklung dieser Modelle Expertenkenntnisse erforderlich sind. Unternehmen können aus drei Methoden wählen, um die Ressourcen für den Aufbau dieser Modelle zu erhalten.

Erste Methode: Alles intern entwickeln. Dieser Ansatz hat verschiedene Vorteile. Sie haben die volle Kontrolle über Ihre Modelle. Modelle werden mit Ihren Daten trainiert, was ihre Präzision erhöht. Sie können die Modelle leicht anpassen, wenn Unstimmigkeiten auftreten. Und, noch wichtiger, Ihre Daten bleiben privat. Aber diese Methode ist teuer. Sie benötigen ein Team aus Dateningenieuren, Datenwissenschaftlern und Softwareentwicklern. Und natürlich das Budget für Ihre Hardware, Software und Infrastruktur. Das macht die Methode für Unternehmen, bei denen KI nicht geschäftskritisch ist, unerreichbar.

Zweite Methode: Einen großen Public-Cloud-Anbieter (auch als Hyperscaler bezeichnet) verwenden. Diese Unternehmen stellen vorgefertigte KI-Modelle bereit, die Sie für Ihre Aufgaben einsetzen können. So entstehen Ihnen keine Kosten für ein großes Datenteam. Aber die Sache hat einen Haken. Sie haben wenig Kontrolle über Ihre Daten. Das bedeutet, dass die Modelle nicht auf Ihr Unternehmen zugeschnitten sind und der Anbieter schlimmstenfalls sogar Ihre Daten verwendet, um seine eigenen Algorithmen zu trainieren. Dies ist ein großes Risiko für Ihre Datensicherheit.

Dritte Methode: Einen Anbieter verwenden, der ganz auf private KI setzt. Hierbei handelt es sich um große Hyperautomatisierungsplattformen, die einen privaten KI-Ansatz verfolgen. Sie können mithilfe von Low-Code- oder No-Code-Tools Ihre eigenen Modelle erstellen und sie in breitere End-to-End-Prozesse integrieren, die Ihr Geschäft transformieren. Beispielsweise können Sie einen Satz E-Mails oder Dokumente hochladen und die Plattform soll damit ein Modell für Sie trainieren. Dann können Sie die Ergebnisse testen und das Modell in der Produktionsumgebung bereitstellen. Und Sie können die Modelle sogar kontinuierlich verfeinern. So bleiben Ihre Daten vertraulich, ohne dass Sie ein enorm teures Team einstellen und hohe Mengen an Hardware und Systemen kaufen und warten müssen.

Sie wollen verstehen, wie dieser private KI-Ansatz funktioniert? Lesen Sie eine detaillierte Beschreibung dieser drei Methoden, um herauszufinden, welche die richtige für Sie ist – und erfahren Sie mehr darüber, wie private KI-Plattformen funktionieren – in Implementierung privater KI: Ein praktischer Leitfaden.