Skip to main content

Kampf der KI-Titanen Teil 1: Die künstliche Intelligenz von AWS

Chris Dunn, Regional Vice President - APAC
March 22, 2018

Künstliche Intelligenz (KI/AI) – Filme, Unternehmen und Karrieren basieren auf dem Thema KI. Aber bis jetzt sah das Ganze mehr nach Hype als Realität aus.

Die gute Nachricht ist, dass sich all das verändert hat. Zudem waren aus der Sicht eines Technikfreaks die Möglichkeiten zum Erstellen von AI-Augmented-Apps nie besser.

In früheren Artikeln führten wir Gespräche mit Koryphäen auf dem Gebiet der KI. Wir haben auch Anwendungsfälle und Bibliotheken verschiedener Programmiersprachen mit Blick auf die Schaffung von AI-Funktionalitäten untersucht. Dieser Blog-Beitrag ist allerdings anders: Er konzentriert sich auf ein weiteres Puzzlestück und zwar die Beschleunigung der KI-Entwicklung mithilfe von Cloud-Anwendungsplattformen.

Wir sehen uns die drei Mega-Anbieter in diesem Bereich an: Amazon AWS, Microsoft Azure und Google Cloud. Jeder dieser Anbieter verfolgt basierend auf seinem Hintergrund einen anderen Ansatz. Wir werden auch einen Blick darauf werfen, wie dies die Low-Code- und Anwendungsplattform-Märkte beeinflusst.

Amazon Web Services (AWS)

Widmen wir uns zunächst dem wohl bekanntesten IaaS-Anbieter weltweit: AWS. Amazon ist seit langem bekannt für seine leistungsstarken Dienste für Entwickler und die KI- und ML-Optionen von AWS gehen in dieselbe Richtung. Amazon bündelt diese Dienste in seinem ML-Angebot.

Amazon Deep Learning AMIs

Ganz grundlegend bietet AWS Amazon Machine Instances (AMIs), die für Deep Learning ausgelegt sind. Dabei gibt es verschiedene Ausrichtungen. Die Deep Learning AMIs sind u. a. bei folgenden Tools und Frameworks vorinstalliert: Apache MXNet, TensorFlow, PyTorch, Microsoft Cognitive Toolkit (CNTK), Caffe, Caffe2, Theano, Torch, Gluon und Keras.

SageMaker

Ich muss zugeben, das ist eine ziemlich cooler Service. Es erinnert mich an den Film Inception, aber mit KI.Zu Inception und wie der Film ins Thema passt, später mehr.Lassen Sie uns zunächst jedoch mit dem Grundwert starten – eine vordefinierte Umgebung mit allem, was Sie brauchen, um mit dem Erstellen von ML-Modellen zu beginnen. Mit wirklich allem? Ja, mit allem.

Erstens ist in der Sagemaker-Umgebung für die Zusammenarbeit und den Modellbau Jupyter Notebooks integriert. Sie sind mit Jupyter Notebooks (vormals bekannt als Python Notebooks) nicht vertraut? Hiermit lässt sich Rich-Text, Code und die Ausgabe des Codes auf der gleichen Seite verbinden. Notebooks sind für Datenwissenschaftler, die an Problemen im Bereich des maschinellen Lernens arbeiten, für Entwicklung und Zusammenarbeit zum Mittel der Wahl geworden.Zweitens baut AWS gebrauchsfertige Algorithmen in die Plattform (10 der am häufigsten verwendeten):

●      Clustering mit k-Means-Algorithmen

●      Hauptkomponentenanalyse

●      Neuronale Themenmodellierung

●      Factorization Machines

●      Lineares Lernen – Regression

●      XGBoost

●      Latent Dirichlet Allocation

●      Bildklassifikation

●      Seq2Seq

●      Linear Learner – Klassifizierung

Auch die notwendigen Treiber, um diese Algorithmen auszuführen, sind bereits vorinstalliert und entsprechend konfiguriert, sodass Sie sofort loslegen können. Aber das Beste kommt noch!

Spezielle AWS-Teams haben dafür gesorgt, dass die Algorithmen noch schneller laufen. Sie haben monatelang an den Algorithmen gefeilt, sodass laut Andy Jassy nun acht von zehn Algorithmen zehn Mal schneller laufen als sonst irgendwo und die anderen zwei immerhin drei Mal schneller.https://www.youtube.com/watch?time_continue=1&v=lM4zhNO5Rbg

Ich bin beeindruckt, mit welchem Engagement sich Amazon dem Thema KI widmet.

Falls Sie nicht auf eine solche vorgefertigte Lösung zurückgreifen wollen, können Sie auch den Framework Ihrer Wahl nutzen. TensorFlow und Apache MXNet sind bei SageMaker bereits vorkonfiguriert. Zudem werden CAffe2, CNTK, PyTorch und Torch unterstützt. Dazu müssen Sie allerdings einen Docker-Container verwenden.

Mit SageMaker führt AWS auch das sogenannte „One-Click Training“ ein. Sie müssen einfach nur den S3-Datenspeicher bestimmen, der Ihre Daten enthält, und mit nur einem Klick können Sie mit SageMaker:

    • ein isoliertes Cluster erstellen

    • ein separates SDN zur Verfügung stellen

    • automatische Skalierung einrichten

    • EBS-Volumes einrichten

    • die Datenleitung einrichten

    • sofort den von Ihnen gewählten Schulungsalgorithmus ausführen.

Ziemlich beeindruckend! Und es kommt noch besser: Am Ende macht SageMaker alles wieder so, wie es zuvor war.

Erinnern Sie sich noch daran, dass ich über den Film Inception gesprochen habe? SageMaker führt auch eine so genannte „Hyperparameter-Optimierung“ durch. Dabei werden an Ihrem Modell automatisch während des Betriebs Einstellungen vorgenommen. Wie das funktioniert? SageMaker erstellt mehrere Kopien Ihres Modells und verbessert es dann durch maschinelles Lernen. Maschinelles Lernen innerhalb von maschinellem Lernen also – Inception lässt grüßen.

So erstellen Sie also Ihr Modell. Aber wie stellen Sie es bereit? SageMaker deckt auch diesen Schritt ab. Mit nur einem Klick können Sie Ihr Modell bereitstellen. Sobald Sie das Modell bereitgestellt haben, wird SageMaker:

    • die automatische Skalierung umsetzen

    • Sicherheits-Patches installieren

    • Zustandsprüfungen durchführen

    • Knoten skalieren

Und zu guter Letzt sei erwähnt, dass SageMaker modular ist. Sie können Ihr Modell also in SageMaker erstellen und schulen und dann in einer anderen Umgebung laufen lassen. Sie können Ihr Modell auch in einer anderen Umgebung erstellen und schulen und es über SageMaker laufen lassen.

DeepLens

Dies ist das ultimative Gadget für KI-Entwickler. DeepLens ist eine für das Deep Learning entwickelte Videokamera. Bei diesem Gerät ist Apache MXNet vorinstalliert. Dazu enthält es eine Bibliothek mit bereits vorab trainierten Modellen. Ach ja, und der Sagemaker-Dienst, von dem ich zuvor so geschwärmt habe? Er lässt sich direkt mit DeepLens verknüpfen.  So ist ein Einfaches, Ihre Modelle von Sagemaker an DeepLens zu übergeben.

Sollten Sie Aktionen automatisieren und DeepLens in Ihr allgemeines Anwendungskonzept programmieren wollen, unterstützt es auch die Verwendung von Lambda-Funktionen.

Aber verlassen Sie sich hierbei nicht allein auf meine Worte. Hier ist Andy Jassy, der es auf der AWS re:Invent vorstellt:

https://www.youtube.com/watch?time_continue=1&v=RhEVld4GwzU

In meinen Gedanken schwirrt dieses Gadget schon als das perfekte Vatertagsgeschenk herum (Schatz, liest du zufällig diesen Artikel ;) ?). Sie können es für 249 USD vorbestellen.

Rekoginition

Dieser ML-Dienst hat für seine Technologie die Auszeichnung „Am nächsten an einer Fernsehshow dran“ verdient. Dazu kommen wir gleich, doch zunächst legen wir die Grundlagen. Rekognition erkennt Gegenstände, Personen, Text, Szenen und Aktivitäten auf Fotos und in Videos.

Was das in der Praxis bedeutet? Gut, dass Sie fragen:

    • Gesichtserkennung und Analyse – erkennt eine Person auf einem Foto oder in einem Video. Außerdem werden Gesichtsausdrücke analysiert, um Sex-Szenen zu erkennen, festzustellen, ob die Person lacht oder die Stirn runzelt, ob sie die Augen offen hat, ob sie glücklich ist usw.

    • Person of Interest – Dieser Funktion verdankt Rekognition die Auszeichnung „Am nächsten an einer Fernsehserie dran“. Rekognition kann Personen innerhalb eines Videos erkennen, auch wenn sie aus dem Bildschirm verschwinden und zurückkommen. Es ist unglaublich, wie nah diese Technologie an eine meiner allerliebsten Fernsehserien herankommt: Person of Interest. Das ist bestens geeignet, um Daten von Überwachungskameras auszuwerten!

https://www.youtube.com/watch?v=WYDWSNMTauQ

    • Unsichere Inhalte – Videos und Bilder mit Inhalten, die nur für Erwachsene zugänglich sein sollten, sowie möglicherweise anstößige Inhalte können identifiziert werden.

    • Bild zu Text – Wie einleitend bereits erläutert, kann Rekognition Bilder von Texten in einen editierbaren Text umwandeln.

Lex

Für alle Alexa-Fans ist das der perfekte Dienst. Amazon Lex verleiht Entwicklern die Fähigkeiten von Alexa, einschließlich der Erkennungs- und Simulationsmöglichkeiten.

Eingangs habe ich bereits erwähnt, dass alle Plattform-Anbieter andere Stärken haben, je nachdem, aus welchem Bereich sie kommen. Alexa ist das perfekte Beispiel dafür. Seitdem Alexa auf den Markt gebracht wurde, haben bereits Hunderttausende, wenn nicht Millionen Nutzer darauf zugegriffen. Während dieser intensiven Nutzung wurde Alexa verbessert und geschult, um das gesprochene Wort noch besser zu erkennen und darauf entsprechend zu reagieren. Das verschafft Amazon natürlich einen Vorteil. Was bietet nun der Dienst Lex?

    • Stimme/Chatbots – Sie können mit LexStimme und Chatbots erstellen und die Ergebnisse auf Facebook Messenger, Slack, Kik und Twilio SMS nutzen.

    • Datenbankinformationen – Lex kann in Lambda eingebunden werden, sodass Sie Daten aus Ihren S3-Datenspeichern und -Datenbanken ziehen können, um auf Anfragen zu antworten.

    • Verkettung von Absichten – Lex kann komplexe Interaktionen umsetzen, bei denen mehrere Absichten miteinander verbunden werden können. Wenn jemand über einen Audio-Dienst einen Flug bucht, könnte er anschließend also zum Beispiel gefragt werden, ob er auch ein Hotel am Zielort reservieren möchte oder eine Restaurantempfehlung wünscht.

    • Telefonie – Lex wurde nicht nur für qualitativ hochwertigen Ton geschult, sondern auch für Ton in Telefonqualität. Sie können jetzt Ihr eigenes Sprachdialogsystem erstellen!

Wie kann Lex im AWS-Umfeld eingesetzt werden? Das folgende Diagram steht auf der Lex-Seite von AWS zur Verfügung und zeigt ein Beispiel. Hier finden Sie das Bild und weitere Beispiele.

[caption id="" align="alignnone" width="1116"]Auf diesem Bild sieht man, wie Amazon Lex für eine Business-Anwendung genutzt wird. Quelle: https://aws.amazon.com/lex/[/caption]

Comprehend

Wie bei Lex auch, nutzt Amazon für diesen Dienst einen Startvorteil: die eigenen Produktbeschreibungen und -bewertungen (vermutlich die größte verfügbare Sammlung). Comprehend identifiziert in Texten verschiedene Aspekte: Welche Sprache wurde verwendet? Welche Schlüsselsätze, Orte, Personen, Marken oder Veranstaltungen kommen vor? Außerdem führt Comprehend eine Stimmungserkennung durch und klassifiziert die Texte nach Thema.

Es gibt einige interessante Anwendungsfälle für Comprehend – z. B. Voice of the Customer (VOC). Hier können Sie Comprehend nutzen, um aus verschiedenen Textquellen (E-Mails, Anruftranskripte, soziale Medien etc.) Feedback zu Ihren Produkten oder Diensten zu ziehen. Ein anderes Beispiel wäre das Katalogisieren und anschließende Durchsuchen eines Wissensspeichers.https://www.youtube.com/watch?time_continue=1&v=hdXvVyVjPLg

Translate

Wie der Name schon vermuten lässt, bietet dieser Dienst Übersetzungen in Echtzeit. Derzeit ist Amazon Translate als Vorschau verfügbar. Es handelt sich also noch nicht um ein voll ausgereiftes Produkt, aber es lohnt sich dennoch, sich einen Moment damit zu befassen. Mit Amazone Translate können Sie nicht nur in Echtzeit übersetzen, sondern auch sogenannte Stapel-Übersetzung durchführen, sodass Ihr Netzwerk nicht durch Ihre Anwendungen lahmgelegt wird.

Transcribe

Ein weiterer Dienst, der hält was er verspricht: Transkription, also die Verarbeitung von Sprache zu Text. Derzeit wird dieser Dienst nur für Englisch und Spanisch angeboten. Er wurde entwickelt, um schlechten Telefonton zu verbessern. Ein guter Anwendungsfall ist somit die Transkription von Telefonaten. Sie können zu den bereits unterstützten Wörtern auch individuelle Terminologie hinzufügen. Künftig sollen auch mehrere Sprecher unterstützt werden.

Polly

Wenn sie ein Thema aus den letzten beiden Aufträgen aufnehmen, dann denken Sie vielleicht, dass es sich hier um einen Dienst handelt, der alles nachplappert. Fast. Genau genommen „plappert“ es eine Text-Datei als Audio-Datei nach. Sie können eine Textdatei einpflegen und sie wird in ein Standard-Audioformat umgewandelt. Ein Anwendungsfall könnte das Vorlesen von E-Mails für besonders beschäftigte Manager sein oder auch die Blog-„Lektüre“ im Auto auf dem Nachhauseweg.Das ist ein wirklich globaler Dienst, der in 24 Sprachen angeboten wird. Dabei stehen viele verschiedene Stimmen zur Auswahl, sodass Sie die Stimme wählen können, die Ihrem Ohr am meisten schmeichelt.

_______________________________________________________________________________________

Soweit mein Überblick über die aktuellsten AWS-Dienste.

Wie Sie sehen, gibt es unzählige Dienste, die Technikfans wie wir in unseren Apps nutzen können. Im nächsten Beitrag dieser Blogreihe werden wir uns den KI-Diensten von Google widmen. Bleiben sie also gespannt!

Sie wollen mehr über die Anwendungsfälle erfahren, in denen Sie KI in Aktion erleben können?

Melden Sie sich für unser eWeek-Webinar an, um alles über künstliche Intelligenz zu erfahren. Es ist auf Nachfrage verfügbar.

Wie wird Ihr Unternehmen ein Early Adopter von KI?

Chris Dunn

Director of Product Marketing