Recap zur AWS re:Invent: Amazon SageMaker


Matthias Kübert ist als Cloud Data Pioneer Teil der VINTIN Gruppe und beschäftigt sich intensiv mit allen Themen rund um Big Data, Machine Learning, KI und Cloud Data Management.
Auch in diesem Jahr hat AWS in Las Vegas auf der Re:Invent einige Neuerungen angekündigt und veröffentlicht. Vor allem im Bereich Machine Learning und Artificial Intelligence gab es da einige Interessante Features, die ich besonders interessant finde.
Die bisherigen Machine Learning Workloads wurden mit dem Dienst SageMaker erstellt, verwaltet und deployt. Dabei wurden alle Projekte auf eigenen Notebook Instanzen verwaltet und daran wurde in Jupyter Notebooks gearbeitet. Ein Problem stellte dabei neben einem eingeschränktem UI auch das Usermanagement und die Arbeit im Team dar. Modernes Arbeiten wie es im Softwaredevelopment üblich ist, ist damit nur bedingt möglich. Das möchte AWS mit der Veröffentlichung des Dienstes SageMaker Studio ändern.
Dieser Dienst bündelt bekannte Features von SageMaker in einer webbasierten Entwicklungsumgebung, die jedoch um noch viel weitere Features erweitert wurde. Zu denen später mehr, doch zuerst das Spannendste: Bisher wurden die Jupyter Notebooks in der Konsole oder über Command Line Interface angelegt und auf ihnen gearbeitet. Dabei gab es kein Usermanagement. SageMaker Studio hingegen stellt das Konzept vom Kopf auf die Füße und verwaltet die Notebooks auf denen gearbeitet wird in einer zentralen Userverwaltung, die das gemeinsame Arbeiten am Code vereinfacht. Die Preview Version dieses Dienstes kann ab sofort getestet werden, verfügbar ist SageMaker Studio jedoch bislang nur am Standort Ohio (Region: US-Ost).
Machine Learning Prozesse sind bekanntermaßen durchwoben von sehr viele repetitiven Aufgaben. Gerade wenn es darum geht anhand von kleiner Variation der Hyperparameter das bestmögliche Modell zu identifizieren, beginnt ein sehr träger und zäher Prozess. Die Verwaltung dieser Aufgaben und Visualisierung der Ergebnisse wird vom Dienst SageMaker Experiments übernommen. Es ist sehr einfach damit den Überblick zu behalten und das Modell mit der besten Performance herauszugreifen um Ihre Businessprozesse schnellstmöglich zu Ihrem Nutzen hin zu Optimieren. SageMaker Experiments ist bereits in allen Regionen in den SageMaker verfügbar ist ebenfalls verfügbar. Die Integration in das UI von SageMaker Studio ist jedoch nur in Ohio verfügbar.
Wenn Machine Learning Lösungen länger im Einsatz sind hat es manchmal den Anschein, dass es Ermüdungserscheinungen gibt. Dies liegt meistens daran, dass sich aufgrund eines gewissen Drifts in den aktuellen Daten die Datenqualität verändert hat. So weit, dass das alte Modell von diesen keine zufriedenstellenden Vorhersagen ableiten kann. Um diese Veränderungen möglichst frühzeitig zu erkennen, so dass diesem Problem rechtzeitig entgegengesteuert werden kann, hat AWS den Dienst SageMaker Model Monitor eingeführt. Die Endpunkte, die zum Generieren von Vorhersagen genutzt werden, können damit durchleuchtet werden und Metadaten über Performance im zeitlichen Verlauf betrachtet werden. Mit relativ wenig Aufwand können hiermit Mechanismen platziert werden um die Integrität der Machine Learning Anwendungen überwachen. Verfügbar ist dieser Dienst ebenfalls ab sofort in allen Regionen in denen SageMaker vorhanden ist.
Dies ist Teil 2 der AWS re:Invent 2019-Recaps. Teil 1 können Sie hier nachlesen..
Möchten Sie mehr über unseren Technologiepartner AWS erfahren? Wir beraten Sie umfassend und mit jahrelanger Erfahrung! Kontaktieren Sie uns jederzeit mit ihrem Anliegen!
Dieser Artikel beruht in Teilen auf folgender Quelle unseres Technologiepartners AWS: https://press.aboutamazon.com/news-releases/news-release-details/aws-announces-aws-data-exchange