AWS kündigt allgemeine Verfügbarkeit von Amazon DevOps Guru an

AWS kündigt allgemeine Verfügbarkeit von Amazon DevOps Guru an
Lesedauer: 5 Minuten.

Unser Technologiepartner AWS hat die allgemeine Verfügbarkeit von Amazon DevOps Guru angekündigt, einem vollständig verwalteten Betriebsservice, der maschinelles Lernen einsetzt, um Entwicklern die Verbesserung der Anwendungsverfügbarkeit zu erleichtern, indem er automatisch Betriebsprobleme erkennt und spezifische Maßnahmen zur Behebung empfiehlt.

Amazon DevOps Guru basiert auf jahrelanger Erfahrung mit Amazon.com- und AWS-Betriebsexzellenz und wendet maschinelles Lernen an, um Daten wie Anwendungsmetriken, Protokolle, Ereignisse und Spuren automatisch auf Verhaltensweisen zu analysieren, die von normalen Betriebsmustern abweichen. Wenn Amazon DevOps Guru ein anomales Anwendungsverhalten identifiziert, das potenzielle Ausfälle oder Serviceunterbrechungen verursachen könnte, werden Entwickler mit Problemdetails benachrichtigt, damit sie die potenziellen Auswirkungen und wahrscheinlichen Ursachen des Problems schnell verstehen können. Entwickler können die Abhilfemaßnahmen von Amazon DevOps Guru nutzen, um die Zeit bis zur Lösung von Problemen zu verkürzen und die Anwendungsverfügbarkeit zu verbessern – und das alles ohne manuelle Einrichtung oder Fachwissen über maschinelles Lernen. Mit Amazon DevOps Guru gibt es keine Vorabkosten oder Verpflichtungen, und Kunden zahlen nur für die Daten, die Amazon DevOps Guru analysiert. Um mit Amazon DevOps Guru zu beginnen, besuchen Sie: aws.amazon.com/devops-guru

Da immer mehr Unternehmen auf Cloud-basierte Anwendungsbereitstellung und Microservice-Architekturen umsteigen, um ihr Geschäft zu skalieren, werden Anwendungen zunehmend verteilt und Entwickler benötigen mehr automatisierte Verfahren, um die Anwendungsverfügbarkeit aufrechtzuerhalten und den Zeit- und Arbeitsaufwand für das Erkennen, Debuggen und Beheben von Betriebsproblemen zu reduzieren. Anwendungsausfälle, die durch fehlerhaften Code oder Konfigurationsänderungen, unausgewogene Container-Cluster oder die Erschöpfung von Ressourcen (z. B. CPU, Speicher, Festplatte usw.) verursacht werden, führen unweigerlich zu schlechten Kundenerfahrungen und Umsatzeinbußen. Unternehmen investieren eine beträchtliche Menge an Entwicklerressourcen, Zeit und Geld, um mehrere Überwachungs-Tools zu implementieren, die oft separat verwaltet werden, und müssen dann benutzerdefinierte Warnmeldungen für häufige Probleme wie Spitzen bei Load-Balancer-Fehlern oder Einbrüche bei den Anforderungsraten von Anwendungen entwickeln und pflegen. Die Festlegung von Schwellenwerten zur Erkennung und Alarmierung bei abnormalem Verhalten von Anwendungsressourcen ist schwierig, erfordert eine manuelle Einrichtung und erfordert Schwellenwerte, die ständig aktualisiert werden müssen, wenn sich die Anwendungsnutzung ändert (z. B. eine ungewöhnlich hohe Anzahl von Anfragen während einer Verkaufsaktion). Wenn ein Schwellenwert zu hoch eingestellt ist, sehen die Entwickler keine Alarme, bis die betriebliche Leistung stark beeinträchtigt wird. Wenn ein Schwellenwert zu niedrig eingestellt ist, erhalten Entwickler zu viele Fehlalarme, die sie gerne ignorieren. Selbst wenn Entwickler auf ein potenzielles betriebliches Problem aufmerksam gemacht werden, kann sich die Identifizierung der Grundursache als schwierig erweisen. Mit den vorhandenen Tools haben Entwickler oft Schwierigkeiten, die Grundursache eines Betriebsproblems anhand von Diagrammen und Alarmen zu triangulieren, und selbst wenn sie in der Lage sind, die Grundursache zu finden, haben sie oft nicht die richtigen Informationen, um sie zu beheben. Jeder Fehlerbehebungsversuch ist ein Kaltstart, bei dem die Teams Stunden oder Tage mit der Identifizierung von Problemen verbringen müssen. Dies führt zu zeitraubender, mühsamer Arbeit, die die Zeit zur Behebung eines Betriebsfehlers verlangsamt und Anwendungsunterbrechungen verlängern kann.

Die maschinellen Lernmodelle von Amazon DevOps Guru nutzen über 20 Jahre Betriebserfahrung bei der Erstellung, Skalierung und Wartung hochverfügbarer Anwendungen für Amazon.com. Dadurch ist Amazon DevOps Guru in der Lage, Betriebsprobleme automatisch zu erkennen (z. B. fehlende oder falsch konfigurierte Alarme, Frühwarnung vor Ressourcenerschöpfung, Konfigurationsänderungen, die zu Ausfällen führen könnten usw.), Kontext zu den betroffenen Ressourcen und zugehörigen Ereignissen zu liefern und Abhilfemaßnahmen zu empfehlen. Mit nur wenigen Klicks in der Amazon DevOps Guru-Konsole werden historische Anwendungs- und Infrastrukturmetriken wie Latenz, Fehlerraten und Anforderungsraten für Ressourcen automatisch von den AWS-Anwendungen eines Benutzers aufgenommen und analysiert, um normale Betriebsgrenzen festzulegen. Amazon DevOps Guru verwendet dann ein vorab trainiertes maschinelles Lernmodell, um Abweichungen von dieser festgelegten Basislinie zu identifizieren (z. B. zu wenig bereitgestellte Rechenkapazität, Datenbank-E/A-Auslastung, Speicherlecks usw.). Wenn Amazon DevOps Guru System- und Anwendungsdaten analysiert, um automatisch Anomalien zu erkennen, gruppiert es diese Daten auch in betriebliche Einblicke, die anomale Metriken, Visualisierungen des Anwendungsverhaltens im Laufe der Zeit und Empfehlungen für Maßnahmen zur Behebung umfassen – alles einfach in der Amazon DevOps Guru-Konsole einsehbar. Amazon DevOps Guru korreliert und gruppiert auch verwandte Anwendungs- und Infrastrukturmetriken (z. B. Latenzspitzen bei Webanwendungen, zu wenig Festplattenspeicher, fehlerhafte Codebereitstellungen usw.), um redundante Alarme zu reduzieren und die Benutzer auf Probleme mit hohem Schweregrad zu konzentrieren. Kunden können Konfigurationsänderungshistorien und Bereitstellungsereignisse zusammen mit System- und Benutzeraktivitäten einsehen, um über ein Dashboard in der Amazon DevOps Guru-Konsole eine priorisierte Liste der wahrscheinlichen Ursachen für ein Betriebsproblem zu erstellen. Um Kunden bei der schnellen Behebung von Problemen zu unterstützen, bietet Amazon DevOps Guru intelligente Empfehlungen mit Abhilfeschritten und integriert sich in AWS Systems Manager für Runbook- und Kollaborationstools, wodurch Kunden die Möglichkeit erhalten, Anwendungen effektiver zu warten und die Infrastruktur für ihre Bereitstellungen zu verwalten. Wenn beispielsweise eine Analyseanwendung, die Amazon Relational Database Service (RDS) verwendet, anfängt, verschlechterte Latenzen aufzuweisen, erkennt Amazon DevOps Guru die Veränderung, indem es automatisch die relevanten Metriken im gesamten Anwendungsstapel analysiert, die zugrunde liegende Ursache identifiziert (z. B. eine erhöhte Anzahl gleichzeitiger Recheninstanzen, die auf RDS schreiben) und eine Empfehlung zur Behebung des Problems ausspricht (z. B. die bereitgestellte RDS-Kapazität und den IOPS-Speicher erhöhen, um die höhere Last zu bewältigen).

„Kunden fragen AWS immer wieder nach weiteren Services, mit denen sie unsere jahrzehntelange operative Exzellenz bei der Verbesserung der Anwendungsverfügbarkeit auf Amazon.com nutzen können“, sagt Swami Sivasubramanian, Vice President, Amazon Machine Learning, AWS. „Mit Amazon DevOps Guru haben wir dieses Fachwissen genutzt und spezielle Modelle für maschinelles Lernen entwickelt, um Betriebsprobleme zu erkennen, zu beheben und zu verhindern, lange bevor sie sich auf die Kunden auswirken und ohne sich jedes Mal mit Kaltstarts zu beschäftigen, wenn ein Problem auftritt. Amazon DevOps Guru bietet Kunden sofort die Vorteile der betrieblichen Best Practices, die wir beim Betrieb von Amazon.com gelernt haben, und wir haben Amazon DevOps Guru so einfach gestaltet, dass das Einschalten für jeden AWS-Kunden eine leichte Entscheidung ist.“

Mit ein paar Klicks in der AWS Management Console können Kunden Amazon DevOps Guru aktivieren, um innerhalb weniger Minuten mit der Analyse von Konto- und Anwendungsaktivitäten zu beginnen und so betriebliche Einblicke zu erhalten. Mit Amazon DevOps Guru können Kunden ihre Betriebsdaten in einer einzigen Konsole visualisieren, indem sie relevante Daten aus mehreren Quellen (z. B. AWS CloudTrail, Amazon CloudWatch, AWS Config, AWS CloudFormation, AWS X-Ray) zusammenfassen, und müssen nicht mehr zwischen mehreren Tools wechseln. Kunden können außerdem korrelierte Betriebsereignisse und kontextbezogene Daten für betriebliche Einblicke innerhalb der Amazon DevOps Guru-Konsole anzeigen und Warnmeldungen über Amazon SNS erhalten. Darüber hinaus unterstützt Amazon DevOps Guru API-Endpunkte über das AWS SDK, so dass Amazon Partner Network Partner und Kunden Amazon DevOps Guru einfach in ihre bestehenden Lösungen für Ticketing, Paging und automatische Benachrichtigung von Technikern bei Problemen mit hohem Schweregrad integrieren können. PagerDuty und Atlassian gehören zu den AWS-Partnern, die Amazon DevOps Guru in ihre Betriebsüberwachungs- und Incident-Management-Plattformen integriert haben. Kunden, die deren Lösungen nutzen, können nun von den betrieblichen Einblicken profitieren, die Amazon DevOps Guru bietet. Amazon DevOps Guru ist ab heute in den Regionen USA Ost (N. Virginia), USA Ost (Ohio) und USA West (Oregon), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Irland) und Europa (Stockholm) verfügbar.

 

Möchten Sie mehr über unseren Technologiepartner AWS erfahren? Wir beraten Sie umfassend und mit jahrelanger Erfahrung! Kontaktieren Sie uns jederzeit mit ihrem Anliegen!

 

Dieser Artikel beruht in Teilen auf einer Meldung unseres Technologiepartners AWS: https://press.aboutamazon.com/news-releases/news-release-details/aws-announces-general-availability-amazon-devops-guru

Ihr Ansprechpartner bei VINTIN

Christoph Waschkau

Mitglied der VINTIN Geschäftsführung

+49 (0)9721 67594 10

kontakt@vintin.de

Abonnieren Sie die Beiträge unseres VINTIN IT-Journals! In Zukunft werden Sie bei neuen Inhalten per Email kurz und bündig informiert.

Abonnieren Sie die Beiträge unseres VINTIN IT-Journals! In Zukunft werden Sie bei neuen Inhalten per Email kurz und bündig informiert.