Durchführung von generativer KI-gestützter Datenaufbereitung und no-code ML über Daten beliebiger Größe mithilfe von Amazon SageMaker Canvas | Amazon Web Services

Durchführung von generativer KI-gestützter Datenaufbereitung und no-code ML über Daten beliebiger Größe mithilfe von Amazon SageMaker Canvas | Amazon Web Services

Amazon SageMaker Canvas ermöglicht es Unternehmen nun, das volle Potenzial ihrer Daten zu nutzen, indem sie die Unterstützung von Petabyte-Datensätzen ermöglicht. Mit über 50 Konnektoren, einem intuitiven Chat-Interface für die Datenvorbereitung und der Unterstützung von Petabytes bietet SageMaker Canvas eine skalierbare, Low-Code/No-Code ML-Lösung für realen Einsatz in Unternehmen. Früher war das Limit bei 5 GB, nun können Maschinenlern-Experimente auf Petabytes von Daten durchgeführt werden, was einen großen Fortschritt bedeutet.

Organisationen haben oft Schwierigkeiten, sinnvolle Erkenntnisse aus ihren ständig wachsenden Datenvolumen zu gewinnen. Es bedarf Expertise im Bereich Datenengineering, um Scripts und Pipelines zur Aufbereitung von Daten zu entwickeln, sowie zum Experimentieren mit verschiedenen Modellen und Hyperparametern. Zudem müssen komplexe Cluster verwaltet werden, um ML-Modelle über diese großen Datensätze zu verarbeiten. Mit SageMaker Canvas können nun Petabyte-Daten interaktiv vorbereitet, Modelle erstellt und ML-Experimente durchgeführt werden, ohne Code schreiben zu müssen.

Um Daten in SageMaker Canvas zu importieren, kann Amazon S3 mithilfe von Amazon SageMaker Data Wrangler verwendet werden. Es ist möglich, Datensätze vor dem Skalieren des Datenflusses vorzubereiten, um Zeit und Leistung zu verbessern. Es ist auch möglich, die Datenqualität mit einem Bericht zu überprüfen und eine Analyse durchzuführen. Die Chat-Funktion für die Datenaufbereitung in SageMaker Canvas ermöglicht eine einfache Datenbereitstellung mit natürlichen Sprachbefehlen.

Nachdem der Datensatz importiert wurde, kann die Datenqualität analysiert und verbessert werden. Mithilfe des Chat-Interfaces und der LCNC-Transformationsmöglichkeiten können Daten präpariert und aufbereitet werden. Anschließend kann ein Modell erstellt und Inferenzen ausgeführt werden. Der Export der Daten in Amazon S3 mit einem EMR Serverless-Job ist ebenfalls möglich. SageMaker Canvas ermöglicht die Erstellung und Analyse von Modellen sowie die Ausführung von Batch-Vorhersagen auf generierte Daten. Es bietet eine benutzerfreundliche ML-Lösung für Unternehmen aller Größenordnungen.