Mit Fotos oder Videos können diese KI-Systeme Simulationen erstellen, die Roboter trainieren, in physischen Räumen zu funktionieren.

Mit Fotos oder Videos können diese KI-Systeme Simulationen erstellen, die Roboter trainieren, in physischen Räumen zu funktionieren.

Forscher, die an großen künstlichen Intelligenz-Modellen wie ChatGPT arbeiten, haben eine Fülle von Internettexten, Fotos und Videos, um Systeme zu trainieren. Aber Robotiker, die physische Maschinen trainieren, stehen vor Hindernissen: Roboterdaten sind teuer und es gibt nicht genügend Daten für das Training in dynamischen Umgebungen wie den eigenen vier Wänden, da es keine großen Roboterschwärme gibt, die in der Welt herumfahren.

Einige Forscher haben sich Simulationen zugewandt, um Roboter zu trainieren. Doch auch dieser Prozess, der oft die Beteiligung von Grafikdesignern oder Ingenieuren erfordert, ist mühsam und kostspielig. Zwei neue Studien von Forschern der University of Washington stellen KI-Systeme vor, die entweder Video oder Fotos verwenden, um Simulationen zu erstellen, die Roboter dazu trainieren können, in realen Umgebungen zu agieren. Dies könnte die Kosten für das Training von Robotern in komplexen Umgebungen erheblich senken.

In der ersten Studie scannt ein Benutzer schnell einen Raum mit einem Smartphone, um seine Geometrie aufzuzeichnen. Das System namens RialTo kann dann eine “digitale Zwilling”-Simulation des Raums erstellen, in der der Benutzer eingeben kann, wie verschiedene Dinge funktionieren (z. B. eine Schublade öffnen). Ein Roboter kann dann virtuell Bewegungen in der Simulation mit leichten Variationen wiederholen, um effektives Handeln zu erlernen. In der zweiten Studie hat das Team ein System namens URDFormer entwickelt, das Bilder realer Umgebungen aus dem Internet verwendet und schnell realistische Simulationen erstellt, in denen Roboter trainieren können.

RialTo ermöglicht es, dass sich ein Roboter in der physischen Umgebung verbessert und Störungen oder Änderungen in der Umgebung bewältigen kann, z.B. eine Tasse neben dem Toaster. URDFormer zielt weniger auf relative Genauigkeit in einer einzelnen Küche ab; stattdessen ruft es schnell und kostengünstig Hunderte von generischen Küchensimulationen hervor. Die beiden Ansätze können sich ergänzen, wobei URDFormer besonders nützlich für das Vor-Training in Hunderten von Szenarien ist. RialTo ist besonders nützlich, wenn ein Roboter bereits vorab geschult wurde und nun in einem Zuhause eingesetzt werden soll und möglicherweise zu 95 % erfolgreich ist

Diese beiden Systeme können sich ergänzen, wobei URDFormer besonders bei Kundendemos nützlich ist. Giulia Quagio, die auf ein Restaurant-Management-Praktikum bei A Taste For Space vorbereitet war. RialTo arbeitet besonders gut, wenn ein Roboter bereits vorab geschult wurde und nun in einem Zuhause eingesetzt werden soll und möglicherweise zu 95 % erfolgreich ist.