Ein Team des MIT hat Tests vorgeschlagen, um die Sehfähigkeiten von Sprachmodellen zu überprüfen. Dies beinhaltet die Fähigkeit, Codes für komplexe visuelle Konzepte zu schreiben, visuelle Konzepte aus Code zu erkennen und Rendering-Codes mit reinem Text-Feedback zu korrigieren. Die Forscher ...

Forscher, die an großen künstlichen Intelligenz-Modellen wie ChatGPT arbeiten, haben eine Fülle von Internettexten, Fotos und Videos, um Systeme zu trainieren. Aber Robotiker, die physische Maschinen trainieren, stehen vor Hindernissen: Roboterdaten sind teuer und es gibt nicht genügend Daten für ...