Kinder visuelle Erfahrung könnte der Schlüssel zu besserem Training für Computer Vision sein.

Kinder visuelle Erfahrung könnte der Schlüssel zu besserem Training für Computer Vision sein.

Der Einfluss der Position auf das Erscheinungsbild, die Beleuchtung und den Kamerabstand/Brennweite eines Bildes wird in einer interdisziplinären Studie des Forschungsteams an der Penn State untersucht. Durch die Verwendung einer neuen, an der Entwicklung von Kindern inspirierten Methode zur Schulung künstlicher Intelligenz (KI) könnten fortschrittlichere KI-Systeme entwickelt werden, um extreme Umgebungen oder ferne Welten zu erforschen. Die Forscher stellten fest, dass KI-Modelle, die mit der neuen Methode trainiert wurden, die Basismodelle um bis zu 14,99% übertroffen haben.

Die Forscher entwickelten einen neuen Kontrastlernalgorithmus, um KI-Systeme effizienter zu trainieren, indem sie Informationen über den räumlichen Standort nutzen. Diese Methode verwendet selbstüberwachtes Lernen, bei dem ein KI-System visuelle Muster erkennt, um positive Paare zu identifizieren. Um Umweltdaten einzubeziehen, einschließlich des Standorts, überwindet das KI-System Herausforderungen hinsichtlich Änderungen in Kameraposition, Beleuchtungswinkel, Brennweite oder Zoom.

Die Forscher vermuten, dass die visuelle Entwicklung von Säuglingen von der Standortwahrnehmung abhängt. Sie haben virtuelle Umgebungen mit räumlichen Informationen aufgebaut, um festzustellen, wie Kinder die Welt wahrnehmen. Die Modelle, die mit ihrem Algorithmus trainiert wurden, schnitten bei verschiedenen Aufgaben besser ab und erzielten Verbesserungen von bis zu 14,99%. Diese neuen Datensätze stehen anderen Wissenschaftlern zur Verfügung, die sie für das Training nutzen möchten.

Die Forschungsergebnisse haben Auswirkungen auf die Entwicklung fortschrittlicher KI-Systeme, die für die Navigation und das Lernen in neuen Umgebungen bestimmt sind. Dieser Ansatz kann in Situationen, in denen autonome Roboter mit begrenzten Ressourcen lernen müssen, von Vorteil sein. Zukünftig planen die Wissenschaftler, ihr Modell zu verbessern, um räumliche Informationen besser zu nutzen und vielfältigere Umgebungen einzubeziehen. Die Zusammenarbeit mit anderen Abteilungen der Penn State, wie Psychologie und Informatik, trug zum Erfolg dieser Studie bei.