Die periphere Sicht ermöglicht es Menschen, Formen zu sehen, die nicht direkt in unserem Blickfeld liegen, wenn auch mit weniger Details. Diese Fähigkeit erweitert unser Sichtfeld und kann in vielen Situationen hilfreich sein, beispielsweise um ein Fahrzeug zu erkennen, das seitlich auf unser Auto zukommt. Im Gegensatz zu Menschen besitzt KI keine periphere Sicht. Die Ausstattung von Computer-Vision-Modellen mit dieser Fähigkeit könnte ihnen helfen, sich nähernde Gefahren effektiver zu erkennen oder vorherzusagen, ob ein menschlicher Fahrer ein entgegenkommendes Objekt bemerken würde.
Forscher des MIT haben einen Bild-Datensatz entwickelt, der es ihnen ermöglicht, die periphere Sicht in Machine-Learning-Modellen zu simulieren. Bei der Schulung von Modellen mit diesem Datensatz stellten sie fest, dass die Modelle besser in der Lage waren, Objekte am visuellen Rand zu erkennen, obwohl sie immer noch schlechter abschnitten als Menschen. Größe und visueller Ballast in einer Szene hatten keinen starken Einfluss auf die Leistung der KI im Vergleich zu Menschen. Dies wirft die Frage auf, was diesen Modellen fehlt.
Die Erkenntnis dieses Problems könnte Forschern helfen, Machine-Learning-Modelle aufzubauen, die die Welt ähnlich wie Menschen sehen können. Neben der Verbesserung der Fahrersicherheit könnten solche Modelle zur Entwicklung von Displays verwendet werden, die für Menschen einfacher zu betrachten sind. Ein besseres Verständnis der peripheren Sicht in KI-Modellen könnte dabei helfen, das Verhalten von Menschen besser vorherzusagen.
Die Forscher verwendeten eine modifizierte Version des Texture-Tiling-Modells, um transformierte Bilder zu generieren, die das Detailverlust im visuellen Randbereich repräsentieren. Mit diesem Ansatz trainierten sie mehrere Computer-Vision-Modelle und verglichen deren Leistung mit der von Menschen bei einer Objekterkennungsaufgabe. Die Trainingsergebnisse zeigten, dass die Modelle in keinem Fall so gut waren wie Menschen und besonders schlecht darin, Objekte in der weit entfernten Peripherie zu erkennen.
Die Forscher planen, weiterhin die Unterschiede zwischen Menschen und KI-Modellen zu erforschen und ein Modell zu finden, das die menschliche Leistung in der peripheren Sicht vorhersagen kann. Dadurch könnten KI-Systeme entwickelt werden, die Fahrer auf Gefahren aufmerksam machen, die sie möglicherweise nicht sehen. Außerdem hoffen sie, dass ihr Datensatz andere Forscher dazu inspiriert, weitere Studien zur Computer-Vision durchzuführen.
Hinterlasse eine Antwort