Die Grenzen der Computervision und unserer eigenen

Die Grenzen der Computervision und unserer eigenen

Hast du jemals den Blick eines Pferdeschuhkrebses eingefangen? Möglicherweise hast du es ohne es zu merken getan – mit zehn Augen über ihre äußere Schale verstreut, sehen ihre Augen überhaupt nicht wie unsere aus. Chamäleons haben nur zwei Augen, können sie jedoch unabhängig voneinander bewegen, was den Eidechsen ermöglicht, zwischen binokularem und monokularem Sehen zu wechseln. Und Bienen können ultraviolettes Licht sehen, was ihnen hilft, Nektar zu finden. Diese verschiedenen Sehsysteme haben das gemeinsame Ziel, eine unendlich nuancierte Realität in nützliche Informationsfragmente zu filtern. Aber sie gehen dabei unterschiedlich vor und bieten einen Hinweis darauf, dass es keine einzigartige Lösung für das Sehen gibt.

Gabriel Kreiman, Professor für Augenheilkunde an der HMS am Boston Children’s Hospital, reflektiert oft über die Vielfalt der natürlichen Welt, während er einen anderen Ansatz zur Sichtfeinabstimmung entwickelt: Computer Vision mit künstlicher Intelligenz. “Man kann KI wie eine neue Spezies betrachten, manchmal mit neuen und kreativen Lösungen für Sehprobleme”, sagt er. KI-Tools können jetzt Autos steuern, Gesichter erkennen und medizinische Scans überprüfen und können nach einigen Maßstäben Menschen übertreffen. Doch während immer mehr visuelle Aufgaben an Computer ausgelagert werden, arbeiten Kreiman und andere Forscher daran, die Blindstellen der KI zu identifizieren, zu untersuchen, wie sehr wir der Computer Vision vertrauen können und wie sie mit unserer eigenen Vision vergleichbar ist.

Jeremy Wolfe, Professor für Augenheilkunde an der HMS und Radiologe sowie Direktor des Visual Attention Lab am Brigham and Women’s Hospital, betont, dass unsere Wahrnehmung auf visuellen und kognitiven Systemen beruht, die ihre eigenen Beschränkungen haben. Ein klassisches Beispiel für diese Beschränkungen war ein Experiment der Harvard-Universität von 1999 mit einem Gorilla – oder genauer gesagt einer Person in einem Gorillakostüm. Studienteilnehmer sahen ein Video einer Gruppe, die Bälle warf, und wurden gefragt, wie oft die Spieler in weißen Hemden den Ball warfen. Etwa 30 Sekunden später spazierte eine Person im Gorillakostüm über den Bildschirm. Die Hälfte der Teilnehmer nahm ihn überhaupt nicht wahr. Der Grund dafür liegt in der Aufmerksamkeit: Während wir uns auf eine Sache konzentrieren, neigen wir dazu, andere Dinge direkt vor unseren Augen zu übersehen.

Jeremy Wolfe hat seine Karriere damit verbracht, die Faktoren zu erforschen, die unsere Aufmerksamkeit von Offensichtlichem ablenken, einschließlich unserer Erwartungen, Ablenkungen und wie ungewöhnlich ein Objekt ist. Fehler sind im menschlichen Verhalten weit verbreitet und erscheinen oft im Nachhinein sehr offensichtlich. Wolfe interessiert sich besonders dafür, wie diese Kräfte Menschen beeinflussen, die darauf trainiert sind, Bilder zu untersuchen. In einer Studie baten Wolfe und Kollegen Radiologen, krebsartige Knötchen in fünf Sets von CT-Scans zu zählen, die jeweils aus einer Reihe von Einzelbildern der Lungen bestanden. Was die Forscher jedoch nicht teilten, war, dass sie im letzten Set ein Bild eines Gorillas auf die Lungenaufnahmen geklebt hatten. Erstaunlicherweise verpassten 83 Prozent der Radiologen den Gorilla, auch wenn die eye-tracking-Software zeigte, dass ihre Augen darauf gelandet waren, obwohl er ungefähr 48-mal größer war als die Knötchen, nach denen sie suchten.