Neue Forschungen zeigen, dass selbst subtile Änderungen an digitalen Bildern, die darauf abzielen, Computersysteme zur Bilderkennung zu verwirren, auch die menschliche Wahrnehmung beeinflussen können. Computer und Menschen sehen die Welt auf unterschiedliche Weise. Unsere biologischen Systeme und die künstlichen Systeme in Maschinen achten möglicherweise nicht immer auf dieselben visuellen Signale. Neuronale Netze, die darauf trainiert sind, Bilder zu klassifizieren, können vollständig durch subtile Veränderungen an einem Bild irregeführt werden, die ein Mensch nicht einmal bemerken würde. Dass KI-Systeme von solchen adversen Bildern getäuscht werden können, weist möglicherweise auf einen grundlegenden Unterschied zwischen menschlicher und maschineller Wahrnehmung hin, was uns jedoch dazu veranlasst hat zu untersuchen, ob auch Menschen – unter kontrollierten Testbedingungen – Sensibilität für dieselben Störungen aufweisen könnten.
Ein adverses Bild ist eines, das subtil durch ein Verfahren verändert wurde, das dazu führt, dass ein KI-Modell den Inhalt des Bildes fälschlicherweise klassifiziert. Dieser absichtliche Betrug wird als adversiver Angriff bezeichnet. Angriffe können darauf abzielen, ein KI-Modell dazu zu bringen, eine Vase als Katze zu klassifizieren, oder darauf ausgelegt sein, dass das Modell alles außer einer Vase sieht. Solche Angriffe können subtil sein und sogar dann wirksam sein, wenn kein Pixel in einem RGB-Bild um mehr als 2 Stufen auf dieser Skala von 0-255 moduliert wird.
Vorherige Forschungen haben gezeigt, dass Menschen empfindlich auf großangelegte Bildstörungen reagieren, die klare Formhinweise liefern. Weniger bekannt ist jedoch die Wirkung subtilerer adverser Angriffe. Um dies herauszufinden, führten wir kontrollierte Verhaltensexperimente durch. Unsere Arbeit zeigt, dass obwohl die menschliche Wahrnehmung nicht so anfällig für adversiale Störungen ist wie die maschinelle Wahrnehmung (Maschinen identifizieren die Originalbildklasse nicht mehr, Menschen jedoch sehen sie weiterhin klar), diese Störungen Menschen dennoch in Richtung der Entscheidungen von Maschinen beeinflussen können. Unsere Erkenntnisse können zukünftige Forschungen informieren, die darauf abzielen, die Robustheit von Computer-Vision-Modellen zu verbessern, indem sie sie besser mit menschlichen visuellen Repräsentationen in Einklang bringen. Unsere Arbeit zeigt auch den Bedarf an weiteren Forschungen, um die breiteren Auswirkungen von Technologien nicht nur auf Maschinen, sondern auch auf Menschen zu verstehen. Dies unterstreicht die weiterhin wichtige Rolle der Kognitionswissenschaft und der Neurowissenschaften, um KI-Systeme und deren potenzielle Auswirkungen besser zu verstehen, während wir uns darauf konzentrieren, sicherere und sicherere Systeme aufzubauen.
Hinterlasse eine Antwort