Radiologen sind bekannt dafür, dass sie komische Kuriositäten übersehen, die in medizinischen Bildern platziert sind. In einer Studie aus dem Jahr 2013 haben 83% der Radiologen berühmt einen Mann in einem Affenkostüm übersehen, der aus einem Lungen-Scan winkt. Der Fake-Affe war 48 Mal größer als die Knötchen, die die Ärzte inspizieren sollten. Schlimmer noch, die Eye-Tracking-Software zeigte, dass die meisten Überseher ihren Blick genau auf die Stelle gerichtet hatten, an der sich die Figur befand. Ein Autor im Harvard Medicine Magazine erzählt die Anekdote nicht, um die Radiologie wieder zu beschämen, sondern um das Konzept und die Prinzipien der Computer Vision für ein allgemeines Publikum zu erklären.
Um dies zu tun, bietet sie zunächst eine Rechtfertigung für die Existenz der Technologie an: „Inattentional Blindness“, die bei Menschen weit verbreitet ist. Wo ließe sich der potenzielle Schaden dieser Bedingung besser erkunden als in der Radiologie? „Studien legen nahe, dass sich die Fehlerquoten in der Radiologie, die bei allen Bildern etwa 4% und bei auffälligen Bildern bis zu 30% liegen, seit den 1940er Jahren kaum verändert haben“, merkt die Autorin Molly McDonough an, unter Berufung auf eine Studie von 2016. „Medizinische Bildgebung ist daher einer der Bereiche, in denen Computer Vision als Möglichkeit angepriesen wird, Fehlerquoten durch das Erkennen von Hinweisen zu reduzieren, die Menschen übersehen oder sogar irgendwann die Arbeit alleine zu erledigen.“
Als Computer Vision auf generative KI traf, wurde Computer Vision als Teil der KI definiert, der sich auf stille und bewegte Bilder konzentriert. Da die generative KI in den letzten anderthalb Jahren explosionsartig an Bedeutung gewonnen hat, hat sie sich mit Computer Vision verbunden, um Algorithmen die Erstellung neuer Bilder und Videos aus Text, Bildern oder beidem zu ermöglichen. Ein Problem bei der Entwicklung der Technologie als Bildinterpretator: KI kann genauso wie Menschen blinde Flecken haben. Das Problem lässt sich jedoch nicht auf Müdigkeit, Augenbelastung, Wiederholung oder andere Beiträge zur Inattentional Blindness zurückführen. Vielmehr liegt die Herausforderung darin, Algorithmen perfekt auf optische Ziele zu fixieren, in der extremen Komplexität begraben, die es erfordert, eine Maschine zu trainieren, wie Menschen sehen. Der Schwierigkeitsgrad ist leicht zu schätzen, wenn man bedenkt, dass die Netzhaut Teil des Gehirns, des Rückenmarks und somit des gesamten Rückenmarks ist.
Hinterlasse eine Antwort