Interview: QI Pan von Snap teilt mit, wie die Computer Vision in ein goldenes Zeitalter eintritt

Interview: QI Pan von Snap teilt mit, wie die Computer Vision in ein goldenes Zeitalter eintritt

Qi Pan ist Leiter der Visionstechnik bei Snap. Er verfügt über einen beeindruckenden Lebenslauf mit einem Abschluss erster Klasse von der University of Cambridge in Großbritannien sowie einem Doktortitel in Computervisionstechnik. Pan hat bereits mit Milliarden-Dollar-Marken wie Qualcomm zusammengearbeitet und wurde bereits als Student für die Visionstechnik fasziniert, insbesondere im Zusammenhang mit maschinellem Lernen und KI.

Für den Laien wird Computervision allgemein als eine Art digitaler Fotografie verstanden – im Grunde genommen sind es Gruppen von farbigen Punkten, die die Welt repräsentieren. Pan erklärt jedoch, dass der Computer eigentlich nichts in diesem Bild versteht. Die eigentliche Aufgabe der Computervision besteht darin, das Bild zu nehmen und dann dem Computer zu ermöglichen, die herauszufilternden Objekte zu verstehen. Aber das sei nur die erste Stufe.

Der Versand eines Bildes über die Cloud kann einige Sekunden dauern. Die Arbeit an Echtzeit-Computervision, die mit 30 Bildern pro Sekunde dargestellt wird, war zu Pans Anfangszeiten begrenzt. Eine Kombination aus Hardware-Entwicklung und der Möglichkeit, Computervision in der Cloud auszuführen, hat die Technologie weit verbreitet, mit Echtzeit-Zugriff auf Algorithmen und APIs, die sie skalierbar und erschwinglich machen.

Apple war das erste Unternehmen, das 2019 mit dem iPhone 11 Pro ein Gerät mit einem leichtmessenden (LIDAR) Sensor auf den Markt brachte. LIDAR-Technologie misst im Wesentlichen die Zeit, die das Licht benötigt, um ein Objekt zu erfassen, und kann so ein räumliches Verständnis von Objekten und ihrer Umgebung aufbauen. Snap wollte diese Funktion demokratisieren und nutzt maschinelles Lernen in der Computervision, das auf regulären Bildern basiert, um die Oberflächen von Objekten und deren Beziehung zueinander zu verstehen.

Pans Ziel bei Snap ist es, die Kamera intelligenter zu machen, um die reale Welt mit digitalen Inhalten zu überlagern. Mit steigender Nutzung der Augmented Reality (AR) wird die Technologie von Unternehmen und Verbrauchern gleichermaßen angenommen. Unternehmen wie Cartier nutzen sogar die Möglichkeiten der Computervisionstechnik, um die Qualität ihrer Produkte zu vermitteln. Mit fortschreitender Technologieentwicklung ergeben sich neue Ansätze für Marketing, Branding, Lernen und Entwicklung sowie für Unternehmenskommunikation und die Gestaltung des gebauten Umfelds. Es bestätigt die Bedeutung von ‘Spaß’ in dieser Mischung, da durch Computervision die Realität neu erfunden werden kann.