Einfache Objekterkennung mit Yolo-NAS

Einfache Objekterkennung mit Yolo-NAS

YOLO (You only look once) hat die Computer Vision Arena revolutioniert. Die erste Version von YOLO wurde 2016 von Joseph Redmon et. al veröffentlicht und hat in Bezug auf Geschwindigkeit und Genauigkeit Benchmarks gesetzt. In Bezug auf die Objekterkennung ist YOLO ein Favorit von Data Scientists und Machine Learning-Ingenieuren und das bevorzugte Modell, wenn es darum geht, Entitäten in Bildern zu segmentieren.

Seit der Einführung von YOLO gab es viele neue Iterationen, die verschiedene Schwachstellen früherer Versionen verbessert haben, einschließlich: Verbesserte Architektur der zugrunde liegenden Deep Learning-Modelle, Implementierung von Alternativen zur Leistungssteigerung, wie z.B. Datenaugmentationstechniken, Migration des ursprünglichen YOLO-Codes zur Verwendung von PyTorch-Trainings- und Bereitstellungs-Frameworks, Verbesserung der Detektionsmechanismen für kleine Objekte. Die letzte Version von YOLO ist YOLO v9.

Es ist wichtig zu beachten, dass jedes Computer Vision- und Objekterkennungsmodell anhand von zwei Parametern bewertet wird: Genauigkeit (definiert durch Metriken im Zusammenhang mit der Computer Vision-Segmentierung) und Geschwindigkeit (definiert durch Latenz bei der Inferenz). Ein Beispiel dafür, wie CV-Algorithmen bewertet werden, ist unten dargestellt.