Diese Studie erstellt einen Datensatz zur Detektion von Unterwasserbiologischen Zielen, der 2108 Bildaufnahmen von 15 verschiedenen aquatischen Arten umfasst. Der Datensatz wird für das Training von Modellen zur genauen Lokalisierung und Klassifizierung der biologischen Ziele verwendet. Die Unterwasserbilder werden von Unterwasserkameras aufgenommen und weisen unterschiedliche Probleme auf, die die Genauigkeit der Zielerkennung beeinträchtigen, wie z.B. ungleichmäßige Helligkeit, Farbaberrationen und Bildtrübung. Daher schlägt diese Studie ein Netzwerk zur Verbesserung der Unterwasserbilder vor, das die Bildqualität durch Weißabgleich, Helligkeitsanpassung und Farbkorrektur erhöht.
Darüber hinaus wird eine Datenvermehrungsmethode namens Copy-Pasting-Strategien vorgeschlagen, um das Training von Modellen zur Detektion kleiner Objekte zu verbessern. Dies ermöglicht, dass kleine Objekte auf den Bildern besser erkannt werden, ohne die Erkennung großer Objekte zu beeinträchtigen. Ferner wird eine adaptive Ankerfeldberechnung eingeführt, um die Komplexität des Modells zu reduzieren. Die Komplettierung erfolgt durch eine spezielle Netzwerkstruktur namens WBi-YOLOSF zur Detektion von Unterwasserzielen, die einen verbesserten BiFPN-Subnetzwerk und ein SimAM-Aufmerksamkeitsmodul enthält.
Abschließend wird der Artificial Rabbits Optimization (ARO) Algorithmus zur Optimierung der Netzwerkhyperparameter vorgestellt, um die Konvergenzgeschwindigkeit, Vorhersagegenauigkeit und Robustheit des Trainings zu verbessern. Mittels der Anpassung der Netzwerkhyperparameter anhand des ARO-Algorithmus wird die Leistung des Modells optimiert, was zu einer schnelleren Konvergenz und höheren Genauigkeit führt.
Hinterlasse eine Antwort