Computer Vision basiertes Ladungskasten-Anpassungssystem für zweidimensionale Förderplattform - Scientific Reports

Die Intel RealSense D435i Kamera ist über der Förderplattform montiert, um alle Frachtboxen zu erkennen und Feedback über deren Position und Winkel zu geben. Die Konfiguration der Hardware- und Softwareumgebung wird in Tabelle 1 gezeigt. Die Gesamtstruktur der Förderplattform wird in Abbildung 10 dargestellt. Die Mask R-CNN-Objekterkennung und die Verarbeitung von Maskendaten basieren auf zwei Schritten: RPN und Fast R-CNN. Es wird eine RoI-Pooling-Schicht eingeführt, um die Batch-Eingabe von RoI-Feature-Maps in den nachfolgenden R-CNN zu erleichtern. Mask R-CNN verwendet eine ROIAlign-Strategie für hohe Genauigkeit. Abbildung 11 zeigt die Struktur des Algorithmus.

Für die Erkennung von Position und Winkel der Frachtboxen verwendet Computer Vision die Deep-Learning-Techniken. Ein Datensatz von 300 RGB-Bildern wird aus dem Video, das die Bewegung der Frachtboxen auf der Förderplattform erfasst, extrahiert. Die Annotation des Datensatzes erfolgt mit dem Open-Source- und kostenlosen Anwendung Labelme. 80% des Datensatzes werden als Trainingssatz und 20% als Testdatensatz ausgewählt. Dieser Datensatz wird verwendet, um das Mask R-CNN Deep-Learning-Modell zu trainieren. Die Trainingsgenauigkeit liegt bei 99,48% nach 10 Trainingsschritten. Die Trainingsmodelle sind effektiv und geeignet für die Erkennung von Frachtboxen.

Mask R-CNN generiert ein Array von Resultaten für die Kandidatenregionen und bietet Informationen über Koordinaten und Maskendaten. Die Maskendaten werden individuell verarbeitet, um den Winkel der Frachtbox zu bestimmen. Der Rotating Calipers-Algorithmus wird verwendet, um das Minimum-Rechteck aus den Maskendaten zu bestimmen. Die Genauigkeit bei der Bestimmung des Winkels der Frachtbox wird durch den Trimmed Mean-Algorithmus verbessert. Die Ausrichtung des Rotationsrahmens mit den Bbox-Rechteckdaten erfolgt basierend auf den ermittelten Winkeln.

Die Daten zur Bewegungssteuerung basieren auf der Kombination von Bbox-Daten und den Rotationsrahmendaten. Eine Ausrichtung der beiden Daten wird erreicht, indem die Koordinaten des Mittelpunkts des Rotationsrahmens berechnet und mit den Bbox-Daten abgeglichen werden. Die Einstellung der Frachtboxposition erfolgt durch Differenzialsteuerung basierend auf den gegengesetzt rotierenden omnidirektionalen Rädern in den verschiedenen Teilbereichen der Bbox. Schließlich ermöglicht diese Methode eine präzise Justierung der Frachtbox.

Computer Vision basiertes Ladungskasten-Anpassungssystem für zweidimensionale Förderplattform – Scientific Reports

Zunehmender Einsatz von KI im Gesundheitswesen erfordert weltweite Nachhaltigkeitsinitiativen

Zunehmende Verbreitung künstlicher Intelligenz im indischen Gesundheitswesen

Zunehmende Beweise zeigen die Bedeutung von KI für das Gesundheitswesen

Zoom und Suki arbeiten zusammen, um KI-gestützte klinische Dokumentation bereitzustellen.

Eine umfassende Untersuchung der induktiven Verzerrungen, die hochgradige visuelle Repräsentationen in Gehirn und Maschinen formen

7 Computer Vision Projekte für alle Levels

Quanteninspirierte Techniken reduzieren die Latenz in der Computer Vision, ohne die Genauigkeit zu beeinträchtigen

Solink® stellt Produktverbesserungen vor, die zeigen, wozu Computer Vision bestimmt ist.

KI wird günstiger. Das wird nicht alles reparieren.

OSF HealthCare verordnet genAI-Training zur Schaffung einer KI-bereiten Belegschaft

Die Zukunft von ChatGPT: Wird es kostenlos bleiben?

Exklusiv: Serve Robotics Executive Interview mit EnerCom – Oil & Gas 360