Forscher auf dem Gebiet der Computer Vision entwickeln bilaterales Referenzrahmen für die hochauflösende dichotome Bildsegmentierung

Ein Forschungsteam hat eine Computer Vision-Technik entwickelt, die dichotome Bildsegmentierung, hochauflösende Saliency-Objekterkennung und verdeckte Objekterkennung im selben Framework durchführen kann. Ihr neuartiges bilaterales Referenzframework (BiRefNet) kann winzige Pixelmerkmale erfassen und hat Potenzial für eine Vielzahl praktischer Anwendungen in der Computer Vision.

Die Arbeit wurde im Journal CAAI Artificial Intelligence Research veröffentlicht. In der Computer-Vision-Forschung beinhaltet die Bildsegmentierungstechnologie das Aufteilen digitaler Bilder in sinnvolle Teile, um die Analyse zu erleichtern. Mit fortschreitender hochauflösender Bildaufnahme sind Wissenschaftler nun in der Lage, eine sehr präzise Objektsegmentierung zu erreichen. Diese Technologie wird als hochauflösende dichotome Bildsegmentierung (DIS) bezeichnet und wird von Unternehmen wie Samsung, Adobe und Disney verwendet.

Aktuelle Strategien der DIS reichen jedoch nicht aus, um die feinsten Merkmale zu erfassen. Um diese Herausforderungen in der hochauflösenden DIS zu bewältigen, hat das Forschungsteam ein bilaterales Referenzmodul entwickelt. Mit ihrem BiRefNet haben sie eine hochpräzise hochauflösende DIS realisiert und damit ein aktuelles offen zugängliches Modell für die Extraktion von Vordergrundobjekten geschaffen.

Ihr neuartiges progressiv bilaterales Referenznetzwerk BiRefNet handhabt die hochauflösende DIS-Aufgabe mit separaten Lokalisierungs- und Rekonstruktionsmodulen. Statt die Originalbilder in niedrig aufgelöste Versionen zu verkleinern, um die Konsistenz mit den Decodierungsmerkmalen sicherzustellen, behielten sie die Originalauflösung bei, um Details integral zu erhalten. BiRefNet bietet eine einfache, aber starke Basis, die hochwertige DIS durchführt.

BiRefNet hat bereits viele nützliche Anwendungen aufgrund seiner extrem genauen Segmentierungsergebnisse. Es kann zum Beispiel Risse in Wänden finden, helfen, sie zu überwachen und festzustellen, wann Reparaturen notwendig sind. Es ermöglicht auch eine hochgenaue Extraktion von Objekten mit feinen Gittern und dichten Löchern. BiRefNet wird in der Computer-Vision-Community weit verbreitet genutzt und wird in verschiedene Systeme integriert, um die Bildsynthese zu verbessern und verschiedene Segmentationen durchzuführen. Die Forscher planen, BiRefNet auf weitere Aufgaben auszudehnen und eine leichtgewichtige Architektur zu entwickeln, um schnellere Inferenz auf hochauflösenden Bildern zu ermöglichen.

Forscher auf dem Gebiet der Computer Vision entwickeln bilaterales Referenzrahmen für die hochauflösende dichotome Bildsegmentierung

Zunehmender Einsatz von KI im Gesundheitswesen erfordert weltweite Nachhaltigkeitsinitiativen

Zunehmende Verbreitung künstlicher Intelligenz im indischen Gesundheitswesen

Zunehmende Beweise zeigen die Bedeutung von KI für das Gesundheitswesen

Zoom und Suki arbeiten zusammen, um KI-gestützte klinische Dokumentation bereitzustellen.

Eine umfassende Untersuchung der induktiven Verzerrungen, die hochgradige visuelle Repräsentationen in Gehirn und Maschinen formen

7 Computer Vision Projekte für alle Levels

Quanteninspirierte Techniken reduzieren die Latenz in der Computer Vision, ohne die Genauigkeit zu beeinträchtigen

Solink® stellt Produktverbesserungen vor, die zeigen, wozu Computer Vision bestimmt ist.

KI-Herausforderung für den Englischunterricht im Rampenlicht

Automatisierte Deep-Learning-basierte Bewertung der Knochenmineraldichte für opportunistisches Osteoporose-Screening mit verschiedenen CT-Protokollen und Multi-Anbieter-Scannern – Wissenschaftliche Berichte

Die Zukunft von ChatGPT: Wird es kostenlos bleiben?

Exklusiv: Serve Robotics Executive Interview mit EnerCom – Oil & Gas 360