CC-SAM: Erreichung einer überlegenen medizinischen Bildsegmentierung mit einem Dice Score von 85,20 und einer Hausdorff-Distanz von 27,10 unter Verwendung der Integration von Convolutional Neural Network (CNN) und ViT.

CC-SAM: Erreichung einer überlegenen medizinischen Bildsegmentierung mit einem Dice Score von 85,20 und einer Hausdorff-Distanz von 27,10 unter Verwendung der Integration von Convolutional Neural Network (CNN) und ViT.

Die Segmentierung medizinischer Bilder spielt eine wichtige Rolle im modernen Gesundheitswesen, indem sie sich darauf konzentriert, anatomische Strukturen innerhalb medizinischer Scans genau zu identifizieren und abzugrenzen. Dieser Prozess ist entscheidend für eine genaue Diagnose, die Planung von Behandlungen und die Überwachung verschiedener Krankheiten. Fortschritte im Bereich des Deep Learning haben die Genauigkeit und Effizienz der medizinischen Bildsegmentierung verbessert und sie zu einem unverzichtbaren Werkzeug in der klinischen Praxis gemacht. Deep Learning-Modelle haben dabei traditionelle Schwellenwert-, Cluster- und aktive Konturmodelle ersetzt.

Trotz der Fortschritte bei Deep Learning-Modellen bestehen weiterhin Herausforderungen bei der Segmentierung medizinischer Bilder mit geringem Kontrast, undeutlichen Grenzen und komplexen Morphologien. Diese Herausforderungen beeinträchtigen die Wirksamkeit der Segmentierungsmodelle und erfordern spezielle Anpassungen, um ihre Leistungsfähigkeit im Bereich der medizinischen Bildgebung zu verbessern. Genauigkeit und Zuverlässigkeit bei der Segmentierungsmethoden sind entscheidend, da Fehler zu falschen Diagnosen und Behandlungsplänen führen können, was sich negativ auf das Patientenergebnis auswirken kann. Daher ist die Verbesserung der Anpassungsfähigkeit von Segmentierungsmodellen, um die einzigartigen Merkmale von medizinischen Bildern zu bewältigen, ein wichtiger Forschungsschwerpunkt.

Aktuelle Methoden in der Segmentierung medizinischer Bilder umfassen verschiedene Deep Learning-Modelle wie U-Net und seine Erweiterungen, die vielversprechend für die Segmentierung medizinischer Bilder sind. Darüber hinaus wurden grundlegende Modelle wie das Segment Anything Model (SAM) für medizinische Zwecke angepasst. Diese Modelle erfordern jedoch häufig eine spezifische Feinabstimmung und Modifikationen, um den einzigartigen Herausforderungen von medizinischen Bildern zu begegnen. Der SAM hat Aufmerksamkeit erregt für seine Vielseitigkeit bei der Segmentierung verschiedener Objekte mit minimalem Benutzereingriff, jedoch lässt seine Leistung im medizinischen Bereich aufgrund der Notwendigkeit umfassender klinischer Annotationen und der inhärenten Unterschiede zwischen natürlichen und medizinischen Bildern nach.

Forscher der Universität Oxford haben CC-SAM eingeführt, ein fortschrittliches Modell, das auf SAMUS aufbaut, um die Segmentierung medizinischer Bilder zu verbessern. Dieses Modell integriert einen statischen Convolutional Neural Network (CNN)-Zweig und nutzt ein variational attention fusion Modul, um die Segmentierungsleistung zu verbessern. Durch die Integration eines CNN mit dem ViT-Encoder von SAM wollten die Forscher wichtige lokale räumliche Informationen erfassen, die für medizinische Bilder entscheidend sind und so die Genauigkeit und Effizienz des Modells verbessern.

CC-SAM kombiniert ein vorab trainiertes ResNet50 CNN mit SAMs ViT-Encoder. Die Integration erfolgt durch einen neuartigen variational attention fusion Mechanismus, der Merkmale aus beiden Branches fusioniert und so lokale räumliche Informationen entscheidend für medizinische Bilder erfasst. Adapter verfeinern die Darstellungen von Positionen und Merkmalen innerhalb des ViT-Zweigs und optimieren so die Leistung des Modells für Aufgaben in der medizinischen Bildgebung. Dieser Ansatz nutzt die Stärken von CNNs und Transformatoren und schafft ein hybrides Framework, das sich in der lokalen und globalen Merkmalsextraktion auszeichnet.

Das Modell zeigt eine überlegene Segmentierungsgenauigkeit in verschiedenen medizinischen Bildgebungsdatensätzen, darunter TN3K, BUSI, CAMUS-LV, CAMUS-MYO und CAMUS-LA. CC-SAM erzielt insbesondere höhere Dice-Scores und niedrigere Hausdorff-Distanzen, was auf seine Wirksamkeit bei der präzisen Segmentierung von medizinischen Bildern mit komplexen Strukturen hinweist. Zum Beispiel erreichte CC-SAM auf dem TN3K-Datensatz einen Dice-Wert von 85,20 und eine Hausdorff-Distanz von 27,10, während er auf dem BUSI-Datensatz einen Dice-Wert von 87,01 und eine Hausdorff-Distanz von 24,22 erzielte. Diese Ergebnisse unterstreichen die Robustheit und Zuverlässigkeit des Modells in verschiedenen medizinischen Bildgebungsanwendungen.