Die Studie wurde in drei Phasen durchgeführt. In der ersten Phase wurden die Einschlusskriterien für die Datensammlung definiert und die Daten aus den klinischen Systemen exportiert. In der zweiten Phase wurden vier verschiedene Modelle auf Basis einer U-Net-Architektur über mehrere Trainingsepochen trainiert. In der dritten Phase wurden die Ergebnisse aller Modelle unter Verwendung eines Testdatensatzes ausgewertet und mit dem Ground-Truth-Datensatz beider Evaluatoren verglichen. Im Flussdiagramm des gesamten Studiendesigns kann eine Übersicht über den Ablauf der Studie gefunden werden.
Die Patientenauswahl und das Studiendesign umfassten 50 gesunde Teilnehmer und 75 Patienten, die eine klinisch indizierte CMR bei 1,5 T zwischen 2020 und 2022 an unserer Einrichtung durchliefen. Alle MRT-Untersuchungen wurden auf einem 1,5-T-MRT-Gerät durchgeführt. Die Datensammlung erfolgte durch Extraktion von Bildern aus klinischen Systemen und manuelle Segmentierung durch zwei Bewertende. Die Daten wurden in Trainings-, Validierungs- und Testdatensätze aufgeteilt.
Die manuelle Segmentierung der Bilddaten wurde unabhhängig von zwei erfahrenen Bewertern durchgeführt. Zur Vorverarbeitung der Bilder wurde eine U-Net-Architektur zur automatischen Segmentierung verwendet. Convolutional Layers wurden sowohl im Encoder- als auch im Decoder-Teil verwendet, gefolgt von Aktivierungsfunktionen. Das Training der Modelle erfolgte auf einem Workstation mit verschiedenen optimierten Parametern und Metriken zur Evaluation der Performance.
Die Tests und die Leistungsbewertung erfolgten durch die Berechnung der mittleren T1-Zeiten der ROI für alle trainierten Modelle mit Hilfe eines unabhängigen Validierungsdatensatzes. Die Modelle wurden anhand von Metriken wie DSC (Sørensen-Dice-Koeffizient) und IOU (Intersection over Union) bewertet. Der beste Model wurde durch Minimierung des Fehlers in der T1-Zeitquantifizierung und Maximierung der Segmentierungsgenauigkeit ausgewählt. Zur statistischen Analyse wurden Methoden wie die Bland-Altman-Analyse und der Mann-Whitney-U-Test zur Vergleich zwischen menschlicher Leistung und Modellleistung verwendet.
Hinterlasse eine Antwort