Ein auf Domänenwissen basierendes interpretierbares Deep-Learning-System zur Verbesserung der klinischen Brustultraschall-Diagnose

Ein auf Domänenwissen basierendes interpretierbares Deep-Learning-System zur Verbesserung der klinischen Brustultraschall-Diagnose

Diese Studie erhielt die ethische Genehmigung vom Institutional Review Board des First Affiliated Hospital der Anhui Medical University und des Xuancheng People’s Hospital in China. Die Teilnehmer wurden über alle Aspekte der Studie informiert, selbst wenn sie nur minimales Risiko beinhalteten. Die Einwilligungen wurden im Voraus informiert und schriftlich eingeholt. Vor der Übertragung in unsere Studie wurde ein De-Identifikationsverfahren durchgeführt.

Ein Ultraschall-Datensatz wurde prospektiv gesammelt, der B-Mode-, Farbdoppler- und Elastographie-Bilder von Frauen mit Brustläsionen aus entweder dem First Affiliated Hospital der Anhui Medical University oder dem Xuancheng People’s Hospital of China von August 2019 bis Dezember 2022 umfasste. Die US-Untersuchungen wurden von sechs Brustradiologen durchgeführt, die jeweils mehr als 10 Jahre Erfahrung in der Brust-US hatten. Insgesamt wurden 4.320 gepaarte US-Bilder von 1.440 Läsionen (464 positiv für Krebs) von 1.348 Patienten gesammelt. Die manuelle Überprüfung des Pathologieberichts diente als Ground-Truth-Labels. Die Patientendemografie und die Charakteristika der Brustläsionen werden in Tabelle 1 dargestellt.

Ein interpretierbares tiefes Lernmodell, MUP-Net, wurde unter Verwendung von multimodalen US-Bildern entwickelt. Drei unabhängige Backbone-Netzwerke wurden verwendet, um semantische Merkmale aus den verschiedenen US-Modalitäten zu extrahieren. Die Prototypen wurden unter Verwendung von US-Domänenwissen ausgewählt, um repräsentative benigne und maligne Fälle zu lernen. Der Optimierungsprozess wurde durch Implementierung von US-Domänenwissen eingeschränkt, um eine Verzerrung bei der automatischen Prototypenauswahl zu verhindern.

Das Deep-Learning-Modell wurde durch Übertragungslernen entwickelt und evaluiert. Adam-Optimierer wurde verwendet, und MUP-Net wurde auf einer NVIDIA GTX A100 GPU unter Verwendung von Python und dem PyTorch-Toolkasten trainiert. Darüber hinaus wurden off-the-shelf Deep-Learning-Modelle trainiert, um die Leistung zwischen Black-Box-Modellen und dem interpretierbaren MUP-Net zu vergleichen. Eine zweiphasige Studie wurde durchgeführt, um die Leistung zwischen der KI und den Klinikern zu vergleichen.

Die Ergebnisse wurden anhand der Fläche unter der Kurve (AUC) des Receiver-Betriebene-Charakteristik-Kurvenwertes ausgedrückt. Statistische Analysen wie Delong’s Test und McNamar’s Test wurden verwendet, um die Leistung der verschiedenen KI-Modelle zu vergleichen und die Entscheidungen der Leser mit und ohne KI-Unterstützung zu vergleichen.