Diagnose von Dickdarmkrebs mittels erklärbarer Deep Learning – Scientific Reports

Diagnose von Dickdarmkrebs mittels erklärbarer Deep Learning – Scientific Reports

Diese Abschnitt präsentiert den Datensatz, der zur Erzielung quantitativer und qualitativer Ergebnisse berücksichtigt wurde. Der Datensatz, den wir genutzt haben, ist frei verfügbar für Forschungszwecke und ist auf der Kaggle-Website unter folgender URL (https://www.kaggle.com/datasets/andrewmvd/lung-and-colon-cancer-histopathological-images/code) verfügbar. Dieser Datensatz umfasst zwei Hauptverzeichnisse: eines bezieht sich auf die Lungenkrebsbilder und das andere auf die Darmkrebsbilder. Entsprechend dem Thema des Papiers betrachten wir nur die Darmkrebsordner, die aus zwei Klassen bestehen: gutartiges Gewebe und Adenokarzinom (d.h. eine binäre Klassifikation wird verwendet). Wie in “Die Methode” diskutiert, wurde der Datensatz durch die Generierung von 5.000 histologischen Bildern für jede Klasse erweitert (wir betrachten eine binäre Klassifikation, d.h. Adenokarzinom und gutartiges Gewebe). Für die DL-Klassifikation wurde der Datensatz in einem Verhältnis von 80-10-10 für die Trainings-, Validierungs- und Testsets aufgeteilt. Die Teilung der Proben erfolgt wie folgt: 80% der Bilder (8.000) für den Trainingssatz, 10% der Bilder (1.000) für den Validierungssatz und 10% der Bilder (1.000) für den Testdatensatz. Für die Trainingstestphase wurden sieben verschiedene Deep Learning-Architekturen betrachtet: ResNet50, DenseNet26, VGG19, Standard_CNN28,29, Inception-V330, EfficientNet31 und MobileNet32. Die Hyperparameter sind auf 50 Epochen, 8 als Batch, 0,0001 als Lernrate und \(224 \times 224 \times 3\) Bildgröße eingestellt. Diese Kombination wird durch die Evaluation mehrerer Kombinationen der untersuchten Netzwerke bestimmt. Wir nutzen die binäre Kreuzentropie als Verlustfunktion, da sie speziell für binäre Klassifikationsprobleme entwickelt wurde und sich daher gut für Aufgaben eignet, bei denen die Ausgabevariable nur zwei mögliche Ergebnisse hat. Alle Training und Tests wurden in einer Arbeitsumgebung mit einem Intel Core i7 CPU mit 16 GB RAM durchgeführt. Die Ergebnisse der Klassifikation werden in Tabelle 2 aufgeführt.

Die Tabelle 2 beschreibt die Metriken der Netzwerke in Bezug auf Genauigkeit, Präzision, Recall, F-Maß, AUC und Verlust. Basierend auf den Metrikergebnissen wurden zwei verschiedene Gruppen von Architekturen identifiziert. Die erste Gruppe, die VGG19, Standard_CNN, ResNet50 und DenseNet umfasst, zeigt niedrige Ergebnisse. Diese Netzwerke können die Bilder nicht richtig klassifizieren, was die Fehlerrate erhöht und sie daher nicht für die Adenokarzinom-Diagnose zuverlässig macht. Die zweite Gruppe von CNNs, EfficientNet, MobileNet und Inception-V3, zeigt optimale quantitative Metriken und erreicht fast 100% Genauigkeit, Präzision und Recall. Die Klassifikation durch diese Architekturen garantiert korrekte Diagnosen für histologische Darmbilder. Die Verwirrungsmatrix des MobileNet-Netzwerks zeigt eine gute Leistung bei der Vorhersage von Klassen. Die Trends der MobileNet-Netzwerk-Epochen werden gezeigt und die Ergebnisse der qualitativen Analyse diskutiert. Die Heatmaps, Overlapping-Heatmaps, des Modells wurden untersucht, um die Lokalisation der Krankheitsherde zu zeigen, und die Metriken wie MR-SSIM wurden verwendet, um die Ähnlichkeit der Heatmaps zu vergleichen. Diese Untersuchung zeigt, dass MobileNet effektiv die Krankheitsherde im Darmkrebsbild lokalisiert und gute qualitative Ergebnisse liefert.