Farbanpassungstechnik für Histopathologie-Bilddatensätze könnte maschinelles Lernen gestützte diagnostische Werkzeuge stärken.

Farbanpassungstechnik für Histopathologie-Bilddatensätze könnte maschinelles Lernen gestützte diagnostische Werkzeuge stärken.

Gewebsbilddatensätze, die mit gefärbten SAN verarbeitet werden (untere Reihe), erzielen Farbverteilungen, die konsistenter sind als diejenigen, die mit anderen Techniken verarbeitet werden. Diese Konsistenz ist entscheidend bei der Schulung von auf maschinellem Lernen basierenden Systemen. In der Histopathologie, in der Gewebe unter dem Mikroskop untersucht werden, um Krankheiten zu verstehen und zu diagnostizieren, stellen Farbstoffe ein unerlässliches Werkzeug dar. Farbstoffe sind sorgfältig ausgewählte oder hergestellte Chemikalien, die an spezifische Zellbestandteile haften. Diese helfen dem Benutzer bei der Unterscheidung von Zellstrukturen, indem sie die beobachteten Farben verändern.

Bilddatensätze gefärbter Bilder, die sowohl normale als auch kranke Gewebe darstellen, sind wertvoll für das Training von Machine-Learning-Modellen, die Ärzten helfen können, schwierige Fälle zu beurteilen und persönliche Vorurteile bei der Diagnose zu reduzieren. Um sicherzustellen, dass diese Modelle ordnungsgemäß funktionieren, ist es wichtig, Farbunterschiede zwischen den für das Training verwendeten Bildern und denen zu minimieren, die sie in realen Szenarien analysieren werden. Durch sogenannte “Domain-Adaptation-Techniken” können Farbabweichungen, die aus den einzigartigen experimentellen Setups verschiedener Labore stammen, korrigiert werden, was zu konsistenteren und vergleichbareren Daten führt.

In einer kürzlich im Journal of Medical Imaging veröffentlichten Studie haben Forscher der University of North Carolina in Chapel Hill (USA) eine neuartige Domain-Adaptation-Technik vorgeschlagen. Die so genannte Stain Simultaneous Augmentation and Normalization (Stain SAN) Methode kann gefärbte histopathologische Bilddatensätze nützlicher machen für viele aufstrebende, auf maschinellem Lernen basierende Klassifikationssysteme, die letztendlich zu verbesserten Diagnosewerkzeugen führen können. Stain SAN umfasst drei Hauptschritte: Farbstoffextraktion, Farbanpassung und Intensitätsanpassung. Im ersten Schritt wird das Originalfarbstoffbild in ein Produkt aus zwei Matrizen zerlegt: eine enthält Farbinformationen und die andere enthält Lichtintensitätsinformationen für jeden Pixel. Im Anpassungsschritt wird die Verteilung der Farben in der Farbmatrix durch einen statistischen Prozess modifiziert, der die Trainingsbilder berücksichtigt, um sicherzustellen, dass die veränderten Farben innerhalb einer Zielverteilung liegen. Schließlich wird im dritten Schritt und vor der Bildrekonstruktion die Intensitätsmatrix zufällig gestört, um die Vielfalt möglicher Farbstoffdomänen zu erhöhen.