Der METRIC-Rahmen zur Bewertung der Datenqualität für Vertrauenswürdige KI in der Medizin: Eine systematische Überprüfung

Der METRIC-Rahmen zur Bewertung der Datenqualität für Vertrauenswürdige KI in der Medizin: Eine systematische Überprüfung

Die zitierten Studien beschäftigen sich mit verschiedenen Aspekten von KI, Machine Learning und Data Quality mit Schwerpunkt auf Deep Learning. In einer Studie von Vaswani et al. (2017) wird das Modell “Attention is all you need” präsentiert. Deng (2018) untersucht die historische Entwicklung und zukünftige Perspektiven von KI im Rahmen des aufkommenden Deep Learning. Silver et al. (2017) beschäftigen sich mit der Meisterung des Go-Spiels durch KI ohne menschliches Wissen. Der Artikel von He et al. (2016) zeigt die Anwendung von Deep Residual Learning für die Bilderkennung. Redmon et al. (2016) präsentieren ein vereintes, echtzeitfähiges Objekterkennungssystem. OpenAI (2023) veröffentlicht einen technischen Bericht zu GPT-4, ein fortschrittliches Modell für KI. Rombach et al. (2022) präsentieren Techniken für die hochauflösende Bildsynthese mit latenten Diffusionsmodellen.

Eine Studie von Chui et al. (2023) beschäftigt sich mit dem Stand der KI im Jahr 2023 und hebt das Jahr des Durchbruchs für die generative KI hervor. Esteva et al. (2017) stellen die dermatologische Klassifizierung von Hautkrebs mit Deep Neural Networks vor. Jumper et al. (2021) präsentieren eine hochgenaue Proteinstrukturvorhersage mit AlphaFold. Teoh und Kidd (2017) vergleichen Googles selbstfahrende Autos mit menschlichen Fahrern. Von Eschenbach (2021) diskutiert Transparenz und das Problem der Vertrauenswürdigkeit von KI.

Die UK-Regierung (2023) veröffentlicht eine Zusammenfassung des AI Safety Summit 2023. Der Vorschlag der Europäischen Union (2021) für eine Verordnung über KI legt harmonisierte Regeln fest. Die FDA (2019) stellt einen regulatorischen Rahmen für KI/ML-basierte medizinische Geräte vor. Muehlematter et al. (2021) vergleichen die Zulassung von KI/ML-basierten medizinischen Geräten in den USA und Europa. Zhu et al. (2022) analysieren die Merkmale und beabsichtigte Verwendung von FDA-zugelassenen KI/ML-fähigen medizinischen Geräten.

Studien zu Krankheitsfrüherkennung und medizinischer Bildgebung umfassen Gulshan et al. (2016) zur Erkennung von diabetischer Retinopathie, Ardila et al. (2019) zur Lungenkrebs-Screening und Liu et al. (2019) zum Vergleich der Leistung von Deep Learning und Gesundheitsfachkräften bei der Krankheitsdiagnose aus medizinischen Bildern. Zusätzlich wird auf Studien zur biomedizinischen Bildsegmentierung und semantischen Segmentierung von Hirntumoren mit Deep Learning eingegangen.

Forschung zu Qualitätsanalyse und Verbesserung von Daten und Labels umfasst Studien zu Rauscheinwirkungen, Testdaten und Qualitätsstandards in der KI-Modellierung. Maßnahmen zur Gewährleistung von Transparenz, Zuverlässigkeit und Qualität von KI-Modellen sowie zur Minimierung von Verzerrungen werden ebenfalls diskutiert. Die Studien fokussieren auf den Einfluss von Datenqualität, Datenaugmentation, Label-Rauschen, Testdatensätzen und Anmerkungseffekten auf die Leistung von Deep Learning-Modellen.