Tiefe Lernens für die Diagnose von Multi-Typen Infektiöser Keratitis: Eine nationale, Querschnitts-, multizentrische Studie – npj Digital Medicine

Tiefe Lernens für die Diagnose von Multi-Typen Infektiöser Keratitis: Eine nationale, Querschnitts-, multizentrische Studie – npj Digital Medicine

Nachdem 1452 Bilder von schlechter Qualität und 3624 Bilder ohne ausreichende diagnostische Sicherheit entfernt wurden, wurden Datensätze mit insgesamt 23.055 qualifizierten Bildern verwendet, um ein tiefes Lernsystem zu entwickeln und zu bewerten. Die Bilder stammten von 10.369 Patienten aus 12 unabhängigen klinischen Zentren im ganzen Land. Die Datensätze enthielten Bilder von bakterieller Keratitis, Pilzkeratitis, viraler Keratitis, Amöbenkeratitis und nicht-infektiöser Keratitis. Die Patientengruppe hatte ein Durchschnittsalter von 53,6 Jahren und bestand zu 41,8% aus Frauen und Mädchen. Die Entwicklung und externe Testdatensätze von 12 klinischen Zentren bundesweit sowie der Datensatz, der prospektiv von EHWMU gesammelt wurde, sind in Tabelle 1 zusammengefasst.

Das System wurde mit einem Trainingssatz aus 10.592 Bildern aus dem EHWMU intern trainiert und bewertet, während ein separates externes Testdatensatz von 7206 Bildern aus anderen klinischen Zentren verwendet wurde. Der prospektive Testdatensatz vom EHWMU umfasste 5257 Bilder. Vier Deep-Learning-Algorithmen wurden für die Diagnose verschiedener Keratitisarten entwickelt und getestet, wobei der DeepIK-Algorithmus die beste Leistung zeigte. Dieser erzielte für bakterielle, pilzige, virale, amöbische und nicht-infektiöse Keratitis AUCs von 0,949 bis 0,979 und Genauigkeiten von 88,7% bis 98,9%. Die interne und externe Bewertung der Algorithmen zeigte, dass DeepIK die besten Ergebnisse erzielte.

Die Prospektivbewertung des DeepIK-Algorithmus zeigte auch vielversprechende Ergebnisse in der Unterscheidung zwischen verschiedenen Arten von Keratitis in einem neuen Datensatz. DeepIK übertraf sowohl Junior- als auch Senior-Augenärzte in Bezug auf die diagnostische Leistung bei der Unterscheidung der verschiedenen Keratitisarten. Es wurden auch Fehler analysiert, die von DeepIK im Vergleich zu Ophthalmologen gemacht wurden, wobei sowohl DeepIK als auch Ophthalmologen in bestimmten Fällen Fehler machten. Die Visualisierung der Entscheidungsfindung von DeepIK sowie die potenzielle Rolle von DeepIK zur Verbesserung der diagnostischen Fähigkeiten von Junior-Augenärzten wurden ebenfalls untersucht.