Schätzung des menschlichen Alters mittels maschinellem Lernen auf Panoramaröntgenaufnahmen für brasilianische Patienten – Scientific Reports

Schätzung des menschlichen Alters mittels maschinellem Lernen auf Panoramaröntgenaufnahmen für brasilianische Patienten – Scientific Reports

Die Studie wurde von der Ethikkommission der Bundesuniversität von Pernambuco und dem Zentrum für medizinische Wissenschaften genehmigt. Die Panorama-Röntgenbilder stammten aus der Universitätsdatenbank und aus Bildern aus dem Bundesstaat Pernambuco. Ein brasilianischer Datensatz kann aufgrund seines hohen Mischungsgrades repräsentativer sein. Daher wurde ein Datensatz von 12.827 Bildern zwischen 2017 und 2018 erstellt. Die Altersspanne der Patienten reichte von 2,25 bis 96,50 Jahren. Im Gegensatz zu anderen Studien wurden Proben nicht ausgeschlossen oder vorverarbeitet, um einen Datensatz mit Eigenschaften des Alltagslebens zu schaffen und die praktische Verwendung der Modelle zur Analyse des individuellen Alters zu erleichtern.

Der vorgeschlagene Pipeline-Prozess umfasst mehrere Schlüsselstufen, die sorgfältig entwickelt wurden, um die Genauigkeit und Robustheit der prädiktiven Modelle zu verbessern. Ein umfassender Ansatz wird in den Datenverarbeitungs- und Modellentwicklungsschritten gewährleistet. Die Struktur hilft nicht nur bei der Vorhersage des chronologischen Alters, sondern legt auch den Grundstein für zukünftige Erkundungen.

Die Datensammlung erfolgte sorgfältig, um 12.827 Röntgenbilder und entsprechende Patientendaten zu sammeln. Eine strengere Datenqualitätsanalyse wurde durchgeführt, um das Datenset auf 10.035 vollständige und überprüfte Röntgenbilder zu reduzieren. Die Altersverteilung der Patienten wurde in einem Histogramm dargestellt, um potenzielle Ausreißer oder Anomalien innerhalb der Daten zu identifizieren. Darüber hinaus wurde eine statistische Analyse durchgeführt, um das durchschnittliche Alter, die Altersspanne, die Standardabweichung und die Geschlechterverteilung innerhalb des Datensatzes zu erfassen.

Für die Datenverarbeitung wurden spezielle DataLoaders erstellt, um die Bildgrößen zu standardisieren, die Pixelwerte zu normalisieren, Datenverdopplung zu implementieren und die Bilder zu strukturieren. Die Modellkonstruktion umfasste das Training mehrerer Versionen des modifizierten InceptionV4-Modells auf automatisierten Pipelines. In strukturierten Experimenten und Anpassungen wurden Hyperparameter optimiert, um die Modellleistung zu maximieren. Die Bewertung der Modelle wurde durchgeführt, um deren Robustheit und Generalisierungsfähigkeiten zu prüfen.

Abschließend wurde das Modell zum Schätzen des Alters anhand von Panoramaröntgenbildern auf der Grundlage der InceptionV4-Architektur entwickelt. Eine systematische Datenpräprozessierung, Modellauswahl, Augmentation des Datensatzes und Modelltraining wurden durchgeführt, wobei eine transparente und reproduzierbare Methodik gewährleistet wurde. Die Ergebnisse und die Datensätze aus dieser Studie bieten einen wichtigen Beitrag zur forensischen klinischen Forschung unter Berücksichtigung der charakteristischen Merkmale der brasilianischen Bevölkerung.