Eine End-to-End Deep Learning Methode zur Analyse von Massenspektrumdaten zur Enthüllung krankheitsspezifischer Stoffwechselprofile

Eine End-to-End Deep Learning Methode zur Analyse von Massenspektrumdaten zur Enthüllung krankheitsspezifischer Stoffwechselprofile

Diese Studie befasste sich mit der klinischen Probenahme von Serumproben. Die Proben wurden von gesunden Personen sowie Patienten mit gutartigen Lungenknoten und Lungenadenokarzinomen entnommen. Die Serumproben wurden unter Einhaltung ethischer Richtlinien gesammelt. Die Proben wurden entsprechend der jeweiligen Diagnose gesammelt und die Teilnehmer gaben ihr Einverständnis. Zur Extraktion der Serummetaboliten wurde eine Methode mit Methanol und Methyl-tertbutylether verwendet. Die extrahierten Metaboliten wurden dann mittels Ultra-Performance-Flüssigchromatographie-Hochleistungsmassenspektrometrie analysiert. Die Serumproben wurden in Chargen analysiert, mit gemischten Qualitätskontrollproben. Die ungerichtete Metabolomik-Analyse wurde am Metabolomics Centre der Sun Yat-Sen University durchgeführt.

Die Rohdaten der LC-MS-Analyse wurden in das mzML-Format konvertiert und direkt als Eingabe für das Modell verwendet. Ein Convolutional Neural Network wurde für die Merkmalsextraktion und Klassifizierung verwendet. Ein Ensemble von Modellen, genannt DeepMSProfiler, wurde aus mehreren end-to-end-Untermodellen gebildet, die unabhängig getestet wurden. Zur Vergleichbarkeit wurden auch herkömmliche maschinelle Lernalgorithmen wie XGBoost, Random Forest, AdaBoost, SVM und DNN eingesetzt. Performance-Metriken wie Genauigkeit, Präzision, Sensitivität und F1-Score wurden verwendet, um die Modelle zu bewerten. Eine Visualisierung “Black-Box” wurde erstellt, um die Vorhersagen des neuronalen Netzwerks besser zu verstehen.

Des Weiteren wurden metabologische Peaks untersucht, um disease-related Metabolit-Protein-Netzwerke aufzubauen und KEGG-Pathway-Analysen durchzuführen. Über PIUMet wurden versteckte Metaboliten und Proteine gesucht, um stoffwechselbezogene Netzwerke zu entwickeln. Zudem wurden Ablationsstudien durchgeführt, um die Wirksamkeit des Modells zu überprüfen. Statistische Analysen und Visualisierungen wurden durchgeführt, um die Ergebnisse zu präsentieren. Die Studie schloss mit der Verwendung von KI-gestützten Technologien für die Berichterstellung und -bearbeitung ab.