Die Daten zu Arzneimittelantworten für das Modelltraining stammen aus den GDSC- und CTRP-Datenbanken und umfassen insgesamt 692.859 Zelllinien-Arzneimittelpaare, die 1.244 Zelllinien und 888 Arzneimittel abdecken. Die Daten wurden aus den beiden Datensätzen harmonisiert, indem jeweils Daten zu den Molekülen, Zellviabilität und genetischen Veränderungen abgerufen wurden. Für die Arzneimittelantwortmessung wurde der Flächeninhalt unter der Kurve (AUC) verwendet, wobei AUC = 0 vollständige Zelltötung und AUC = 1 keine Zelltötung entspricht. Genetische Veränderungsdaten umfassten 718 klinische Gene, für die Mutationen und / oder Kopienzahlveränderungen ausgewertet wurden.
Die Strukturarchitektur des NeST-VNN-Modells basiert auf einer Hierarchie von Krebsproteinassamblagen, die mithilfe von AP-MS-Proteindaten erstellt wurde. Multiskalen-Community-Erkennung wurde verwendet, um etwa 2.300 dicht verbundene Proteinsätze zu erkennen, die hier als Proteinassamblagen bezeichnet werden. Diese wurden hierarchisch organisiert, wobei größere Assamblagen kleinere enthalten, und als ‘Eltern-Kind’-Assamblagenbeziehungen bezeichnet wurden. Das Modell wurde zur Vorhersage von Arzneimittelantworten durch ein tiefes neuronales Netzwerk verwendet.
Das NeST-VNN-Modell wurde ausgiebig trainiert und in weiteren Analysen evaluiert. Eine validierte klinische Anwendung erfolgte anhand von Daten aus dem American Association for Cancer Research Project GENIE metastatic breast cohort, um die Leistung des Modells zu überprüfen. Darüber hinaus wurde das Modell auf Patienten-Derived Xenografts (PDX) und verschiedene andere Datensätze angewendet, um die Wirksamkeit der Vorhersagen zu bewerten.
Das Modell wurde auch auf die Unterschiede in der Anzahl der verwendeten Gene für die Vorhersage hin untersucht. Die Bedeutung wichtiger Assemblies und Gene für die Vorhersage von Arzneimittelantworten wurde ermittelt, um die Modellinterpretation zu verbessern. Der Vergleich der Interpretierbarkeit des NeST-VNN-Modells mit anderen Modellen wie Random Forests (RF) wurde durchgeführt, um die Stärken und Schwächen des NeST-VNN-Modells hervorzuheben. Darüber hinaus wurden genetische Bildschirme, CRISPR-KO-Tests und weitere Experimente durchgeführt, um die Leistung und Interpretierbarkeit des NeST-VNN-Modells zu validieren und zu analysieren.
Hinterlasse eine Antwort