Tiefe Repräsentationslernen chemieinduzierter transkriptioneller Profile für phänotypbasierte Wirkstoffentdeckung

Tiefe Repräsentationslernen chemieinduzierter transkriptioneller Profile für phänotypbasierte Wirkstoffentdeckung

TranSiGen ist ein VAE-basiertes Modell, das gleichzeitig drei Verteilungen erlernt: Basalprofile ohne Störung, Störungsprofile und die zugehörigen Zuordnungen zwischen ihnen. Es verwendet eine selbst-überwachte Repräsentationslernstrategie, um Rauscheffekte in den transkriptionellen Profilen zu mindern und das Signal der Störung aufzudecken. Die transkriptionellen Profile stammen aus Level-3-Daten des neu veröffentlichten CMAP LINCS 2020-Datensatzes und enthalten 978 gemessene Landmarkgene pro Profil. Dabei repräsentieren Basalprofile Kontrollprofile, die mit DMSO behandelt werden, während Störungsprofile die transkriptionellen Profile von Verbindungen darstellen. TranSiGen besteht aus zwei VAE-Modellen: eines, das Basalprofile codiert, und ein weiteres, das Störungsprofile codiert. Während der Inferenz generiert TranSiGen \({X}_{2}^{\prime}\) aus dem Eingang \({X}_{1}\) und der Störungsrepräsentation. Das Modell hat erfolgreich die sinnvolle Zuordnung von \({X}_{1}\) und Verbindung zu \({X}_{2}\} gelernt. Darüber hinaus kann TranSiGen auf Liganden-basiertes virtuelles Screening, Arzneimittelantwortvorhersage in Zellen und phänotypische Untersuchungen von Kandidatenverbindungen für Krankheiten angewendet werden. Es ermöglicht eine effektive Datenverarbeitung von transkriptionellen Profilen und eine genaue Identifizierung und Erlernung sinnvoller zellulärer und Verbindungsrepräsentationen aus den Daten.

In einer Studie wurde die Leistung von TranSiGen, um DEGs vorherzusagen, mit etablierten Baselinemodellen verglichen. TranSiGen übertrifft alle Baselinemodelle bei der Vorhersage von DEGs für nicht gesehene Verbindungen und nicht gesehene Zelllinien. Darüber hinaus zeigt es eine überlegene Generalisierbarkeit über Zelllinien hinweg. Die Nutzung von TranSiGen-abgeleiteten Repräsentationen verbessert signifikant das Screening der Aktivität von Verbindungen gegenüber spezifischen Zielproteinen wie HTR2A in chemisch-blindem und zell-blindem Umfeld. Darüber hinaus kann die Kombination von TranSiGen-Repräsentationen aus verschiedenen Zelllinien die Vorhersageleistung weiter steigern. Auch wurde die Auswirkung unterschiedlicher molekularer Repräsentationen und Modellinitialisierungsmethoden untersucht. TranSiGen zeigt überragende Leistung bei der Vorhersage von DEGs für nicht gesehene Verbindungen und Zelllinien.

Phenotypbasierte Drogen-Repurposing für die Behandlung von Bauchspeicheldrüsenkrebs zeigt die Fähigkeit von TranSiGen, empfindliche Verbindungen für Zelllinien vorherzusagen und potenzielle Wirkstoffe für die Behandlung zu identifizieren. Die Verwendung von TranSiGen-DISEASE und TranSiGen-DRUG Strategien, die auf den abgeleiteten Transkriptionsprofilen basieren, zeigt vielversprechende Ergebnisse bei der Identifizierung von wirksamen Verbindungen für die Behandlung von Bauchspeicheldrüsenkrebs. TranSiGen ermöglicht eine wirtschaftliche Integration in Pipelines für Drogenentdeckung und verbessert die Effizienz bei der Identifizierung potenzieller Wirkstoffkandidaten.