Maschinelles Lernen erhellt die Gen-Transkription

Maschinelles Lernen erhellt die Gen-Transkription

Ein Team von Forschern am UT Southwestern Medical Center hat tiefe Lernmodelle entwickelt, um eine einfache Reihe von Regeln zu identifizieren, die die Aktivität von Promotern steuern – Regionen von DNA, die den Prozess initiieren, bei dem Gene Proteine produzieren. Die Erkenntnisse, die in Science veröffentlicht wurden, könnten zu einem besseren Verständnis darüber führen, wie Promotoren zur Genregulation bei Gesundheit und Krankheit beitragen. Jian Zhou, Ph.D., Assistenzprofessor im Lyda Hill Department of Bioinformatics am UT Southwestern, ist Stipendiat der Lupe Murchison Foundation für medizinische Forschung und Mitglied des Harold C. Simmons Comprehensive Cancer Center.

Die Proteine, die Zellen zur Ausführung ihrer Aktivitäten verwenden, entstehen durch einen Prozess, der als Transkription bekannt ist. Dabei heftet sich ein RNA-Polymerasenprotein an einen DNA-Strang und kopiert – oder transkribiert – die codierten Informationen in ein RNA-Molekül. Der Bereich, an dem die RNA-Polymerase ansetzt, um die Transkription zu beginnen, wird als Promotor bezeichnet. Um Promotoren beim Menschen besser zu definieren und zu verstehen, haben die Forscher ein maschinelles Lernprogramm namens Puffin entwickelt.

Puffin zeigte, dass je nach Anordnung dieser Elemente die Transkription eines Gens aktiviert oder unterdrückt werden kann. Puffin kann auch vorhersagen, wie die Anordnung dieser Elemente die RNA-Polymerase dazu bringen kann, bevorzugt einen einzelnen DNA-Strang zu transkribieren oder beide Stränge gleichzeitig in entgegengesetzte Richtungen zu transkribieren. Diese bidirektionale Transkription ist bei menschlichen Genen häufig. Das Programm zeigte auch, dass Mäuse und andere Säugetiere ähnliche Regelsätze für die Steuerung des Promoterbetriebs teilen.

Die Forscher schlugen vor, dass Puffin ihnen helfen könnte zu verstehen, wie Promotoren in gesunden Zellen arbeiten, sowie wie krankheitsbedingte Veränderungen in Promotoren zu Veränderungen in der Gen-Transkription führen könnten. Dieses Programm ist auf einem kostenlosen Webserver verfügbar, damit andere Forscher beliebige Promotorsequenzen testen können. Sie fügten hinzu, dass die Verwendung eines ähnlichen maschinellen Lernansatzes Einblicke in andere Facetten des Genoms bieten könnte, die noch nicht gut verstanden sind.