Vorhersage von Gleichgewichtsverteilungen für molekulare Systeme mit Hilfe von Deep Learning – Nature Machine Intelligence

Vorhersage von Gleichgewichtsverteilungen für molekulare Systeme mit Hilfe von Deep Learning – Nature Machine Intelligence

Deep Neural Networks haben gezeigt, dass sie genaue molekulare Strukturen aus Deskriptoren für viele molekulare Systeme vorhersagen können. Die DiG-Methode zielt darauf ab, nicht nur die wahrscheinlichste Struktur vorherzusagen, sondern auch verschiedene Strukturen mit Wahrscheinlichkeiten gemäß der Gleichgewichtsverteilung. Um diese Herausforderung anzugehen, wird die Schwierigkeit des Problems in eine Reihe von einfacheren Problemen aufgeteilt, inspiriert vom Heiz-Annealing-Paradigma. Dieses Paradigma besteht aus einem Paar reziproker stochastischer Prozesse im Strukturraum, die die Transformation zwischen der systemabhängigen Gleichgewichtsverteilung und einer systemspezifischen einfachen Verteilung simulieren.

Das DiG-Generierungsprozess verwendet einen expliziten Diffusionsprozess, um die Zielverteilung des Moleküls schrittweise durch eine gegebene Zeitperiode in Richtung einer einfachen Verteilung zu transformieren. Die umgekehrte Diffusionsprozess transformiert dann diese einfache Verteilung zurück zur Zielverteilung. Tief neuronale Netzwerke werden verwendet, um Updates vorherzusagen, die dazu dienen, die Zielverteilung basierend auf den gegebenen Deskriptoren zurückzugewinnen. Der Schwierigkeitsfaktor des simulieren des Rückwärtsprozesses liegt in den unbekannten Gradientschätzungen der Zielverteilung. Um dies zu lösen, werden Deep Neural Networks zur Konstruktion eines Punktemodells verwendet, das darauf trainiert ist, die wahre Gradientenfunktion der Zielverteilung zu approximieren. Dies ermöglicht die Generierung hoher Qualität von Molekülstrukturen.

Abgesehen von der Verwendung des Energiemodells für Informationen über die Wahrscheinlichkeitsverteilung des molekularen Systems, kann DiG auch mit molekularen Struktursamples trainiert werden, die aus Experimenten, Molekulardynamik oder anderen Simulationen gewonnen werden können. Der Parameter-Injektivitätsschätzpunktprädiktor (PIDP) ist eine Vor-Training-Methode, um DiG für Kandidatenstrukturen zu optimieren, die nicht unbedingt aus der Gleichgewichtsverteilung stammen müssen. Das Training von DiG ermöglicht die Generierung von unabhängigen Struktursamples für eine Gleichgewichtsverteilung und ist im Vergleich zu anderen Simulationstechniken effizient und rechenintensiv.

DiG bietet außerdem die Möglichkeit, Eigenschaftsgeführte Strukturerzeugung durch Vorhersage der bedingten Strukturverteilung basierend auf einer mikroskopischen Eigenschaft zu ermöglichen. Das ermöglicht die Generierung von Strukturen basierend auf gewünschten Eigenschaften, ohne durch einen Vorwärtssuchprozess gehen zu müssen. DiG kann auch Interpolationen zwischen Zuständen durchführen und einen Reaktionsweg schätzen, der durch lineare Interpolation zwischen den latenten Raumzuständen abgebildet wird. Dies ermöglicht die Schätzung von Pfaden im latenten Raum und deren Rückprojektion in den Strukturraum.