Der erstellte Modell-Backbone kann gleichzeitig die Gleichgewichtskonformation und die QC-Eigenschaft vorhersagen, die als \((y,\, {\hat{{\boldsymbol{r}}}})=f({{\boldsymbol{X}}},\, {{\boldsymbol{E}}},\, {{\boldsymbol{r}}};{{\boldsymbol{\theta }}})\) bezeichnet wird. Dieses Modell verwendet drei Eingaben: (i) Atommerkmale (\({{\boldsymbol{X}}}\in {{\mathbb{R}}}^{n\times {d}_{f}}\)), (ii) Kanteneigenschaften (\({{\boldsymbol{E}}}\in {{\mathbb{R}}}^{n\times n\times {d}_{e}}\)), und (iii) 3D-Koordinaten von Atomen (\({{\boldsymbol{r}}}\in {{\mathbb{R}}}^{n\times 3}\)). Der Modellvorgang umfasst die Vorhersage einer quantenmechanischen Eigenschaft y und der aktualisierten 3D-Koordinaten \({\hat{{\boldsymbol{r}}}}\in {{\mathbb{R}}}^{n\times 3}\). Der Modell-Backbone besteht aus L-Blöcken, die jeweils zwei verschiedene Repräsentationspfade aufrechterhalten: Atomrepräsentation und Paarrepräsentation.
Die Positionskodierung umfasst sowohl die 3D-Positionsencodierung als auch die Graphpositionsencodierung, wobei die verkürzte Wegencodierung und die Einfachkantenencodierung verwendet werden. Die atomaren Repräsentationen werden durch Self-Attention aktualisiert, während die Paarrepräsentationen eine Reihe von Upgrades durchlaufen, darunter Äußeres Produkt und dreieckige Multiplikation. Die Backbone-Struktur verbessert die Paarrepräsentation durch effektive Atom-zu-Paar-Kommunikation und durch Stärkung der 3D-geometrischen Informationen.
Das Modell umfasst auch eine iterative Konformationsupdate-Strategie, die zur Optimierung der Konformation in praktischen Anwendungen wie der Moleküldynamik verwendet wird. Die Anzahl der Iterationen, die für das Konformationsupdate verwendet wird, ist ein Hyperparameter. Der 3D-Positionsvorhersagekopf innerhalb des Modells verwendet eine 3D-Vorhersagekopfarchitektur und ein Aufmerksamkeitsmechanismus zur Bestimmung der Koordinatenupdates. Das Trainingsverfahren verwendet ein neues Ansatz, bei dem zunächst ein Pseudo-Verlauf generiert wird, von dem dann eine Konformation abgebildet wird, die als Eingabe für das Modell dient. Dieser Prozess zielt darauf ab, die Informationen in den molekularen Daten besser zu nutzen. Darüber hinaus wird ein flexibles Sampling-Verfahren eingesetzt, um die Verteilungsverschiebung zwischen Training und Inferenz zu reduzieren und die Zuverlässigkeit des Modells zu erhöhen.
Hinterlasse eine Antwort