Maschinelles Lernen geleitete Co-Optimierung von Fitness und Diversität erleichtert die Entwurfs von kombinatorischen Bibliotheken in der Enzymtechnik – Nature Communications

Maschinelles Lernen geleitete Co-Optimierung von Fitness und Diversität erleichtert die Entwurfs von kombinatorischen Bibliotheken in der Enzymtechnik – Nature Communications

In diesem Artikel wird das MODIFY-Algorithmus beschrieben, ein ML-Algorithmus zur Ko-Optimierung von Bibliotheksfitness und Diversität für die Entwicklung neuer enzymatischer Funktionen. MODIFY verwendet ein neuartiges Ensemble-ML-Modell, das Protein-Sprachmodelle (PLMs) und Sequenzdichtemodelle nutzt, um Null-Shot-Fitness-Vorhersagen zu treffen und durch ein Pareto-Optimierungsschema Bibliotheken mit hoher erwarteter Fitness und hoher Diversität zu entwerfen. Durch den Ausgleich von Fitness und Diversität kann MODIFY optimale Bibliotheken erstellen, die weder Fitness noch Diversität weiter verbessern können, indem es auf der sogenannten Pareto-Frontier, einem optimalen Trade-off-Pfad, arbeitet. Anhand von Experimenten und Simulationen wurde gezeigt, dass MODIFY zuverlässige Fitnessvorhersagen für eine Vielzahl von Proteinarten trifft und die Fitness von Proteinvarianten erfolgreich vorhersagen kann.

Der MODIFY-Algorithmus wurde auf die Optimierung einer Startbibliothek für das Protein GB1 angewendet, und es wurde gezeigt, dass die von MODIFY entworfene Bibliothek ein optimales Gleichgewicht zwischen Diversität und vorhergesagter Fitness erreicht. Im Vergleich zu herkömmlichen Bibliothekendesign-Methoden verbesserte MODIFY die Qualität der Startbibliothek erheblich und führte zu einer höheren Gesamtfitness und Erhaltung der Diversität. Darüber hinaus wurde gezeigt, dass die von MODIFY entworfene Bibliothek die Leistung von maschinellem Lernen bei der evolutionären Optimierung von Enzymen verbessert, was zu einer beschleunigten Prozess für die Protein-Ingenieurwissenschaft führt.

Experimentell wurde gezeigt, dass MODIFY erfolgreich biokatalytische Biobibliotheken für die C–B- und C–Si-Bindungsbildung auf der Basis des Cytochrom-c-Proteins von Rhodothermus marinus ausgehend von Wildtypvarianten entwickeln konnte. Es wurden neuartige Enzymvarianten entdeckt, die sowohl für die Borylierung als auch für die Silierung hocheffizient und selektiv waren. Darüber hinaus konnte MODIFY eine Korrelation zwischen der Enantioselektivität und der Aktivität von Enzymvarianten für beide Biokatalysereaktionen aufzeigen. Molekulardynamik-Simulationen deuteten darauf hin, dass die neu entdeckten MODIFY-Varianten Änderungen in den flexiblen Schleifen, insbesondere am α-Helix-Residuum 75, zeigten, was zu erhöhter Flexibilität und besserer Substratbindung führte.

Insgesamt zeigt diese Studie, dass der MODIFY-Algorithmus ein leistungsstarkes Werkzeug ist, um effektive Bibliotheken für die biotechnologische Entwicklung von Enzymen zu entwerfen, die sowohl Fitness als auch Diversität berücksichtigen. Die entwickelten Enzymvarianten ermöglichen die Durchführung wertvoller biokatalytischer Transformationen und die Entdeckung von neuartigen biokatalytischen Biokatalysatoren.