Bioautomatisiert: Ein End-to-End-Maschinenlernwerkzeug für biomedizinische Wissenschaft und Arzneimittelentwicklung

Bioautomatisiert: Ein End-to-End-Maschinenlernwerkzeug für biomedizinische Wissenschaft und Arzneimittelentwicklung

Es wird zunehmend herausfordernder, schnell medizinische Gegenmaßnahmen (MCMs) gegen die expansive Entwicklung von chemischen und biologischen (CB) Bedrohungen für die Joint Force zu entwickeln. Die Grundlagenforschung zur Entwicklung von automatisiertem maschinellem Lernen (AutoML) speziell für biologische Sequenzdaten hat ein vielversprechendes Werkzeug für diese Herausforderungen geschaffen: ein AutoML-Framework namens BioAutoMATED. Dieses Framework dient der Analyse biologischer Sequenzen, der Interpretation biologischer Sequenzdaten und bietet Funktionen zur Gestaltung neuer biologischer Sequenzen mit den gewünschten Eigenschaften. Das Verteidigungsministerium (DTRA) Abteilung für chemische und biologische Technologien, als Teil des Chemischen und Biologischen Verteidigungsprogramms, investiert gemeinsam mit Forschern des Massachusetts Institute of Technology (MIT) in die Entwicklung von schnellen MCMs für CB-Bedrohungen mithilfe von BioAutoMATED. Der schnelle Anstieg biologischer Datensätze hat Möglichkeiten für den Einsatz von ML als neues Werkzeug in der biomedizinischen Forschung geschaffen. Diese Datensätze enthalten oft komplexe Sequenzen wie DNA- oder Proteinsequenzen, und ihre Analyse mit ML liefert wertvolle Erkenntnisse und beschleunigt die Entwicklung neuer biologischer Werkzeuge und Behandlungen. Der Aufbau, das Training und die Implementierung von ML-Modellen erfordern Fachkenntnisse und umfassen viele kritische Entscheidungen, die das Ergebnis beeinflussen. Für Lebenswissenschaftler mit begrenzter Erfahrung in der computergestützten biologischen ML kann AutoML Aufgaben wie die Datenvorbereitung, die Auswahl des richtigen ML-Modells, die Modellparameterabstimmung und die Bewertung der Modellleistung übernehmen. Trotz des Vorhandenseins verschiedener AutoML-Tools sind nur wenige für biologische Sequenzdaten optimiert. MIT-Forscher haben BioAutoMATED speziell für die Analyse biologischer Sequenzen entwickelt und für den Aufbau von Modellen mit Eingaben aus Nukleinsäuren, Peptiden und Glykansequenzen optimiert. Zum Beispiel kann es potenzielle regulatorische Sequenzen identifizieren, die an der Genregulierung beteiligt sind, und Sequenzmerkmale von Peptiden analysieren, die für die Wechselwirkung von Peptid-Arzneimitteln relevant sind. BioAutoMATED kann auch Glykane (Zucker, die z. B. auf Zellmembranen oder Bakterienzellwänden vorkommen) basierend auf ihrer Sequenz klassifizieren und ihre Immunogenität beim Menschen vorhersagen, was die Entwicklung von Impfstoffen und Therapeutika beeinflussen könnte. BioAutoMATED hat auch die Fähigkeit, neue biologische Sequenzen mit spezifischen Funktionen zu entwerfen, um die Entwicklung neuer und wirksamerer Medikamente zu lenken. BioAutoMATED bietet nicht nur Vorhersagen, sondern auch Einblicke in die zugrunde liegenden biologischen Sequenzmerkmale, die diese Vorhersagen steuern. Ein wichtiger Aspekt von BioAutoMATED ist die Interpretierbarkeit, indem Werkzeuge zur Analyse der besten Modelle automatisch angeboten werden. Diese Werkzeuge können dabei helfen, spezifische Standorte und Muster innerhalb von Sequenzen zu identifizieren, die am meisten zu den Vorhersagen des Modells beitragen. Diese Transparenz ermöglicht es Forschern, ein tieferes Verständnis ihrer Daten zu gewinnen und robuster Modelle zu erstellen. Obwohl BioAutoMATED kein vollständiger Ersatz für menschliche Expertise in ML ist, ist es nützlich als Ausgangspunkt zur Verknüpfung von Rechenergebnissen mit experimenteller Arbeit, was nicht nur die Integration von ML in beschleunigte Arzneimittelforschung gegen neue biologische Bedrohungen vereinfacht, sondern auch neue Möglichkeiten für Wissenschaftler in der Arzneimittelentwicklung eröffnet, die über keine umfangreichen Kenntnisse in der computergestützten Biologie verfügen. Über seine Rolle in der Datenanalyse und synthetischen Biologie hinaus ermöglicht BioAutoMATED zugängliche und interpretierbare ML-Anwendungen und ist ein wertvolles Werkzeug auf dem Gebiet der Arzneimittelforschung und Arzneimittelentwicklung für aufkommende Bedrohungen gegen die Joint Force.