Vorhersage der Glykanstruktur aus Tandem-Massenspektrometrie mithilfe von Deep Learning – Nature Methods

Vorhersage der Glykanstruktur aus Tandem-Massenspektrometrie mithilfe von Deep Learning – Nature Methods

CandyCrunch nutzt domain-Expertise zur Vorhersage von Glykanstrukturen. Die Fragmentierungsmuster und Grundmuster in MS/MS sind vorhersagbar und durch maschinelles Lernen analysiert. Eine bisher unvergleichlich große Menge an annotierten LC–MS/MS Spektren von Glykanen wurde gesammelt und kuratiert. Die Datenbank umfasst fast 500.000 beschriftete MS/MS-Spektren aus über 2.000 Glykan-Experimenten. Diese Datenbank bietet eine umfassende Darstellung aktueller Glykomik-Daten, einschließlich aller wichtigen eukaryotischen Glykan-Klassen und Experimentaufbauten. Diese Daten werden in einem dilatierten residualen neuronalen Netzwerk mit dem Namen CandyCrunch verwendet, um Glykan-Rankings vorherzusagen.

Das CandyCrunch-Modell verwendet MS/MS-Spektren, Retentionszeiten, Vorläufionen-m/z-Werte und experimentelle Parameter als Eingabe und gibt Glykan-Rankings als Ausgabe aus. Das Modell berücksichtigt die Fragmentierungsmuster und besteht aus einem tiefen Lernmodell. Es kann auf einem typischen Laptop ausgeführt werden und ermöglicht genaue Vorhersagen von Glykanstrukturen. Durch den Einsatz von CandyCrunch konnten bedeutende Vorteile bei der Vorhersage von Glykanstrukturen erzielt werden, insbesondere bei der Unterscheidung sehr ähnlicher Strukturen.

CandyCrunch wird durch das Tool CandyCrumbs ergänzt, das die automatische Entdeckung von fragmentierten Ionen erleichtert. Das Tool ist über das CandyCrunch-Paket verfügbar und ermöglicht die automatische Annotierung von Fragmentionen. Es bietet eine schnelle und vollständige Lösung für die automatische Zuordnung von Fragmentionen in der Domon-Costello- und IUPAC-Kondensatschrift. Zusätzlich ermöglicht es die Identifizierung diagnostischer Ionen auf der Basis von Fragmentationsverhalten, was menschlichen Experten ähnelt.

Durch die Anwendung von CandyCrunch und CandyCrumbs konnten neue biologische Erkenntnisse gewonnen werden, die die Analyse von Glycomik-Daten optimieren. Beispielsweise wurden neue glykanstrukturbezogene Einsichten gewonnen durch die Vorhersage von murinen intestinalen Glykanen und Serum-N-Glycomen von südpazifischem Thunfisch. Die Kombination von AI-Tools wie CandyCrunch und CandyCrumbs erlaubt es, umfangreiche Glykomik-Studien durchzuführen und neue Erkenntnisse aus den gesammelten Daten zu gewinnen.