Die vorgeschlagene Pipeline für die Detektion von Homologen basiert auf der Kodierung von Proteinsequenzen in dichte Einbettungsvektoren, deren Ähnlichkeit auf effektive Weise berechnet werden kann. Mit Hilfe eines Proteinsprachmodells und kontrastiven Lernens wird der Sequenz-Encoder trainiert, um reichhaltige ko-evolutionäre und ...