Ученые НИУ ВШЭ разработали модель GSMFormer-PPI, которая с точностью до 95,7% предсказывает взаимодействие белков, что может ускорить поиск причин заболеваний и создание новых лекарств.
Разработка учитывает три типа данных о белке — аминокислотную последовательность, трехмерную структуру и свойства поверхности. В отличие от предыдущих подходов, нейросеть не просто объединяет эти данные, а анализирует взаимосвязи между ними с помощью трансформерной архитектуры.
Тесты показали, что модель превосходит существующие решения, включая популярные графовые нейросети. Упрощенная версия системы без анализа связей между типами данных показала более низкую точность, подтвердив эффективность нового подхода.
По словам исследователей, учет структуры и поверхности белка особенно важен, поскольку именно через них происходит взаимодействие молекул. Технология может значительно сократить время изучения молекулярных механизмов болезней, поиска биомаркеров и потенциальных мишеней для терапии.




