Конкурс CASP, или Critical Assessment of protein Structure Prediction, уже более тридцати лет является международной платформой для оценки и соперничества в сфере предсказания структуры белков. Этот проект не просто стал связующим звеном для научных коллективов по всему миру, он оказал огромное влияние на развитие искусственного интеллекта в биологии и молекулярной биологии. Однако сегодня судьба этого уникального конкурса висит на волоске из-за прекращения финансирования со стороны Национального института здоровья США (NIH). Научное сообщество всерьез обеспокоено будущим и тем, какие последствия это может иметь для исследований в области структурной биологии и разработки новых лекарств. CASP зародился в 1994 году с целью независимой и объективной оценки компьютерных методов, направленных на решение знаменитой научной задачи — предсказание того, как аминокислотные цепи укладываются в трехмерные структуры белков.
До появления этой платформы многие исследовательские группы делали громкие заявления о прогрессе, однако отсутствовал четкий инструмент сравнения и проверки их моделей друг с другом. Конкурс дал возможность увидеть настоящую картину с помощью сопоставления предсказаний с экспериментальными данными, получаемыми через методы рентгеновской кристаллографии и ядерного магнитного резонанса. За годы существования CASP значимо изменился научный ландшафт, и резкий рывок в точности предсказаний произошел с появлением и развитием ИИ-алгоритмов. Наиболее ярким примером стал AlphaFold от DeepMind, который в 2020 году на CASP14 продемонстрировал эффектный скачок в качестве результатов, приблизив задачу предсказания белковых конфигураций к решению. В дальнейшем конкурсе CASP16 2024 года уровень успеха в решении задач белковой фолдинга достиг практически 95%.
Для исследований структур белков в одиночку, казалось бы, основные сложности позади. Однако наука шагнула дальше — специалисты начали уделять внимание взаимодействиям белков с другими молекулами, включая другие белки, РНК, ДНК и малые молекулы, что влечет за собой новый виток сложностей. Для этих многообъектных систем эксперименты гораздо менее ранжированы и объём обучающих данных ограничен. С этим связаны заметные трудности в обучении ИИ-моделей. К примеру, версия AlphaFold3 показала всего около 52,5% успешных предсказаний для составных белковых комплексов, что, даже несмотря на заметный прогресс, все же свидетельствует о существенном отставании от модели одиночных белков.
Современные соревнования CASP уже далеко вышли за рамки традиционного построения исключительно 3D-структур отдельных белков и включают в себя оценку предсказаний взаимодействий между белками и с лекарственными соединениями, изучение динамических ансамблей конформаций так называемых неопределённых белков, а также структур РНК. Это делает конкурс ключевой площадкой для ученых, занимающихся прикладными задачами в биомедицинских исследованиях и фармакологии, ведь понимание молекулярных взаимодействий является фундаментом для разработки новых эффективных препаратов. Серьезность ситуации связана с тем, что последние финансовые вливания от NIH в размере 800 тыс. долларов, обеспечивавшие проведение конкурса и координацию работы сотен добровольцев и организаций, подходят к концу. Университет Калифорнии в Дэвисе, который выступал организацией-ответчиком, объявил о прекращении фонда и увольнении сотрудников, непосредственно задействованных в организации мероприятий и обработки данных.
Отсутствие ясной позиции NIH и молчание по поводу возможного возобновления гранта осложняет ситуацию. На сегодняшний день организаторы вынуждены искать альтернативные источники финансирования среди международных фондов и заинтересованных государств, понимая высокую социально-научную значимость проекта и потенциальное негативное влияние утраты такого механизма независимой оценки моделей на индустрию структурной биологии. Потеря CASP воспринимается экспертами как колоссальный удар не только по исследовательскому сообществу, но и по развитию конкурентоспособных и инновационных технологий в биоинформатике. Уникальность конкурса заключается в создании экосистемы добровольцев, объединяющей экспериментаторов, аналитиков и создателей алгоритмов с глобальным охватом. Они не только организуют соревновательный процесс, но и обеспечивают прозрачность, объективность и качество оценки, что трудно воспроизвести при отсутствии централизованной структуры.
В научном мире уверены, что подобные инициативы являются двигателем прогресса — конкуренция стимулирует улучшение моделей, разбор ошибок и внедрение новых подходов. CASP сыграл свою роль как один из основополагающих факторов, побудивший создание популярных AI-систем для предсказания структуры белков, среди которых помимо AlphaFold значится и RosettaFold, дебютировавшая на следующем после CASP14 конкурсе. Ученые подчеркивают, что структура отдельных белков — задача почти решённая, и теперь внимание предстоит сместить на более комплексные межмолекулярные процессы и динамические conformational ensembles. Именно в этих областях CASP готов предложить новые задачи и проверить современные методы, предоставляя площадку для международного сотрудничества и обмена идеями. Несмотря на общую неопределенность, множество исследователей надеется, что государственные и частные инвесторы осознают масштаб грядущих вызовов и помогут сохранить CASP.
Кроме того, Университет Калифорнии рассматривает возможность архивирования цифровых ресурсов и серверов, чтобы собрать и сохранить огромный массив данных и результатов, собранных за более чем тридцать лет существования конкурса. Ситуация с CASP отражает более масштабный тренд проблемы финансирования фундаментальной науки в США и общемировой научной политике. Сокращение инвестиций может привести к замедлению темпов инноваций и поставить под угрозу сохранение уникального международного сотрудничества. В условиях стремительного развития AI и биотехнологий роль социальных платформ оценки и продвижения совершенных инструментов еще важнее. CASP стал не просто конкурсом — это золотой стандарт, ориентир для исследовательских групп и индустрии.
Его прекращение может означать потерю эффективного средства выявления слабых мест и блокировки ложнопозитивных результатов в моделировании, что критично в эпоху, когда ошибки могут затрагивать миллионы долларов исследований и здоровья людей. Таким образом, впереди стоят серьезные вызовы: нужно сохранить уникальное наследие CASP, обеспечить финансирование и развитие новых направлений, поддержать научное сообщество, которое полагается на эту платформу, и сделать все возможное, чтобы проект продолжал быть лидером в мировом исследовании белковых структур. Только при активной поддержке фондов, институтов и международного сотрудничества можно не допустить потери одного из важнейших механизмов развития биоинформатики и биотехнологий.