Редактирование генома в последние годы стало одним из ведущих направлений биомедицинских исследований и медицины. Технология CRISPR-Cas, основанная на природных иммунных механизмах бактерий, позволила проводить точные и эффективные изменения в ДНК, кардинально ускорив изучение функций генов и развитие генной терапии. Однако несмотря на огромный потенциал, проектирование и проведение таких экспериментов остаётся сложной задачей, требующей глубоких знаний как в молекулярной биологии, так и в технических аспектах CRISPR-систем. Здесь на помощь приходит искусственный интеллект, а именно новая система CRISPR-GPT, которая автоматизирует и упрощает все этапы планирования, выполнения и анализа экспериментов по редактированию генов. Система CRISPR-GPT разработана на основе больших языковых моделей (LLM), подобных GPT-4 и Llama 3, которые обладают выдающейся способностью к обработке естественного языка и сложному рассуждению.
Специфической задачей CRISPR-GPT стало использование этих моделей для решения прикладных вопросов в области геномного редактирования. Главным преимуществом является интеграция обширного экспертного знания, включая научные публикации, инструкции и базы данных, что существенно повышает точность и надёжность рекомендаций. CRISPR-GPT представляет собой многоагентную архитектуру, состоящую из четырёх ключевых компонентов: планировщика задач, исполнителя, пользователя-прокси и провайдера инструментов. Планировщик разбирает исходный запрос пользователя, выделяя последовательность необходимых действий и формируя оптимальную стратегию проведения эксперимента. Исполнитель затем поэтапно реализует эти задачи с возможностью интерактивного взаимодействия с пользователем, а агент-прокси действует как посредник, интерпретируя ответы пользователя и направляя ход эксперимента.
Провайдеры инструментов обеспечивают доступ к специализированным онлайн-сервисам и программам биоанализа, таким как CRISPRitz для оценки офф-таргетов и CRISPResso2 для анализа результатов секвенирования. Одним из важнейших аспектов CRISPR-GPT является поддержка четырёх основных типов редактирования гена: вычеркивание (knockout), основанное редактирование, прямое программирование с помощью prime editing и эпигенетическая активация либо репрессия генов (CRISPRa/i). Это даёт исследователям возможность применить систему для широкого спектра биологических задач и экспериментов, учитывая особенности и требования каждой методики. Важной особенностью CRISPR-GPT является режимы работы, которыми система адаптируется к уровню подготовки пользователя. Режим Meta ориентирован на новичков и предлагает пошаговое руководство, которое охватывает выбор системы CRISPR, доставку, проектирование guide RNA, оценку офф-таргетов, подбор протоколов и анализ данных.
Режим Auto рассчитан на опытных пользователей, позволяя задать произвольный запрос и получить автоматически составленный и выполненный план эксперимента. Режим Q&A предоставляет быстрые ответы на различные научные вопросы, связанные с геномным редактированием. Для проверки эффективности CRISPR-GPT был составлен обширный тестовый набор «Gene-editing bench», включающий 288 кейсов с задачами, охватывающими проектирование, подбор методов доставки, создание guide RNA и решение сложных проблем в экспериментах. При сравнении с общими языковыми моделями, CRISPR-GPT демонстрирует заметное превосходство по точности, полноте и последовательности решений, благодаря встроенной экспертной базе и специализированной настройке. Особое внимание разработчики уделили интеллектуальному выбору методов доставки CRISPR-компонентов в целевые клетки и ткани.
Система анализирует биологический контекст, используя поисковые инструменты для актуализации знаний, а затем предлагает наиболее эффективные стратегии, учитывая цитируемость и опыт из научной литературы. Этот подход особенно полезен при работе с трудно трансфицируемыми или редкими клеточными типами. Не менее важна функция выбора guide RNA, ключевого элемента для точности и успешности редактирования. CRISPR-GPT использует предварительно сформированные гайды из авторитетных источников, таких как CRISPick, дополнительно фильтруя и сортируя их с учётом функциональных областей гена и биологических контекстов. Это ведёт к повышению биологической релевантности и снижению рисков неэффективных «пустых» дизайнов.
Технология также демонстрирует высокую качество ответов на исследовательские вопросы, обучаясь на более чем десяти годах обсуждений экспертов в открытых форумах, что позволяет ей мыслить аналогично учёному, находить и объяснять сложные биологические решения. В реальных экспериментах CRISPR-GPT обеспечил успешное выполнение как удаления четырёх генов в клеточной линии легочной аденокарциномы с использованием Cas12a, так и эпигенетической активации двух генов в меланоме через dCas9. При этом эксперименты были проведены молодыми учёными с минимальным опытом работы с CRISPR, что подчёркивает простоту и доступность технологии. Безопасность и этические аспекты получили отдельное внимание. Система автоматически проверяет запросы на наличие рисков, связанных с созданием патогенов, редактированием гермлинии человека и других опасных сценариев.
В случае обнаружения проблем пользователю выводятся предупреждения или сістема блокирует выполнение запроса, что соответствует международным нормам и рекомендациям. Также реализованы механизмы защиты конфиденциальных данных пользователей, особенно геномных последовательностей, в том числе фильтры на передачу фрагментов ДНК длинной 20 и более нуклеотидов. CRISPR-GPT — это не просто инструмент, а интеллектуальный партнёр, который способен сопровождать биологов на всех этапах эксперимента, улучшая качество, снижая ошибки и оптимизируя процесс. Возможности системы позволяют думать о будущем, где подобные агенты будут интегрированы с роботизированными лабораториями, создавая полностью автоматизированные цепочки от планирования до проведения и анализа экспериментов. Перспективы развития CRISPR-GPT широки.
Предстоит расширять базу знаний, интегрировать новые инструменты для работы с белками и плазмидами, а также адаптировать агента для других биотехнологических областей. Немаловажно и решить задачі динамического управления задачами внутри системы, повышая её гибкость и адаптивность. Сегодня CRISPR-GPT становится важным шагом на пути к полноценной автоматизации научных исследований с потенциалом кардинально изменить методы биологического и медицинского анализа в ближайшие годы.