Современная индустрия программного обеспечения переживает стремительные изменения, связанные с массовым внедрением искусственного интеллекта. Особенно заметна эта тенденция в 2025 году, когда технологии генеративного AI перестали быть отдалённой перспективой и вышли на этап широкомасштабных применений в реальных продуктах. DevSummit Boston стал уникальной площадкой, на которой ведущие разработчики и архитекторы поделились опытом построения AI-систем, способных работать не только на уровне прототипов, но и выдерживать реальные нагрузки предприятий. Одно из ключевых выступлений конференции принадлежало Филу Кальсадо, основателю и CEO компании Outropy. Его доклад был сосредоточен на практических вызовах разработки и масштабирования продуктов на базе генеративного искусственного интеллекта — систем, для которых традиционные подходы к инженерии зачастую оказываются недостаточными.
Фил начал с того, что признал многообразие фонов слушателей, подчеркнув, насколько динамично развивается область генеративного AI. При этом он обозначил критическую проблему — разрыв между уровнем инструментов, доступных отдельным инженерам для работы с AI, и отсутствием похожих средств для менеджеров и специалистов по надежности систем. Ранее Фил предпринимал попытки разработать инструмент уровня VS Code, но для менеджеров и инженеров, который мог бы автоматизировать их рутинные задачи, однако эта инициатива провалилась из-за неправильной мотивации пользователей — они скорее стремились исследовать алгоритмы и архитектуру ассистента, чем использовать его для повышения эффективности работы. Из этого опыта он выделил три доминирующие менталитета в командах, работающих с AI. Первый заключается в постоянном погоне за свежими моделями и инвестициями, часто с надеждой на появление искусственного общего интеллекта (AGI) «в следующем году», в ущерб решению текущих ограничений.
Второй — это подход исследовательских лабораторий, которые фокусируются на длительных экспериментах ради незначительного роста точности моделей, зачастую без прикладного продуктового мышления. И третий — сосредоточенность на программной инженерии с акцентом на быструю итеративную разработку, использование легковесных, взаимозаменяемых компонентов, которые можно тестировать и улучшать в производственной среде. Основываясь на своем опыте, Кальсадо предложил два базовых понятия для структурирования AI-систем: workflow (рабочие процессы) и агенты. Workflow — это статичные цепочки обработки данных, которые выполняют подготовительные и преобразовательные задачи, например захват сообщений, устранение дубликатов и создание сводок. Агенты, напротив, обладают памятью, целенаправленностью и динамично вызывают инструменты или другие сервисы для выполнения задач.
Их он сравнил с объектами в объектно-ориентированном программировании, которые сохраняют состояние и могут взаимодействовать. Однако докладчик предостерег от использования агента в архитектуре как микросервиса с мелким гранулярным разделением. Из-за неопределенного и непредсказуемого поведения больших языковых моделей (LLM) такое разделение ведет к хрупкой интеграции и оперативным сложностям. Вместо этого он рекомендовал использовать семантические шины событий, которые обеспечивают понимание смыслового контекста операций и позволяют создавать компоненты, легко подключаемые и взаимодействующие друг с другом на основе смысловых событий, а не сырых изменений данных. Важным моментом стало разделение комплексных AI-приложений на небольшие, четко определённые функциональные блоки с ясным семантическим интерфейсом.
Примером послужила функция ежедневных брифингов в продукте Autopi, где отдельные компоненты отдельно отвечали за импорт сообщений из Slack, фильтрацию повторов, создание резюме и добавление контекста из календаря. Еще одним серьезным вызовом стало отсутствие применимости классической модели Twelve-Factor App для AI-систем. Из-за того, что конфигурации меняются динамически, процессы не могут быть статичными и без состояний, а вызовы LLM вводят задержки в системе, традиционные подходы к архитектуре оказались недостаточными. Для решения этих проблем Кальсадо рекомендовал изучить современные платформы для долговременных рабочих процессов, такие как Temporal, которые отделяют оркестровку от побочных эффектов, обеспечивают автоматические повторные попытки, таймауты и контроль точек сохранения для длительных операций с сохранением состояния. Фил Кальсадо подчеркнул, что хотя генеративный AI накладывает дополнительные требования к архитектуре, сегодня не нужно искать радикальных новшеств и полностью перестраивать процессы разработки.
Основная задача — адаптировать проверенные инженерные практики с учетом уникальных особенностей AI, связанных с вероятностной природой моделей и необходимостью работы с состояниями. Необходимы платформы, которые смогут интегрировать эти расширения и позволят командам быстро и стабильно развивать AI-продукты без постоянной борьбы с инфраструктурой и внутренними процессами. Выводы из выступления на DevSummit Boston являются важными ориентирующими принципами для всех, кто разрабатывает AI-системы в промышленном масштабе. На фоне шумихи вокруг возможностей генеративного AI и ожиданий от AGI, важнее всего — умение создавать надежные, масштабируемые и легко развиваемые продукты, способные приносить ощутимую пользу пользователям здесь и сейчас. При этом ключевые направления развития лежат в совершенствовании инженерной культуры, архитектуры и инструментов, которые поддерживают этот новый класс приложений.
Событие в Бостоне показало, что лидеры в области AI-технологий сосредоточены не только на инновациях как таковых, но и на практиках устойчивого и качественного создания специализированных решений. Такой подход помогает сократить разрыв между научно-техническими достижениями и бизнес-потребностями, что является залогом успешного распространения AI во всех сферах информационных технологий. По мере того как распространение генеративных AI-продуктов будет усиливаться, стратегия, основанная на глубоком понимании архитектуры, процессов и человеческих факторов, становится залогом конкурентного преимущества. Бизнес и техническое сообщество получают бесценные знания о том, как строить системы, которые устойчиво работают, масштабируются и приносят реальную пользу вне зависимости от постоянно меняющегося ландшафта технологий. Для тех, кто заинтересован в дальнейшем изучении, InfoQ планирует выпустить видео с докладами и дополнительным материалом с конференции, что позволит глубже погрузиться в подробности и расширить практические знания о текущих трендах и методах разработки AI-систем.
Развитие таких ресурсов становится важной частью сообщества разработчиков, стремящихся не только следить за новинками, но еще и применять лучшие практики в своих проектах.