Современный мир программирования активно внедряет инструменты искусственного интеллекта для оптимизации рабочих процессов и повышения продуктивности разработчиков. Особенно интересной является тема влияния ИИ на опытных специалистов, работающих с крупными проектами с открытым исходным кодом. В середине 2025 года группа исследователей провела уникальное рандомизированное контролируемое исследование, результаты которого удивили многих экспертов и пользователей ИИ. В исследовании принимали участие 16 опытных разработчиков, работающих над крупными репозиториями с миллионами строк кода и тысячами звезд на GitHub. Каждый из них вносил свой вклад в проект на протяжении многих лет, что гарантировало высокий уровень профессионализма и понимания предмета.
Основной целью исследования стало объективное измерение влияния инструментов искусственного интеллекта на производительность программистов при решении реальных задач. Каждому разработчику предоставлялся список актуальных проблем и задач, которые требовали обычной работы — исправления ошибок, реализации новых функций или рефакторинга кода. Задачи были рандомно распределены на две группы: для первой разрешалось использовать ИИ-инструменты, а для второй — запрещалось. В случае разрешения программист мог воспользоваться любыми доступными на тот момент инструментами, включая Cursor Pro с моделями Claude 3.5 и 3.
7 Sonnet — одними из самых современных решений в области ИИ. Для измерения времени решения задач каждый разработчик записывал весь процесс работы, после чего самостоятельно указывал итоговое время реализации. Особое внимание уделялось сохранению высокого качества кода: соблюдение требований к стилю, тестированию и документации было обязательным, что позволяло оценить не только скорость, но и полноту выполнения задач. Размер оплаты и мотивация участников также были продуманными: каждому платили 150 долларов в час, что позволяло сосредоточиться на эффективной и полноценной работе без экономии времени. Результаты вызвали большой резонанс в профессиональном сообществе.
Несмотря на широкое распространение положительных отзывов о пользе ИИ и ожидаемый прирост скорости работы, фактические показатели оказались совершенно иными. Использование искусственного интеллекта привело к увеличению времени выполнения задач на 19%, что соответствует значительной замедляющей тенденции. Этот факт стал особенно поразительным, учитывая, что сами разработчики ожидали ускорения своей работы на 24%, а даже после опыта с ИИ продолжали считать, что инструменты ускорили их работу на 20%. Данная диссонанс между восприятием и реальностью поднимает множество вопросов о роли и эффективности ИИ в конкретных рабочих сценариях. Почему же происходило замедление? Исследователи подробно проанализировали двадцать различных факторов, чтобы понять причины данного явления.
Среди них были исключены технические артефакты, несоблюдение правил эксперимента, изменение качества результатов или различия в сложности задач. Итогом стала гипотеза о том, что ИИ в нынешнем виде, несмотря на свои впечатляющие возможности на синтетических бенчмарках и в контролируемых тестах, не всегда соответствует реальным требованиям и особенностям сложных и масштабных проектов. В качестве объяснения можно выделить несколько ключевых аспектов. Во-первых, масштаб и качество проектов с открытым исходным кодом предъявляют высокие требования не только к быстрому написанию кода, но и к его читаемости, тестируемости и совместимости с уже существующей инфраструктурой. Многие из этих параметров зачастую невозможно оптимизировать или проверить автоматически.
Во-вторых, используемые в исследовании ИИ-инструменты, пусть и современные, ограничены в объеме генерации и способности многократно перебирать варианты решения, что часто требуется в крупных кодовых базах. В-третьих, необходимо учитывать временную составляющую обучения разработчиков эффективному использованию ИИ. Большинство участников имели ограниченный опыт работы с этими инструментами — от нескольких десятков часов до пары месяцев, что недостаточно для формирования качественных методик и интеграции в привычный рабочий процесс. Наконец, высокие стандарты качества, включая документацию и тестирование, создают дополнительные временные издержки, которые ИИ пока не способен значительно снизить. Интересно рассмотреть результаты этого исследования в контексте других методов оценки ИИ.
На текущий момент существуют различные подходы: синтетические бенчмарки, имитационные тесты и ряд пользовательских отзывов и анекдотов. Каждый из этих методов неполно отражает реальную картину в повседневной работе разработчиков. Например, бенчмарки могут демонстрировать высокие показатели на хорошо структурированных и ограниченных в объеме задачах, но не учитывать сложность и разнообразие требований крупного проекта. В то время как наблюдения «в полевых условиях» побуждают к более осторожной и комплексной оценке. Это исследование предоставляет важный контрапункт всеобщему оптимизму, показывая, что внедрение новых технологий требует времени, адаптации и возможно пересмотра рабочих процессов на корпоративном и индивидуальном уровне.
Тем не менее, это не означает, что ИИ не обладает потенциалом для улучшения продуктивности. Развитие моделей, углубленное обучение пользователей и создание специализированных адаптивных инструментов способно в перспективе привести к заметному ускорению работы и снижению рутинных операций. Авторы исследования подчеркивают, что будет интересно наблюдать за динамикой результатов в будущем, по мере появления более продвинутых систем. При этом методология РКИ (рандомизированного контролируемого исследования) обладает преимуществом в минимизации искажений и субъективности по сравнению с другими источниками данных. В широком смысле, подобные исследования помогают глубже понять суть технологий и косвенно свидетельствуют о влиянии ИИ на развитие самой индустрии программного обеспечения.
Если скорость и эффективность разработчиков возрастут благодаря ИИ, это может привести к быстрому развитию новых технологий, усилению рисков недостаточного контроля и повышению концентрации власти в руках нескольких компаний. Таким образом, мониторинг влияния ИИ становится стратегическим вопросом для всего сектора высоких технологий. Отдельно стоит отметить аспект восприятия пользователей, которое сильно расходится с объективными фактами. Этот феномен необходимо разбирать и объяснять, поскольку он влияет на решение о внедрении и инвестировании в ИИ-инструменты. Множество разработчиков и менеджеров испытывает желание внедрять ИИ на основании личных впечатлений, что может привести к завышенным ожиданиям или ошибочным инвестициям.
В результате становится очевидным, что оценка ИИ и его влияния должна базироваться на научных и объективных данных, а не только на модных трендах и успешных кейсах. Параллельно с этим важно продолжать работу над улучшением ИИ-технологий, повышением удобства их использования и адаптации под реальные задачи. Не менее важно обучать разработчиков лучшим подходам и методикам совместной работы с ИИ, чтобы максимально эффективно использовать новые возможности, при этом минимизируя дополнительные издержки и ошибки. Прогнозы развития в этой области выглядят достаточно многообещающими. Уже сейчас ведутся эксперименты с использованием крупных объемов данных, техник глубокой адаптации моделей к специфике репозиториев, а также интеграцией ИИ в среды разработки.