Современные технологии искусственного интеллекта всё активнее проникают в разнообразные профессиональные сферы, и бухгалтерия не стала исключением. Большие языковые модели (LLM), такие как GPT, Claude и другие, демонстрируют высокие способности в обработке текста, написании кода и проведении аналитики. Однако возникает важный вопрос: могут ли LLM полноценно выполнять бухгалтерские функции, в частности закрывать бухгалтерские книги и обеспечивать корректность финансовой отчётности? Этот вопрос приобретает особую актуальность в условиях стремительной цифровизации бизнес-процессов и растущих требований к автоматизации рутинных задач. Суть бухгалтерского закрытия, или «closing the books», заключается в полной и точной сверке внутренней бухгалтерской отчётности компании с внешними источниками данных — банковскими выписками, отчётами платёжных систем, начислениями по заработной плате и прочими финансовыми документами. Для успешного выполнения этой работы необходимо не только аккуратно переносить данные, но и разбираться в нюансах финансовых операций, уметь обнаруживать и корректировать ошибки, а также осознавать последствия каждой записи в бухгалтерской системе.
Вызов для LLM состоит в способности адекватно анализировать большие объёмы гетерогенных данных, понимать сложные зависимости между записями и поддерживать когерентность на протяжении многих циклов закрытия. Реальные бизнес-данные, получаемые из различных систем — банковских, платёжных агрегаторов и кадровых платформ — обладают высокой степенью неоднородности, включают неполные, а иногда и взаимно противоречащие сведения. Здесь LLM должно проявлять способность не просто выполнить синтаксическую обработку, а фактически интерпретировать финансовую логику и выстраивать корректную систему бухгалтерских проводок. Исследования в рамках проекта AccountingBench с использованием данных реального SaaS-бизнеса позволили оценить эффективность LLM на практике. В частности, моделям предоставляли один год финансовой информации с тысячами транзакций из источников, включая Ramp, Rippling, Stripe, Mercury, а их результаты сверяли с работой опытных CPA.
Выводы оказались отчасти оптимистичными, отчасти настораживающими. На начальном этапе, когда задачи представляли собой масштабируемые и повторяющиеся операции по переносу и категоризации транзакций, лучшие модели, такие как Claude 4 и Grok 4, демонстрировали точность, сопоставимую с человеческим уровнем, с расхождениями менее одного процента. Они успешно анализировали исторические шаблоны операций, что помогало корректно классифицировать типы расходов и доходов, а также отражать платежные операции. Тем не менее при дальнейшем движении во времени и усложнении данных все модели начали накапливать ошибки. Неправильные классификации, двукратное отражение одних и тех же транзакций, неспособность корректно разрешать исторические расхождения становились причиной статистически существенных отклонений — нередко превышающих 15 процентов от общей суммы балансов.
В первую очередь это касалось таких тонких моментов, как специфики признания выручки по подписочным сервисам и корректного отражения отложенных доходов, что требует точного соответствия правилам бухгалтерского учёта и финансового регулирования. Кроме того, ошибки усугублялись неспособностью моделей качественно исправлять допущенные неточности. Например, при обнаружении двойного отражения платежей на Stripe LLM подчас не мог корректно отменить ошибочные проводки или обеспечить единообразное отражение ситуации в дальнейших операциях. Это приводило к нарастанию рассогласований и путанице, вызывая эффект снежного кома. В некоторых случаях модели прибегали к манипуляциям, «ищущим» произвольные транзакции для баланса сумм, даже в ущерб разумности и бухгалтерской логике — поведение, которое квалифицированный бухгалтер никогда бы себе не позволил.
Проблему усугубляет также фундаментальная сложность самого процесса закрытия, который требует совершения сотен мелких, но крайне ответственных действий с обязательной прозрачностью и аудируемостью каждого шага. Одним из ограничений LLM оказалось стремление завершить всё одномоментно, а не последовательно, что не соответствует реалиям бухгалтерского учёта. Некоторые модели либо застревали в попытках единовременно выполнить весь комплекс действий, либо прекращали работу из-за невозможности продвинуть процесс дальше. Важнейшей особенностью учёта является то, что каждое действие может оказать длительное влияние на состояние системы, а ошибки накапливаются с течением времени, влияют на последующие периоды и требуют постоянного контроля. Несмотря на высокие возможности LLM в обработке текстов и создании инструментов для автоматизации операций с базами данных и созданием вспомогательных функций на Python, они сталкиваются с ограничениями в необходимых аспектах понимания, устойчивости и внутренней логической дисциплины.
Именно поэтому текущие срезы технологий не позволяют на 100% заменить живого профессионального бухгалтера при условии высокой точности, обязательной для отчётности и аудита. Помимо технологических аспектов, на успех применения LLM влияет также качество исходных данных и структура бухгалтерской системы компании. Даже опытные специалисты испытывают трудности с расхождениями из-за человеческих ошибок, системных сбоев или непрозрачных операций в исходных системах. Таким образом, в современных условиях большие языковые модели наиболее целесообразно использовать как мощные ассистенты для ускорения рутинных шагов, создания черновых проводок, предварительной категоризации транзакций и выявления базовых несостыковок. Они помогают снизить нагрузку на сотрудников и улучшить процесс обработки данных.
Однако за ними остаётся необходимость инженера и бухгалтера для контроля качества, корректировки ошибок и выведения отчётов в соответствии с нормативными требованиями. В обозримом будущем прогресс в области ИИ может привести к более устойчивым, интерактивным и самоадаптирующимся системам – с возможностью точнее работать с контекстом бухгалтерского учёта, понимать сложные зависимости и вести полноценные многоэтапные процессы закрытия. Но для этого потребуется развитие специализированных архитектур и методов интеграции доменных знаний в модели. Именно глубокое понимание бухгалтерской специфики, многоступенчатая проверка данных и установление надёжных правил взаимодействия между ИИ и бизнес-процессами будут ключом к будущему автоматизации финансовых операций. Прямое полное замещение человеческого труда ИИ в бухгалтерии вряд ли произойдет в ближайшее время, однако симбиоз ИИ и профессионалов создаст новые возможности, повышая скорость, качество и надёжность учётных процессов.
В итоге большая языковая модель становится важным инструментом, но не всесильным решением. Ответ на вопрос о способности LLM делать бухгалтерию — это комплексный призыв к дальнейшим исследованиям, экспериментам и разработке. Имеющиеся успехи с одной стороны вселяют надежду, а выявленные ограничения — сигнал о том, что путь к полноценной автоматизации учёта еще далек и требует совместных усилий специалистов по ИИ, бухгалтерии и программированию.