Древние надписи, выполненные на камне, металле или других материалах, являются бесценным источником информации о языках, культуре и истории давно ушедших эпох. Они дают прямой доступ к мышлению и жизни народов прошлого, помогая историкам реконструировать события, обычаи и взаимосвязи. Однако изучение и интерпретация этих свидетельств сопряжены с множеством сложностей: многие тексты повреждены временем, содержат пропуски, сокращения и неоднозначные знаки. Традиционный процесс анализа таких артефактов требует глубоких знаний, тщательного сопоставления с параллельными текстами и многочасовой ручной работы, зачастую доступной лишь узкому кругу специалистов. С развитием технологий искусственного интеллекта, в частности генеративных нейронных сетей, открываются новые возможности для автоматизированного восстановления и атрибуции забытых или поврежденных текстов.
Одним из прорывов в этой области стал проект Aeneas — мультизадачная модель, которая объединяет обработку текста и изображения для решения ключевых задач: восстановления текста, определения места создания и временных рамок надписей. Это позволяет не только ускорить обработку огромных корпусных данных, но и повысить точность интерпретации, объединяя эмпирические знания с вычислительной мощью сетей. Технология Aeneas была разработана для работы с богатыми и разнообразными коллекциями древних латинских надписей, охватывающих более 2000 лет истории от VII века до нашей эры до VIII века нашей эры и территорию от Британии до Месопотамии. Для обучения модели был создан так называемый Latin Epigraphic Dataset (LED), объединяющий данные из крупнейших эпиграфических баз. Такая широкая и стандартизированная выборка позволила сети научиться распознавать не только текст, но и визуальные признаки, различные особенности почерка и даже формально-стилистические шаблоны, характерные для определённых эпох и регионов.
В основе архитектуры Aeneas лежит трансформерная модель, способная эффективно обрабатывать последовательности символов, дополненная визуальной сетью для анализа изображений надписей. Модель способна восстанавливать пропущенные фрагменты текста не только фиксированного, но и произвольного размера, что является уникальной способностью, ранее практически недоступной цифровым методам. Кроме того, она предоставляет пользователям – историкам и эпиграфистам – не только прямые восстановленные фрагменты, но и варианты контекстуально близких параллелей из огромного корпуса текстов, что существенно поддерживает исследовательскую работу и расширяет горизонты интуитивных поисков. Практическая польза от применения такой системы была подтверждена в масштабном исследовании с участием 23 историков-эпиграфистов, обладающих различным уровнем экспертности. В ходе эксперимента специалисты выполняли три основные задачи: реставрацию повреждённых частей, датирование и географическую атрибуцию текстов сначала без помощи ИИ, а затем с использованием предложений и предсказаний Aeneas.
Результаты показали, что предоставленные моделью параллели значительно повысили уверенность учёных – примерно на 44% в ключевых задачах, а синергия человека и ИИ превзошла эффективность каждого по отдельности. Отметим, что при этом использование параллелей уменьшало время, необходимое для поиска соответствующих текстов, с нескольких дней до считанных минут. Особое значение имеет возможность модели интегрировать визуальную информацию надписей. Исследования историков подтвердили, что форма самого артефакта, особенности резьбы и расположение текста обычно играют важную роль в понимании его значения и происхождения. Включение этой информации в процесс атрибуции позволило повысить точность классификации надписей по регионам, что слишком сложно сделать, опираясь только на текст.
Примером практического применения служит анализ знаменитого Рес Гестае Диви Августи – монументальной надписи, отражающей подвиги первого римского императора Августа. Модель Aeneas анализировала все главы текста отдельно, выявляя тонкие лингвистические и исторические маркеры, помогающие уточнить время и место его создания. Важным открытием стало выделение модели эпохально значимых элементов: архаичных орфографических форм, обозначений официальных титулов и дат, а также упоминаний конкретных памятников. Кроме того, Aeneas находила многочисленные параллели с другими надписями, опубликованными и сохранившимися в разных частях империи, что позволяло взглянуть на этот текст через призму взаимодействия провинциальных и центральных культурных практик. Помимо академического потенциала подобные системы способны изменять способы преподавания истории и классики.
Уже разработаны обучающие программы, которые включают работу с Aeneas, давая студентам и школьникам возможность непосредственно взаимодействовать с виртуальными моделями исторических надписей и углублять навыки аналитического мышления на основе древних текстов. Это содействует как популяризации гуманитарных наук, так и формированию цифровой грамотности в новом технологическом контексте. Несмотря на впечатляющие достижения, важно признать и существующие ограничения технологии. Объем данных для обучения остается относительно небольшим в сравнении с современными языковыми моделями, а качество изображений и разнообразие региональных и временных вариантов латинских текстов влияют на точность предсказаний. Кроме того, исторический контекст часто сложнее формализовать, чем технические параметры текста, и потому искусственный интеллект не может полностью заменить интуицию и глубокие знания специалиста.
В будущем развитие таких систем направлено на расширение мультимодальных возможностей, включение дополнительных древних языков, повышение интерактивности в общении пользователя с моделью и улучшение объяснимости решений. Особое значение имеет интеграция подобных моделей в большие диалоговые системы — что позволит не просто выдавать статистические гипотезы, но вести продуктивный научный диалог с историками, уточняя детали и обсуждая альтернативные интерпретации. Объединяя достижения современных технологий и гуманитарной науки, подходы на базе генеративных нейронных сетей не просто автоматизируют технические задачи реставрации и атрибуции, но становятся мощным инструментом перевода древней мудрости в язык современных исследований. Они способствуют более глубинному пониманию прошлого, расширяют горизонты исторической науки и поддерживают фундаментальные гуманистические усилия по сохранению культурного наследия человечества.