Изучение древних текстов всегда было одним из ключевых направлений исторической науки. Надписи на камне, бронзе и других материалах служат бесценным источником сведений о жизни, культуре и языках давно исчезнувших цивилизаций. Однако чтение и интерпретация этих надписей связаны с огромными трудностями: со временем части текста утрачиваются, исследователям приходится восстанавливать пропуски, а также пытаться датировать и локализовать артефакты. Традиционные методы требуют высокой квалификации, долгих часов изучения и сопоставления материалов из различных источников. В последние годы роль искусственного интеллекта в гуманитарных науках стала стремительно расти, открывая новые методы и инструменты для работы с историческими текстами Одним из наиболее впечатляющих достижений этой тенденции стал проект Aeneas — генеративная нейросеть, разработанная специально для эпиграфики латинских надписей.
Она символично названа в честь героя древнеримской мифологии Энея, который, блуждая, искал путь к основанию будущего Рима. Аналогично, нейросеть помогает историкам находить параллели между текстами, восстанавливать отсутствующие фрагменты и помещать надписи в исторический контекст, определяя место и время их происхождения. Aeneas сочетает текстовый и визуальный ввод, что позволяет учитывать не только содержание надписи, но и её физическую форму, структуру и особенности исполнения. Для обучения Aeneas был создан уникальный корпус — Latin Epigraphic Dataset (LED), объединивший крупнейшие доступные базы данных латинских надписей. Это 176 861 надпись с текстовым содержимым и метаданными, охватывающими территорию от Британии до Месопотамии и периоды с VII века до н.
э. до VIII века н.э. Несмотря на масштаб, лишь приблизительно 5% текстов снабжены изображениями, что накладывает определённые ограничения, но всё же позволяет нейросети использовать визуальные признаки при анализе. Архитектура Aeneas построена на основе трансформера T5, адаптированного для обработки символов без перехода на уровень слов.
Такой подход особенно важен для латинских надписей с их характерными сокращениями, формами и грамматикой. При этом нейросеть способна восстанавливать пропуски неизвестной длины — задачу, которая до сих пор оставалась нерешённой для древних языков. Важной особенностью модели является возможность сопровождения выводов визуальными картами внимания (saliency maps), которые показывают, на какие части текста или изображения нейросеть обратила основное внимание при принятии решения. Главная инновация Aeneas связана с механизмом контекстуализации — созданием векторных представлений (эмбеддингов) надписей, которые отражают не только текстовую схожесть, но и исторический контекст. Это позволяет находить параллельные надписи, имеющие сходные функции, культуру или эпоху, что значительно расширяет горизонты исследования.
Благодаря такой способности нейросеть становится мощным помощником для историка, который теперь может получать релевантные аналоги для каждого фрагмента, ускоряя процесс интерпретации и снижая субъективность выводов. Эффективность Aeneas была подтверждена в масштабном исследовании с участием 23 эпиграфистов разного уровня квалификации. У специалистов были задания на восстановление текста, определение места написания и времени создания надписей — сначала без, затем с помощью параллелей, найденных нейросетью, и, наконец, с её предсказаниями. Результаты демонстрировали существенное повышение производительности и уверенности историков в своих выводах при поддержке ИИ. Особенно отмечается, что синергия между человеком и машинным интеллектом превышала эффективность каждого по отдельности, показывая потенциал для интеграции искусственного интеллекта в ежедневную научную практику.
Одним из примеров реального применения стал анализ знаменитой римской надписи Res Gestae Divi Augusti — "Деяния божественного Августа". Эта монументальная запись сложна для датировки и понимания из-за множественности версии состава и копий. Aeneas не только справился с задачей, предоставляя предположительную дату создания, но и выявил характерные лингвистические и культурные признаки, такие как архаизмы и ссылки на конкретные исторические события, что соответствует мнению экспертов-историков. В другой иллюстрации возможностей нейросети выбран алтарь, посвящённый богиням Aufaniae в провинции Германская Верхняя Германия. Nейросеть правильно восстановила повреждённые места надписи, оценила её дату и географическое происхождение, а также обнаружила тесно связанные параллелы из соседних регионов.
Такие связи были выявлены не по прямым текстовым совпадениям, а благодаря сложному учёту исторического контекста, что позволяет делать выводы о культуре и религиозной практике провинций Римской империи. Несмотря на значительные успехи, стоит признать и некоторые ограничения Aeneas. Размер корпуса LED, хотя и впечатляет по меркам древней эпиграфики, остаётся малым в сравнении с современными текстовыми данными для нейросетей. Эта недостаточность составляет препятствие для более глубокого понимания малоизученных регионов и очень редких феноменов. Особую сложность создаёт неравномерное распределение данных по времени и территории, что приводит к вариативности точности в различных случаях.
Одновременно только 5% надписей имеют изображения, и их качество не всегда оптимально, что снижает потенциал использования мультимодальности. Также нельзя не отметить этический аспект применения ИИ в гуманитарных исследованиях. ИИ — лишь вспомогательный инструмент, который не заменяет специалистов, не корректирует субъективные трактовки и не создаёт историческую правду. Опасность заключается в чрезмерном уповании на ИИ и возможном закреплении исторических предубеждений, заложенных в обучающих данных или отражающих современные искажения знаний. В этой связи важнее всего корректный дизайн исследований, прозрачность методов и взаимодействие экспертов с ИИ в рамках критического анализа.
Педагогический потенциал Aeneas также заслуживает внимания. В сотрудничестве с образовательными учреждениями разработаны курсы и учебные программы для школьников и преподавателей, в которых AI-сервисы используются как познавательный и развивающий элемент. Такой подход способствует расширению цифровых компетенций, формированию навыков критического мышления и повышению интереса к древней истории и лингвистике. В перспективе развитие технологий позволит интегрировать возможности Aeneas в более масштабные языковые модели с диалоговым интерфейсом, повысить качество и стандартизацию данных, расширить мультимодальность и охват языков. Благодаря междисциплинарному сотрудничеству историков и специалистов по искусственному интеллекту потенциал глубокого анализа археологических и лингвистических материалов будет реализован ещё более полно.
Это приводит к сдвигу парадигмы: от одиночной экспертной работы к совместному интеллекту, объединяющему богатство человеческих знаний и вычислительную мощь машин. Нейросети, подобные Aeneas, превращаются в неотъемлемый элемент цифровой гуманитаристики — они не только автоматизируют рутинные процессы, но и выявляют ранее незаметные связи между культурными артефактами, открывая новые пути к пониманию прошлого. С влиянием искусственного интеллекта меняется и само восприятие исторических источников — теперь древние надписи можно рассматривать в контексте обширных сетей смыслов и функций, подтверждённых и расширенных вычислительной мощью современных технологий. Таким образом, развитие генеративных нейросетей открывает захватывающие возможности не только для традиционных эпиграфистов, но и для всех, кто стремится к более глубокому пониманию истории и культуры человечества.