Развитие технологий искусственного интеллекта уже не первый год прочно занимает центральное место в научных исследованиях и индустрии по всему миру. Однако, несмотря на впечатляющие достижения, многие языковые модели остаются закрытыми продуктами с ограниченным доступом к обучающим данным, архитектуре и параметрам. В этой области по-настоящему революционным стал проект Apertus - открытая, прозрачная и многоязычная языковая модель, разработанная ведущими научными учреждениями Швейцарии: Политехнической школой Лозанны (EPFL), Швейцарским федеральным техническим университетом Цюриха (ETH Zurich) и Швейцарским национальным центром суперкомпьютерных исследований (CSCS). Название модели Apertus происходит от латинского слова "открытый", и оно полностью отражает суть проекта. Здесь каждая стадия разработки - от архитектуры модели и набора весов до обучающих данных и технических рецептов - доступна для изучения, анализа и модификации.
Такой уровень открытости кардинально меняет правила игры в области искусственного интеллекта. Благодаря Apertus профессионалы, исследователи и энтузиасты могут не просто использовать готовую модель, а строить на её основе собственные решения, адаптируя её под конкретные задачи и потребности. Одним из ключевых преимуществ Apertus является обширный и сбалансированный тренировочный корпус, содержащий более 15 триллионов токенов на более чем 1000 языках. Примечательно, что около 40% данных представлены на неанглийских языках, включая такие редкие для современных моделей языки как швейцарский немецкий и романш. Это делает Apertus одной из немногих моделей на мировом рынке, по-настоящему ориентированных на многоязычность и обеспечение инклюзивности в технологическом развитии.
Доступность модели реализована двумя основными способами. Первый - через партнёрскую компанию Swisscom, которая запускает собственную платформу с возможностью использования модели как сервиса, что облегчает интеграцию для бизнеса и крупных организаций. Второй способ - это прямое скачивание через платформу Hugging Face, популярную среди разработчиков и исследователей, что позволяет легко начать работу с моделью для индивидуального использования и экспериментов. Apertus представлен в двух конфигурациях - с 8 и 70 миллиардами параметров. Меньшая модель оптимизирована для частных пользователей и проектов с ограниченными вычислительными ресурсами, сохраняя при этом высокое качество генерации и понимания текста.
Большая же версия ориентирована на масштабные задачи, требующие максимальной точности и глубины обработки информации. Разработка Apertus поддерживается широкой командой специалистов из EPFL, ETH Zurich и CSCS, что гарантирует регулярные обновления и совершенствование модели. В основе проекта лежит стремление построить доверенный и суверенный искусственный интеллект, способный служить общественным интересам и соответствовать строгим стандартам безопасности и прозрачности. Это особенно важно в эпоху, когда вопросы этики и защиты данных всё чаще становятся предметом общественного и законодательного контроля. Этические аспекты и комплаенс играют во многом решающую роль.
При формировании корпуса данных использовались исключительно публично доступные источники с учётом запросов на исключение из обучения, а также проведена тщательная фильтрация персональной информации и нежелательного контента. Кроме того, модель разработана в строгом соответствии с законодательством Швейцарии и требованиями Европейского Союза, в частности, с учётом положений нового AI Act. Особое внимание уделено не только технологии, но и тому, как Apertus может помочь укрепить цифровой суверенитет Швейцарии и Европы в целом. Примером может служить сотрудничество с Swisscom и запуск модели на их национальной AI платформе, что позволяет контролировать использование данных и обеспечивает безопасную среду для внедрения искусственного интеллекта в различные отрасли экономики. Применение Apertus многообразно.
Возможности модели подходят для создания интеллектуальных чат-ботов, систем автоматического перевода, образовательных платформ и других сервисов, требующих понимания и генерации текстовой информации. Благодаря открытому исходному коду и доступности, стартапы и исследовательские группы могут создавать инновационные продукты, не ограничиваясь лицензиями и закрытыми технологиями. Вдобавок высокая многоязычность модели обеспечивает расширение границ использования для региональных языков, что особенно важно для культурного и образовательного развития. Одним из значимых событий, которые помогут внедрить и апробировать Apertus, станут хакатоны Swiss {ai} Weeks. В рамках этих инициатив разработчикам будет предоставлен удобный интерфейс и инструменты для взаимодействия с моделью, что позволит экспериментировать, создавать прототипы и собирать обратную связь для дальнейшего улучшения.
Проект Apertus является отличным примером того, как государственные и научные институты могут совместно создавать технологии, служащие общественному благу, предотвращая чрезмерную централизацию и приватизацию ключевых AI решений. Идея "искусственного интеллекта как общественной инфраструктуры" находит здесь свое яркое воплощение, когда модель становится доступной каждой заинтересованной стороне - от университетов до коммерческих разработчиков. Перспективы развития Apertus включают расширение семейства моделей, улучшение эффективности и внедрение специализированных версий, ориентированных на конкретные отрасли, такие как юриспруденция, экология, медицина и образование. При этом приоритет сохраняется на сохранении открытости, безопасности и прозрачности используемых методов. В современном мире технологии, построенные на открытости и международном сотрудничестве, способны задавать новые стандарты и ускорять инновации.
Apertus - яркое тому подтверждение. Модель представляет собой не просто программный продукт, а целую философию подхода к развитию искусственного интеллекта, основанную на доверии, инклюзивности и уважении к культурному многообразию. Для пользователей и разработчиков, работающих в области обработки естественного языка, Apertus открывает уникальные возможности для тестирования новых идей и реализации инновационных приложений. Полный доступ к исходному коду и обучающим данным позволяет не ограничиваться лишь готовым инструментом, а активно влиять на архитектуру и поведение модели, что особенно важно в условиях растущих требований к адаптивности и этике AI. Таким образом, Apertus является важным шагом к созданию разумных, ответственных и универсальных языковых моделей, способных эффективно служить обществу, укреплять суверенитет и вдохновлять на новые достижения в области искусственного интеллекта.
Эта инициатива не только демонстрирует потенциал открытых решений, но и задаёт ориентиры для будущих разработок, стимулируя сообщество к совместной работе ради общего прогресса. .