В 2025 году Apple представила новаторский технический отчет, посвященный фундаментальным языковым моделям Apple Intelligence Foundation, которые уже меняют представление о том, как искусственный интеллект интегрируется в повседневную жизнь пользователей устройств Apple. Эти модели призваны значительно повысить качество и эффективность функций, обеспечиваемых искусственным интеллектом, в экосистеме Apple, охватывая широкое разнообразие применений — от обработки естественного языка до понимания изображений и выполнения сложных инструментальных команд. Первое, что привлекает внимание — наличие двух ключевых моделей, разработанных под разные сценарии использования. Во-первых, это компактная многозадачная он-устройственная модель с примерно тремя миллиардами параметров, созданная специально для оптимальной работы на чипах Apple Silicon. Во-вторых, масштабируемая серверная модель, которая использует инновационный архитектурный подход Parallel-Track Mixture-of-Experts (PT-MoE), что обеспечивает баланс между производительностью и затратами на вычислительные ресурсы через особую схему распределенного параллелизма и разреженных экспертных вычислений.
Он-устройственная модель представляет собой революционное решение, нацеленное на низкое энергопотребление и высокую скорость отклика при работе непосредственно на устройстве пользователя, без необходимости постоянного подключения к облаку. В ней применяются архитектурные новшества, такие как совместное использование кэш-памяти ключей и значений (KV-cache sharing) и обучение с учетом 2-битной квантования, что позволяет уменьшить требования к памяти и ускорить вычисления без потери качества. Серверная модель на базе PT-MoE применяется на платформе Private Cloud Compute Apple и ориентирована на работу с масштабными задачами, где важна высокая точность и поддержка множества языков и типов данных. Благодаря сочетанию параллельных треков, методом mixture-of-experts и комбинированному глобально-локальному вниманию, модель эффективно распределяет вычислительные нагрузки и реализует глубокое понимание как текста, так и изображений. Обучение обеих моделей происходило на крупных мультилингвальных и мультимодальных датасетах, собранных ответственным веб-краулингом, лицензионными корпусами и высококачественными синтетическими данными.
Помимо основного этапа обучения применяется дообучение с использованием методов обучения с подкреплением и контролируемого дообучения, что повышает адаптибельность и точность моделей в реальных сценариях использования. Apple также представила Swift-ориентированную инфраструктуру Foundation Models framework, позволяющую разработчикам легко интегрировать возможности генерации контента, точного вызова инструментов и тонкой настройки моделей с помощью LoRA-адаптеров. Это существенно расширяет возможности приложений в экосистеме Apple и ускоряет процесс внедрения искусственного интеллекта в новые продукты и сервисы. Важным аспектом развития данных моделей стала философия ответственного искусственного интеллекта (Responsible AI), которая внедрена на всех этапах — от создания датасетов до финального тестирования. Специальные механизмы фильтрации контента, локализованные процессы оценки и защита пользовательских данных через платформу Private Cloud Compute служат гарантией безопасности и уважения приватности пользователей Apple.
Технические детали и архитектурные инновации, раскрытые в техотчете 2025 года, демонстрируют видение Apple по созданию интеллектуальных систем будущего, способных не просто выполнять команды, но и адаптироваться к контексту пользователя, обеспечивая персонализированный и интуитивно понятный опыт взаимодействия. Благодаря таким моделям улучшается качество распознавания речи, генерация и понимание естественного языка, повышается точность систем рекомендаций и способность к креативному взаимодействию с пользователем. Новые языковые модели Apple стали важным шагом вперед в развитии искусственного интеллекта как на уровне устройства, так и облачных сервисов. Они делают использование технологий более органичным и безопасным, при этом сохраняя высокую производительность и качество. Хорошо оптимизированные он-устройственные решения обеспечивают быструю работу без задержек и зависимости от сети, а серверные модели отвечают за масштабируемость и сложные вычислительные задачи.