Институциональное принятие

Новая эпоха AI: высокопроизводительный inference-движок Uzu для Apple Silicon

Институциональное принятие
Show HN: We made our own inference engine for Apple Silicon

Узнайте о революционном высокопроизводительном inference-движке Uzu, разработанном специально для устройств на базе Apple Silicon, его особенностях, преимуществах и влиянии на индустрию искусственного интеллекта.

Развитие технологий искусственного интеллекта (AI) и машинного обучения в последние годы приобретает всё большее значение в различных сферах жизни. От голосовых помощников и систем рекомендаций до анализа данных и автоматизации производства — возможности AI растут экспоненциально. Однако для эффективного использования моделей машинного обучения на пользовательских устройствах необходимы специальные решения, оптимизированные под уникальные архитектуры железа. Одним из новейших и, безусловно, перспективных проектов в этой области стал inference-движок Uzu, разработанный командой trymirai специально для чипов Apple Silicon. Он представляет собой высокопроизводительную платформу, способную существенно повысить скорость и качество работы AI-моделей на устройствах компании Apple.

В последние годы Apple активно продвигает собственные процессорные архитектуры – M1, M2 и последующие варианты, которые сочетают в себе мощные CPU, GPU и специализированные нейронные ускорители ANE. Такой комплекс аппаратных средств открывает новые горизонты для AI-инференса непосредственно на устройствах без необходимости обращаться к облачным сервисам. Именно для использования этих преимуществ был разработан inference-движок Uzu, оптимизированный для гибридной архитектуры, где части вычислений выполняются GPU-ядрами, а части — через MPSGraph, низкоуровневый API, являющийся основой CoreML с доступом к ANE. Главная особенность Uzu – это простая в использовании, в то же время гибкая и мощная программная архитектура. Интерфейс разработчика построен так, чтобы облегчить интеграцию любых AI-моделей, облегчая параллельное использование GPU и ANE для повышения скорости вывода результата (инференса).

Акцент сделан на прозрачность вычислений и учёт единой памяти Apple-устройств, что обеспечивает высокую производительность без ущерба точности и стабильности. Более того, Uzu использует собственный формат моделей и поддерживает конвертацию множества известных архитектур с помощью инструмента lalamo, что расширяет доступный набор моделей для конечных пользователей. Опираясь на реальные замеры, Uzu показывает впечатляющие показатели производительности на Apple M2. Например, при работе с моделью Llama-3.2-1B-Instruct движок демонстрирует скорость около 35 токенов в секунду, что опережает популярный llama.

 

cpp в его Metal-интерпретации. Особенно заметна разница на более сложных моделях — где llama.cpp демонстрирует значительно меньшую скорость инференса. Это доказывает, что современный подход Uzu к гибридной вычислительной архитектуре максимально эффективно использует ресурсы Apple Silicon. Кроме того, Uzu предлагает инструментарий для запуска моделей как через высокоуровневые bindings (например, Swift и TypeScript), так и через командную строку, что делает его универсальным решением для широкого спектра разработчиков.

 

Возможность использования через Swift Package Manager облегчает интеграцию в приложения iOS и macOS, а поддержка TypeScript открывает путь для серверных и кроссплатформенных решений на Node.js. Немаловажно, что проект является open source и распространяется под MIT-лицензией, что позволяет сообществу активно участвовать в развитии, оптимизации и расширении функционала. Такой подход снижает порог входа для разработчиков и ускоряет внедрение новых моделей и алгоритмов, а прозрачность кода помогает завоевывать доверие и перспективы долгосрочного развития. Для пользователей и разработчиков, желающих испытать возможности Uzu, есть несколько способов быстро начать работу.

 

Можно использовать готовые модели, загружаемые с помощью скриптов, либо самостоятельно конвертировать необходимые архитектуры через lalamo. Все операции проводятся достаточно просто и интуитивно понятно, что особенно важно для команд, стремящихся интегрировать AI в свои проекты с минимальными затратами времени и ресурсов. Появление inference-движка Uzu особенно актуально в свете глобальной тенденции перехода ИИ на устройства пользователей — edge AI. Такая архитектура уменьшает зависимость от облачных вычислений, повышает приватность, снижает задержки в обработке данных и экономит трафик. Устройства на базе Apple Silicon, оснащённые Uzu, получают возможность выполнять тяжелые задачи машинного обучения на лету, без необходимости подключения к серверам.

Это открывает новые перспективы для мобильных приложений, а также программного обеспечения для десктопов и специализированных решений, например, в области медицины, образования, развлечений и безопасности. При сравнении с другими инструментами для запуска LLM (large language models) на локальных устройствах, Uzu выделяется своей оптимизацией под особенности macOS и iOS, учитывая специфику Metal, ANE и unified memory architecture. Многие аналогичные проекты либо недостаточно используют преимущества Apple Silicon, либо ориентируются на более универсальные платформы, что ведет к потере производительности. Стоит также отметить важность поддержки современных моделей и алгоритмов декодирования, таких как chain-of-thought parsing, которая реализована в последней версии проекта. Такие инновации позволяют развивать возможности модели по пониманию и генерации сложных логических цепочек, делая общение с AI ещё более естественным и продуктивным.

В перспективе команда разработчиков планирует расширять функциональность Uzu, добавляя поддержку новых моделей, улучшая алгоритмы оптимизации и параллелизма, а также интегрируя дополнительные API для расширенной кастомизации. В долгосрочной перспективе это позволит создать полноценную экосистему AI-инференса, оптимизированную для всех устройств Apple, которая удовлетворит потребности широкой аудитории – от энтузиастов и исследователей до крупных компаний, внедряющих передовые AI-решения. Таким образом, Uzu — это не просто еще один inference-движок, а важный шаг в развитии экосистемы искусственного интеллекта, ориентированного на мощные чипы Apple Silicon. Этот проект демонстрирует, как современные технологии могут быть адаптированы под конкретные аппаратные архитектуры, что ведёт к превышению производительности, повышению удобства и расширению функциональных возможностей. Для разработчиков, работающих с AI на macOS и iOS, Uzu открывает новые горизонты эффективной работы с языковыми моделями и другими архитектурами машинного обучения, обеспечивая скоростной и надёжный инференс прямо на устройстве без необходимости обращаться к внешним ресурсам.

В современном мире, где скорость и точность обработки данных имеют решающее значение, а приватность и автономность становятся всё более востребованными, собственный inference-движок для Apple Silicon — это бесценный инструмент для разработчиков и пользователей, позволяющий максимально раскрыть потенциал искусственного интеллекта на личных устройствах.

Автоматическая торговля на криптовалютных биржах

Далее
LSM launches insurance for EU cryptocurrency entities
Среда, 22 Октябрь 2025 Новый страховой продукт LSM для европейских крипто-компаний: революция в защите цифровых активов

Liberty Specialty Markets представила инновационное страховое решение для финансовых институтов, работающих в сфере криптовалют в Европе, обеспечивая защиту от профессиональных рисков, мошенничества и ошибок управления с лимитами до €3 млн.

Daily – Vickers Top Insider Picks for 07/15/2025
Среда, 22 Октябрь 2025 Ежедневный обзор топовых инсайдерских покупок Vickers за 15 июля 2025 года

Обзор ключевых инсайдерских сделок и топовых акций с сильной историей покупок инсайдерами, которые могут повлиять на рынок и инвестиционные решения в июле 2025 года.

JPMorgan, BlackRock Ease On Earnings. Morgan Stanley, Goldman On Deck
Среда, 22 Октябрь 2025 Финансовые гиганты США: Как отчёты JPMorgan, BlackRock, Morgan Stanley и Goldman Sachs влияют на рынок в 2025 году

Американские банки и инвестиционные компании продолжают удивлять рынки своими квартальными результатами. Анализ финансовых показателей JPMorgan, BlackRock, Morgan Stanley и Goldman Sachs помогает понять текущую динамику и перспективы фондового рынка в 2025 году.

Daily – Vickers Top Buyers & Sellers for 07/15/2025
Среда, 22 Октябрь 2025 Ежедневный обзор Vickers: крупнейшие покупатели и продавцы на 15 июля 2025 года

Подробный анализ ведущих сделок инсайдеров на рынке акций за 15 июля 2025 года, с рассмотрением ключевых секторов экономики и влияния крупных покупок и продаж на динамику фондового рынка.

Tyranna to acquire 70% stake in Angola’s Maongo copper-gold project
Среда, 22 Октябрь 2025 Tyranna расширяет горизонты: приобретение 70% доли в медно-золотом проекте Маонго в Анголе

Компания Tyranna Resources укрепляет свои позиции на мировом горнодобывающем рынке, приобретая крупную долю в перспективном медно-золотом проекте Маонго в Анголе. Это стратегическое решение направлено на развитие добычи металлов, востребованных в современных технологиях, и использование передовых методов разведки.

Checkout.com introduces direct acquiring services in Canada
Среда, 22 Октябрь 2025 Checkout.com запускает прямое эквайринг-обслуживание в Канаде: новые возможности для бизнеса

Checkout. com расширяет свое присутствие на рынке Северной Америки, запуская прямое эквайринг-обслуживание в Канаде.

 OpenSea CTO outlines token trading vision for moving beyond NFTs
Среда, 22 Октябрь 2025 OpenSea меняет игру: взгляд CTO на будущее торговли токенами вне рамок NFT

OpenSea расширяет свои горизонты, создавая мобильное приложение для торговли токенами, DeFi и интеграцией искусственного интеллекта, чтобы адаптироваться к меняющемуся рынку и новым вызовам в сфере цифровых активов.