NVIDIA, мировой лидер в области ускоренных вычислений, в марте 2025 года представила семейство искусственного интеллекта Llama Nemotron – открытых моделей с возможностями высокого уровня рассуждения. Эти модели спроектированы специально для разработчиков и предприятий, чтобы дать им основание для создания современных агентных AI-платформ, способных эффективно работать самостоятельно или совместно в командах для решения комплексных бизнес-задач. Семейство Llama Nemotron построено на базе моделей Llama от Meta и прошло расширенную постобучающую оптимизацию, которая значительно повысят их точность в многократных вычислительных шагах, кодировании, принятии решений и логическом рассуждении. NVIDIA заявляет об улучшении точности моделей до 20% в сравнении с базовым вариантом и увеличении скорости инференса в пять раз по сравнению с иными открытыми решениями в своей категории. Подобные показатели позволяют компаниям не только обрабатывать более сложные задачи, но и значительно снижать операционные издержки, связанные с внедрением искусственного интеллекта.
Одним из ключевых преимуществ новых моделей стала гибкость для предприятий, которая достигается благодаря открытому доступу к инструментарию, наборам данных и методам постобучения, использованным для создания Llama Nemotron. Разработчики могут настроить модели под конкретные задачи и отрасли, что открывает новые горизонты для кастомизации и интеграции AI в бизнес-процессы. Важную роль в развитии и продвижении технологии NVIDIA сыграли партнерские компании, работающие в числе лидеров рынка платформ агентного искусственного интеллекта. Среди партнеров – такие гиганты как Microsoft, SAP, ServiceNow, Accenture, Deloitte, CrowdStrike и другие, которые совместно с NVIDIA внедряют Llama Nemotron в свои продукты и решения. Microsoft интегрирует новые модели в Azure AI Foundry, расширяя возможности облачной платформы AI для корпоративных клиентов и усиливая функциональность служб на основе AI, в том числе Azure AI Agent Service в Microsoft 365.
SAP использует Llama Nemotron для совершенствования корпоративных AI-инструментов, в том числе для развития своего AI-копилота Joule, что значительно повышает точность завершения кода и эффективность взаимодействия пользователя с AI. ServiceNow и Accenture также активно интегрируют возможности Llama Nemotron в свои платформы, автоматизируя и оптимизируя комплексные бизнес-процессы. Кроме того, Deloitte разрабатывает с помощью новых моделей сложные AI-агенты, которые способны эмулировать человеческое принятие решений, обладая глубокими знаниями в различных отраслях и обеспечивая прозрачность в работе AI. В состав экосистемы NVIDIA AI Enterprise входят не только сами модели, но и программные инструменты, которые значительно упрощают создание, развертывание и масштабирование агентных AI-систем. К их числу относятся микросервисы NVIDIA NIM, оптимизированные для сложных приложений с активным обучением и моментальной адаптацией к меняющимся условиям.
Набор инструментов NVIDIA AI-Q Blueprint позволяет предприятиям интегрировать интеллектуальные агенты с корпоративными знаниями, создавая инфраструктуру, где AI может автономно воспринимать информацию, делать выводы и принимать решения. Для поддержки непрерывного обучения и обратной связи AI используется специальный набор микросервисов NVIDIA NeMo, который формирует надежный цикл обновления данных и моделей. Благодаря открытости и совместимости с решениями от Meta, Microsoft и Mistral AI данные инструменты создают благоприятные условия для развития уникальных решений на базе искусственного интеллекта. Важное значение имеет разнообразие моделей Llama Nemotron, которые представлены в трех вариантах: Nano, Super и Ultra. Каждый из них оптимизирован под разные сценарии использования и потребности клиентов.
Nano обеспечивает наивысшую точность на ПК и устройствах периферии, что открывает возможности для внедрения AI в краевых вычислительных системах. Super балансирует между точностью и пропускной способностью, идеально подходя для единого GPU. Ultra ориентирован на максимальную точность и мощность, работая на многосерверных архитектурах с несколькими GPU, что легко масштабируется для крупных предприятий с высоким уровнем вычислительных нагрузок. NVIDIA обеспечивает доступ к моделям Nano и Super через хостинговый API на платформе build.nvidia.
com и Hugging Face. Это позволяет разработчикам бесплатно тестировать и использовать их для исследований, выступая стимулом для ускоренного распространения и разработки кастомных решений на базе Llama Nemotron. Продакшн-версия микросервисов доступна в составе NVIDIA AI Enterprise для внедрения в дата-центры и облачные инфраструктуры. Ожидается, что и модели Ultra, и микросервисы NVIDIA NeMo будут доступны в ближайшее время, что расширит спектр доступных инструментов для агентных AI-систем. Представленные решения NVIDIA соответствуют современным требованиям и вызовам бизнеса, стремящегося к цифровой трансформации.
Высокая точность, скорость работы, адаптивность и открытость делают семейство моделей Llama Nemotron универсальным инструментом для компаний, которые хотят внедрять передовые AI-технологии с фокусом на устойчивость, производительность и инновации. Благодаря сотрудничеству с мировыми лидерами отрасли и поддержке активного сообщества разработчиков, NVIDIA продолжает укреплять свои позиции в искусственном интеллекте, способствуя развитию агентных платформ следующего поколения. Перспективы применения Llama Nemotron охватывают широкий спектр задач – от оптимизации бизнес-процессов в корпоративной среде до разработки интерактивных AI-агентов, способных принимать комплексные решения без постоянного контроля человека. Таким образом, семейство OpenReasoning Nemotron открывает новую эру в развитии искусственного интеллекта для бизнеса, предлагая мощные инструменты, которые доступны для модификации и адаптации под любые корпоративные задачи.