Цифровое искусство NFT

Stanford Marin: Первая полностью открытая модель на базе JAX, меняющая будущее ИИ

Цифровое искусство NFT
Stanford's Marin model: The first open model developed using Jax

Подробный обзор Marin — первой полностью открытой фундаментальной модели Stanford, разработанной с использованием JAX. Узнайте о ключевых технологиях, инновациях и значении полного открытого доступа в развитии искусственного интеллекта.

В эпоху стремительного развития искусственного интеллекта фундаментальные модели приобретают всё большую популярность и оказывают влияние на множество отраслей. Stanford CRFM (Center for Research on Foundation Models) представил проект Marin — первую полностью открытую модель, созданную с использованием JAX, которая призвана изменить представление о транспарентности и научной воспроизводимости в области ИИ. Этот проект отличается не только выпуском самой модели, но и полным открытием всего процесса разработки — включая исходный код, датасеты, методологии, гиперпараметры и логи обучения. Подобный уровень прозрачности предоставляет исследователям уникальную возможность глубоко анализировать, воспроизводить и улучшать результаты, что значительно повышает доверие к ИИ и открывает новые перспективы для научных исследований и индустриальных приложений. Одной из главных технологических основ Marin является использование JAX — библиотеки, разработанной Google, которая сочетает высокую производительность с удобством масштабирования.

JAX позволяет компилировать сложные вычислительные цепочки в эффективный машинный код, значительно повышая скорость и уменьшая накладные расходы при обучении больших моделей на таких устройствах, как TPU и GPU. Однако создание полностью воспроизводимой фундаментальной модели потребовало решения масштабных инженерных задач. Команда Stanford CRFM разработала новый фреймворк под названием Levanter, который обеспечивает битовую воспроизводимость, распределённую обработку и устойчивость к сбоям. Технически Levanter уходит гораздо дальше, чем просто оптимизация кода — он связывает процессы обучения, обработки данных и распределённого вычисления, что делает возможным управление огромными кластерами TPU с высокой надежностью и эффективностью. Одной из ключевых проблем при обучении таких моделей является высокая вычислительная стоимость и необходимость быстро выполнять циклы обучения.

При этом использование традиционных интерпретируемых языков может приводить к значительным задержкам и нагрузкам на память. Levanter с помощью JAX устранил эти проблемы путем объединения всех этапов обучения в единый оптимизированный процесс, используя функциональность @jax.jit. Это снижает издержки, позволяя эффективно использовать аппаратные ресурсы и ускорять итерации обучения. Масштабирование на тысячи ускорителей требует аккуратного управления разделением модели и данных, а также эффективной коммуникации между устройствами.

Современные примитивы JAX позволяют автоматически осуществлять параллельное выполнение и оптимизировать обмен информацией между TPU, минимизируя простои. Для упрощения кода и повышения его читаемости в Levanter внедрена библиотека Haliax с именованными тензорами, что значительно облегчает поддержку и модификацию распределённых стратегий без глубокого погружения в технические детали. Ещё одним значимым аспектом проекта стало использование Google Cloud TPU Multislice и технологии Ray для гибкого формирования вычислительных кластеров из множества небольших TPU-срезов. Это позволило максимально эффективно управлять ресурсами, снижая стоимость и повышая устойчивость к прерыванию тренировок — критично для крупных масштабных экспериментов. Стремление к полной научной прозрачности потребовало обеспечить воспроизводимость результатов вне зависимости от аппаратной конфигурации и времени запуска.

JAX, благодаря детерминированным генераторам случайных чисел и контролю неизменности вычислений, позволил добиться бит-за-бит воспроизводимости, что является редким и значимым достижением в мире больших моделей. Для загрузки данных была применена система на базе Tensorstore, дающая детерминированный случайный доступ к батчам, что упрощает анализ и интерпретацию поведения модели в процессе обучения. Архитектура Marin-8B — это трансформер в стиле LLaMA, который прошёл через сложный многократный процесс обучения, включающий более 12 триллионов токенов, использование разнообразных датасетов и неоднократные изменения гиперпараметров и аппаратной платформы. Такой «живой» и адаптивный подход к обучению хорошо отражает реальные вызовы и возможности современных исследований ИИ, демонстрируя гибкость и мощь инструментов JAX и Levanter. Открытый характер проекта делает его идеальной платформой для сообщества исследователей и разработчиков, желающих внести свой вклад в развитие фундаментальных моделей с максимальным уровнем доверия и воспроизводимости.

Благодаря размещению исходных моделей, кода и обучения в открытом доступе на Hugging Face и GitHub, а также поддержке активной дискуссии в Discord, Marin становится центром притяжения для тех, кто ценит полностью прозрачный подход к ИИ. Проект несёт ключевой месседж: открытость не ограничивается лишь «открытым исходным кодом» или моделью, но распространяется на весь научный путь, от данных до экспериментов и обучения. Это задает новый стандарт и вдохновляет на совместное создание надежных и эффективных инструментов для будущего ИИ. Marin — не просто технологический прорыв, это новый формат сотрудничества и научной честности, который уже сегодня определяет будущее искусственного интеллекта. Он демонстрирует, что возможно создание масштабных, высокопроизводительных и полностью воспроизводимых моделей с открытым доступом, что открывает двери для более быстрого и масштабного прогресса в исследовательской и прикладной сферах.

Если вы заинтересованы в изучении и использовании передовых фундаментальных моделей с полным доступом ко всем этапам развития, Marin предоставляет все необходимые ресурсы и поддержку для успешной работы, обеспечивая платформу для инноваций и открытого сотрудничества в быстро меняющемся мире искусственного интеллекта.

Автоматическая торговля на криптовалютных биржах Покупайте и продавайте криптовалюты по лучшим курсам Privatejetfinder.com (RU)

Далее
More advanced AI capabilities are coming to Search
Суббота, 25 Октябрь 2025 Новые возможности искусственного интеллекта в Поиске: революция в работе с информацией

Глубокое погружение в инновационные функции Google Поиска с интеграцией передовой модели Gemini 2. 5 Pro и новой технологии Deep Search, которые преобразуют процесс поиска и работы с данными, делая его быстрее, точнее и эффективнее для пользователей и бизнеса.

How Generative AI's 'Deepfake Economy' Is Hobbling Small Businesses
Суббота, 25 Октябрь 2025 Как генеративный ИИ и экономика дипфейков подрывают малый бизнес

Генеративный искусственный интеллект становится мощным инструментом, но наряду с преимуществами он несет новые риски. Экономика дипфейков наносит серьезный ущерб малому бизнесу, который уязвим перед мошенническими схемами и атаками, способными разрушить репутацию и финансовое состояние компаний.

Shiba Inu Price Prediction: 3 Trillion SHIB Volume Vanishes – Is SHIB Going to $0?
Суббота, 25 Октябрь 2025 Прогноз цены Shiba Inu: исчезновение 3 триллионов SHIB и перспектива падения до нуля

Анализируя недавние изменения объёмов торгов Shiba Inu и основные технические индикаторы, можно оценить перспективы мем-монеты на фоне текущих экономических условий и тенденций рынка криптовалют.

1 in 5 Steam games released in 2025 use gen AI, up nearly 700% year-on-year
Суббота, 25 Октябрь 2025 Взрывное распространение генеративного ИИ в играх на Steam в 2025 году

Рост использования генеративного ИИ в играх на Steam достиг рекордных показателей в 2025 году. Все больше разработчиков интегрируют ИИ в создание графики, музыки и игровых механик, что меняет ландшафт индустрии видеоигр.

Amazon Bedrock AgentCore
Суббота, 25 Октябрь 2025 Amazon Bedrock AgentCore: Революция в создании и управлении AI-агентами нового поколения

Узнайте о ключевых возможностях Amazon Bedrock AgentCore, который обеспечивает безопасное, масштабируемое и эффективное развертывание AI-агентов. Разберитесь, как данный сервис помогает разработчикам быстро внедрять интеллектуальные решения с поддержкой современных технологий и высокой степенью надежности.

Drones, AI and Robot Pickers: The Fully Autonomous Farm
Суббота, 25 Октябрь 2025 Беспилотные технологии и искусственный интеллект: путь к полностью автоматизированной ферме

Развитие дронов, искусственного интеллекта и робототехники кардинально меняет сельское хозяйство, открывая новые горизонты для автоматизации и повышения эффективности производств. Автоматизированные фермы становятся реальностью, где роботы и умные системы берут на себя ключевые операции, минимизируя человеческий труд и увеличивая урожайность.

Show HN: Achieves Perfect 100 Score Across 6 Leading AI Model Evaluations
Суббота, 25 Октябрь 2025 Искусственный интеллект нового поколения: как TXT-Blah Blah Blah достиг идеальных 100 баллов в шести ведущих AI-оценках

Открывая новые горизонты в мире искусственного интеллекта, платформа TXT-Blah Blah Blah демонстрирует выдающиеся результаты, получая максимальные оценки сразу от шести ведущих AI-моделей. Узнайте, что стоит за этим прорывом, как работает технология и почему она вызывает интерес инженеров и исследователей по всему миру.