Юридические новости

Как создать облачный GPU-ноутбук с мгновенным запуском: опыт Modal Notebooks

Юридические новости
Building a cloud GPU notebook that boots in seconds

Подробное исследование инновационных технологий и системного подхода, позволивших разработать облачный GPU-ноутбук Modal Notebooks, который запускается за считанные секунды и обеспечивает высокую производительность и удобство совместной работы в реальном времени. .

Развитие технологий искусственного интеллекта и машинного обучения ставит перед разработчиками задачи, требующие значительных вычислительных ресурсов. Облачные вычисления с поддержкой графических процессоров (GPU) становятся все более востребованными благодаря своей мощности и гибкости. Однако запуск и работа с облачными ноутбуками, особенно с GPU, зачастую сопровождаются существенной задержкой - от нескольких десятков секунд до минут. Компания Modal подошла к этой проблеме с системной точки зрения и создала решение, которое меняет представление о работе в облачной среде с GPU - Modal Notebooks, облачный GPU-ноутбук, загружающийся за несколько секунд. В данной статье рассмотрим ключевые технические решения и инновации, которые сделали возможным такой прорыв и раскрываем, как они работают на практике.

Суть проекта Modal Notebooks возникла из идеи построения высокопроизводительной и одновременно удобной в использовании онлайн среды, которая объединяет возможности Jupyter ноутбуков, современных редакторов, а также высокопроизводительные вычислительные ресурсы GPU. В отличие от традиционного подхода, где Jupyter запускается локально или на выделенных мощных серверах, Modal выбрали мультиарендный облачный формат с мгновенным доступом, устойчивостью и возможностью масштабирования. Основной задачей было убрать хотя бы часть очевидных проблем, как длительная загрузка контейнеров, управление ресурсами, хранение данных и синхронизация между пользователями. Одним из ключевых элементов архитектуры стали Modal Sandboxes - изолированные процессы с собственной файловой системой, ресурсами и жизненным циклом. Эти песочницы позволили запускать ядра Jupyter ноутбуков, поддерживающие сотни CPU и топовые Nvidia GPU без существенной задержки.

Отличие Modal Sandboxes от аналогичных систем - фокус на вычисления с высокой производительностью, возможность ленивой загрузки файловой системы (lazy-loading) и использование системы, которая загружает лишь необходимые в момент выполнения данные. Благодаря этому ноутбуки работают на мощном оборудовании, но при этом запускаются мгновенно. Одним из самых больших узких мест в стандартных Docker или Kubernetes окружениях была загрузка тяжелых образов. В среднем разворачивание 8 ГБ образа на Python/ML занимает порядка минуты, что крайне негативно сказывается на интерактивности. Modal реализовали уникальную ленивую загрузку контейнерных образов через FUSE файловую систему, написанную на Rust.

 

Вместо того чтобы загружать все файлы сразу, система подгружает только метаданные и "монтирует" файловую систему, а фактические данные считываются по мере обращения к ним приложением. Для ускорения доступа используется многоуровневый кэш, включающий память, локальные SSD, региональные CDN и облачное хранилище. Такой подход существенно снижает время запуска контейнера и улучшает пользовательский опыт. Параллельно была решена задача эффективного распределения вычислительных ресурсов. Modal имеет общий пул с тысячами CPU и многими современными GPU (например, Nvidia H100 и B200), из которого по запросу выделяются нужные мощности.

 

Планировщик системно балансирует нагрузку и обеспечивает моментальные запуски контейнеров даже при высоких требованиях к ресурсам. Для экономии средств и оптимизации затрат реализована функция автоматической паузы неактивных ядер, что позволяет приостановить работу крупного экземпляра без потери данных и быстро возобновить её у пользователя, создавая illusion постоянной машины без постоянных расходов. Большое внимание было уделено вопросам хранения данных. Современные AI и ML сценарии требуют глобального, доступного и быстрого персистентного хранилища, поскольку задачи обычно распределены и выполняются на разнородном оборудовании по всему миру. Modal использует VolumeFS - собственную FUSE-файловую систему, построенную на распределённой сети хранения с большими объёмами данных и моделью eventual consistency.

 

VolumeFS позволяет файловым структурам сохранять целостность и оставаться максимально быстрыми в глобальном контексте. Пользователь работает с файлами, словно с локальными, но при этом может запускать вычисления где угодно в мире и иметь доступ к своим данным без задержек. Для реализации возможности коллективной и синхронной работы с ноутбуками Modal создал собственный слой реального времени на базе протокола оперативного преобразования (operational transformation). В качестве основы выбрана библиотека Rushlight, интегрированная с CodeMirror 6 - современным редактором кода. Редакторы пользователей синхронизированы через Redis Streams, редактор отображает курсоры и изменения других участников, поддерживая одновременную работу нескольких пользователей без конфликтов.

Такой подход обеспечивает плавность взаимодействия и дает возможность выполнять код совместно, видеть результаты и обмениваться идеями мгновенно. Особое внимание разработчики уделили отделению состояния редактирования от состояния выполнения. Это значит, что результаты вычислений - вывод ячеек, графики, медиа - выводятся в реальном времени, но при повторном подключении можно получить актуальное состояние с сервера, сохраняя целостность данных. Крупные артефакты сохраняются во внешнем объектном хранилище, что помогает сохранять быстродействие редактора и снижает нагрузку на коммуникационные каналы. Чтобы повысить удобство разработчиков, Modal интегрировали в редактор полноценную поддержку Language Server Protocol с помощью Pyright для Python, что дало автодополнение, подсказки по API, подсветку синтаксиса и даже AI-подсказки.

Интеграция с Ruff обеспечивает автоматическое форматирование кода прямо в браузере через WebAssembly версии инструмента. AI-помощник на базе Claude 4 дает предложения по следующему редактированию, а эксперименты с собственным хостингом моделей Zed на GPU открывают перспективы еще более тесной интеграции машинного интеллекта с разработкой. В результате Modal Notebooks - это не просто обыкновенный облачный ноутбук, а полнофункциональная высокопроизводительная среда для разработки с поддержкой самых современных технологий. Пользователь получает мгновенный старт среды с быстрым доступом к GPU, коллаборативное редактирование в реальном времени, грамотное управление ресурсами и данных, а также удобный и современный редактор с поддержкой AI и LSP. Для практических пользователей это означает возможность создать эффективный исследовательский или производственный pipeline всего за считанные минуты, не переживая о загрузках образов или выделении дорогостоящих серверов на весь период работы.

Подобный уровень комфорта ускоряет эксперименты и выводит процесс разработки на новый уровень. Будущее таких платформ - в расширении возможностей интеграции с разнообразными облачными сервисами, более интеллектуальном управлении ресурсами и еще более глубокой коллаборации, которая стирает границы между локальным и удалённым разработчиком. Modal Notebooks уже сегодня задают высокие стандарты работы с облачными вычислениями на GPU и показывают, как должно выглядеть эффективное и удобное решение для инженеров и исследователей в эпоху искусственного интеллекта. .

Автоматическая торговля на криптовалютных биржах

Далее
DNA-Edited Wheat Promotes Soil Bacterial Nitrogen Fixation, Increases Yields
Суббота, 10 Январь 2026 Генетически модифицированная пшеница повышает фиксацию азота в почве и увеличивает урожай

Инновационные разработки в области редактирования ДНК пшеницы способствуют улучшению азотного цикла в почве через стимуляцию бактерий, что приводит к значительному росту урожайности зерновых культур при снижении использования азотных удобрений. .

Easier Postgres fine-tuning with online_advisor
Суббота, 10 Январь 2026 Упрощённая оптимизация PostgreSQL с помощью расширения online_advisor

Раскрытие возможностей расширения online_advisor для автоматического анализа рабочих нагрузок PostgreSQL и повышения производительности баз данных с помощью интеллектуальных рекомендаций по индексам, статистике и подготовленным выражениям. .

Insider Trading Is Not About Fairness
Суббота, 10 Январь 2026 Инсайдерская торговля: почему вопрос не в честности, а в регулировании рынка

Обсуждение инсайдерской торговли с акцентом на её природу и влияние на финансовые рынки, раскрывающее причины ограничений и рассуждения о роли справедливости в инвестиционном процессе. .

Credit scores drop at fastest pace since the Great Recession
Суббота, 10 Январь 2026 Резкое падение кредитных рейтингов в США: причины и последствия первого масштаба со времен Великой рецессии

В условиях экономической нестабильности и возобновления выплат по студенческим кредитам американские заемщики сталкиваются с самым стремительным снижением кредитных рейтингов за последние годы, что отражает растущее финансовое неравенство и давление на молодое поколение. .

A 10KB game with vanilla JavaScript HTML canvas
Суббота, 10 Январь 2026 Создание мини-игры объемом 10KB на чистом JavaScript с использованием HTML Canvas

Изучите процесс разработки компактной и эффективной игры размером всего 10KB, созданной с помощью ванильного JavaScript и HTML Canvas. Узнайте о ключевых техниках оптимизации кода, способах управления графикой и взаимодействии с пользователем для достижения наилучших игровых впечатлений при минимальном объеме.

SQL performance improvements: finding the right queries to fix
Суббота, 10 Январь 2026 Оптимизация производительности SQL: как выявить запросы, требующие улучшения

Эффективная работа с базами данных является ключом к быстродействию современных приложений. Правильный подход к выявлению медленных и ресурсоёмких SQL-запросов позволяет существенно улучшить производительность системы и снизить нагрузку на серверы.

The official 2025 Go Developer Survey is live
Суббота, 10 Январь 2026 Официальный опрос разработчиков Go 2025: ключевые моменты и перспективы развития

Обзор и анализ официального опроса разработчиков Go 2025 года, раскрывающий важные тенденции, особенности и влияние на сообщество Go-разработчиков по всему миру. .