Система NERSC-10, именуемая «Doudna» в честь выдающегося биохимика Дженнифер Доудны, представляет собой очередной шаг в эволюции национальных суперкомпьютерных центров США. Этот проект воплощает современные тенденции слияния традиционных высокопроизводительных вычислений (HPC) с мощностями искусственного интеллекта (AI). В центре внимания оказывается не просто увеличение объёмов вычислительных операций, но и интеграция вычислительных ресурсов с научными экспериментальными комплексами, что открывает новые горизонты для исследовательских инфраструктур. Исторически NERSC (Национальный центр научных вычислений) с момента своего основания в 1974 году имел тесную связь с исследованиями в области термоядерного синтеза, и развитие суперкомпьютеров в рамках этого центра всегда было направлено на поддержание самых сложных и точных научных задач. Однако в мире, где искусственный интеллект становится движущей силой технологического прогресса, HPC вынужден адаптироваться к новым требованиям.
«Doudna» — яркий пример этого процесса трансформации. Одной из ключевых особенностей NERSC-10 стало стратегическое решение о выборе Dell в качестве генерального подрядчика и Nvidia в роли основного поставщика процессоров и графических ускорителей, а также высокоскоростной сетевой инфраструктуры на базе Quantum 2 InfiniBand со скоростью 800 Гбит/с. Этот выбор вызвал немалый интерес и обсуждения в профессиональных кругах, учитывая, что на предыдущих этапах крупные федеральные суперкомпьютерные системы поставлялись в основном Hewlett Packard Enterprise (HPE). Dell, хотя и менее традиционная компания в сегменте суперкомпьютеров, получила возможность возглавить реализацию амбициозного проекта NERSC-10 благодаря своей зрелой производственной базе и совместной работе с Nvidia, обеспечивающей аппаратное ядро системы — современные CPU «Vera» и GPU «Rubin». Эта коллаборация отражает изменения баланса сил в индустрии HPC, где Nvidia выступает не просто как производитель ускорителей, но и как интегратор комплексных решений.
Технический потенциал «Doudna» впечатляет не только с точки зрения пиковой производительности, но и с учётом энергоэффективности и архитектурных инноваций. Система будет потреблять не более 20 мегаватт и займет около 4784 квадратных футов, что демонстрирует рост вычислительной плотности и повышение требований к охлаждению, предположительно на основе жидкостных технологий. Это характерно для современных суперкомпьютерных решений, интегрирующих в себя передовые методы управления теплом для обеспечения стабильной работы. Бюджет проекта в диапазоне от 250 до 300 миллионов долларов США представляет собой существенное увеличение в сравнении с предыдущими системами, такими как Perlmutter, при этом покупка большего количества вычислительных ресурсов FP64 остаётся в тени в пользу смешанной точности вычислений, отвечающей нуждам как HPC, так и AI. Такая трансформация обусловлена изменениями архитектур GPU, где традиционные 64-битные операции уступают место операциям с более низкой точностью во имя эффективности и скорости обработки данных.
Перспективы производительности «Doudna» обещают значительный прирост в сравнении с нынешним поколением. По прогнозам, новая система обеспечит ускорение рабочих нагрузок на уровне около десятикратного значения, при этом прирост для AI-приложений может достигать 30 раз, а для «классических» HPC — порядка трёх раз. Такой баланс свидетельствует о попытках создать универсальную платформу, способную эффективно работать с различными научными и инженерными задачами. Интеграция с научными экспериментальными центрами становится ключевой особенностью будущей вычислительной инфраструктуры. «Doudna» позиционируется не просто как суперкомпьютер, а как часть комплексной исследовательской экосистемы, взаимосвязанной с экспериментальными установками, такими как телескопы, секвенаторы генома и лучевые лаборатории.
Для этого важно обеспечить качественное и своевременное прохождение данных, что требует продуманной архитектуры сетевого взаимодействия и программируемости, позволяющей адаптировать потоки данных и вычислительные ресурсы под задачи конкретного эксперимента. Такие подходы меняют традиционные представления о HPC, превращая суперкомпьютеры в цифровые научные инструменты с расширенными возможностями взаимопроникновения. Рассматривая бюджет и цену оборудования, стоит отметить высокую стоимость новых GPU Nvidia Rubin R200, которые могут стоить до 60 тысяч долларов за штуку. Учёные и инженеры должны оптимизировать использование доступных ресурсов, учитывая экономическое бремя и энергетические ограничения, что вкупе с изменениями в архитектуре приводит к необходимости адаптации алгоритмов и программного обеспечения для эффективной работы в смешанной точности. «Doudna»– это не просто про цифры и мощность, это вызов всей HPC-общине — необходимость переосмысления подходов к вычислениям, когда классические методы уступают место гибридным, сочетающим высокоточные и низкоточные вычисления, а ИИ становится неотъемлемой частью научного процесса.
В то время как коммерческие гипермасштабные ИИ-кластеры насчитывают сотни тысяч GPU и стоят миллиарды долларов, федеральный суперкомпьютер NERSC-10 призван реализовать релевантные научные задачи в условиях ограниченного бюджета с максимальной отдачей. Такой контраст подчёркивает уникальность национальной суперкомпьютерной экосистемы, ориентированной на открытые научные исследования и поддержку широкого круга пользователей со всего мира. Нельзя не упомянуть и о влиянии смены архитектурных тенденций на будущее HPC. Отказ от акцента на одномаркерных масштабах FP64 к более универсальной поддержке различных форматов вычислений создаёт новые возможности для применения AI-методов в решении традиционных задач моделирования. В частности, системы типа «Doudna» способны проявить себя и в глубоком обучении, и в задачах численного моделирования физики, химии и биологии.