Nvidia представила впечатляющие результаты своей новой архитектуры Blackwell в международном бенчмарке MLPerf Training v5.0. Новые чипы, разработанные специально для нужд гигантских языковых моделей и мультимодальных ИИ-систем, обеспечили до 2,5-кратного прироста производительности по сравнению с предыдущим поколением.
В рамках тестов Blackwell стал единственной архитектурой, успешно прошедшей все категории MLPerf, включая самый ресурсоёмкий сценарий — обучение модели Llama 3.1 405B, относящейся к классу больших языковых моделей (LLM). Это стало возможным благодаря использованию суперкомпьютеров Tyche и Nyx, собранных в партнёрстве с CoreWeave и IBM. В совокупности тестовая инфраструктура включала 2496 графических процессоров Blackwell и 1248 CPU Nvidia Grace.
Проверку результатов проводила международная ассоциация MLCommons, объединяющая более 125 технологических лидеров и научных организаций. Подтверждённые данные показывают: на задаче тонкой настройки модели Llama 2 70B с применением технологии LoRA, системы Nvidia DGX B200 с восемью GPU Blackwell показали 2,5-кратный рост производительности, что стало новым ориентиром в индустрии.
Прорыв стал возможен благодаря множеству инженерных и программных решений:
- Использование жидкостного охлаждения серверных стоек;
- До 13,4 ТБ когерентной памяти на стойку;
- Новейшие технологии соединения Nvidia NVLink 5-го поколения и NVLink Switch;
- Сеть Nvidia Quantum-2 InfiniBand, обеспечивающая масштабирование вычислений в горизонтали;
- Улучшения в программном стеке NeMo Framework, ориентированном на обучение многомодальных ИИ и агентов.
Как пояснил Дэйв Сальватор, директор по продуктам ускоренных вычислений в Nvidia, «объективность и универсальность MLPerf делают его надёжным ориентиром для индустрии. Но реальный экономический эффект начинается не на этапе тестирования, а в процессе развертывания моделей и создания интеллектуальных решений».
Одним из ключевых направлений развития Nvidia становится создание “AI-фабрик” — специализированных дата-центров для обучения и эксплуатации ИИ-агентов, способных к рассуждению, принятию решений и взаимодействию в реальном времени. Эти комплексы сочетают GPU, CPU, сетевые решения и полный программный стек — от CUDA-X до фреймворков TensorRT-LLM и Dynamo.
Blackwell и NeMo становятся основой для нового поколения ИИ-приложений — от медицины и финансов до науки и государственного управления. Nvidia уверена, что переход от производителя чипов к системному интегратору позволит ей сохранить технологическое лидерство и ускорить трансформацию ИИ-инфраструктуры по всему миру.