Nvidia MLPerf Training v5.0 xalqaro benchmarkida o'zining yangi Blackwell arxitekturasining ajoyib natijalarini taqdim etdi. Gigant til modellari va multimodal AI tizimlari ehtiyojlari uchun maxsus ishlab chiqilgan yangi chiplar oldingi avlodga nisbatan unumdorlikning 2,5 baravarigacha o'sishini ta'minladi.
Sinovlar doirasida Blackwell Mlperfning barcha toifalarini, shu jumladan eng ko'p resurs talab qiladigan stsenariyni — Llama 3.1 405b modelini katta til modellari (LLM) sinfiga o'rganishni muvaffaqiyatli yakunlagan yagona arxitekturaga aylandi. Bu CoreWeave va IBM bilan hamkorlikda yig'ilgan Tyche va Nyx superkompyuterlaridan foydalanish orqali amalga oshirildi. Birgalikda sinov infratuzilmasi 2496 Blackwell GPU va 1248 Nvidia Grace protsessorlarini o'z ichiga olgan.
Natijalarni tekshirish 125 dan ortiq texnologik rahbarlar va ilmiy tashkilotlarni birlashtirgan MLCommons xalqaro assotsiatsiyasi tomonidan amalga oshirildi. Tasdiqlangan ma'lumotlar shuni ko'rsatadiki: Lora texnologiyasidan foydalangan holda Llama 2 70b modelini nozik sozlash muammosida Nvidia dgx B200 tizimi sakkizta Blackwell GPU-ga ega bo'lib, 2,5 baravar yuqori unumdorlikka erishdi va bu sohada yangi qo'llanma bo'ldi.
Ushbu yutuq ko'plab muhandislik va dasturiy echimlar tufayli amalga oshirildi:
- Server tokchalarini suyuq sovutishdan foydalanish;
- Har bir raf uchun 13,4 TB gacha izchil xotira;
- Nvidia-ning eng yangi 5-avlod nvlink va Nvlink Switch ulanish texnologiyalari;
- NVIDIA Quantum-2 InfiniBand tarmog'i hisob-kitoblarni gorizontal ravishda kattalashtirishni ta'minlaydi;
- Ko'p modali AI va agentlarni o'qitishga qaratilgan NeMo Framework dasturiy ta'minotini takomillashtirish.
Nvidia-ning tezlashtirilgan hisoblash mahsulotlari bo'yicha direktori Deyv Salvator tushuntirganidek, "Mlperfning ob'ektivligi va ko'p qirraliligi uni sanoat uchun ishonchli qo'llanma qiladi. Ammo haqiqiy iqtisodiy ta'sir sinov bosqichida emas, balki modellarni joylashtirish va aqlli echimlarni yaratish jarayonida boshlanadi."
Nvidia rivojlanishining asosiy yo'nalishlaridan biri "AI-fabrikalar" ni yaratish bo'lib, u Real vaqtda fikrlash, qaror qabul qilish va o'zaro aloqada bo'lishga qodir bo'lgan AI agentlarini o'qitish va ishlatish uchun ixtisoslashtirilgan ma'lumotlar markazlari hisoblanadi. Ushbu komplekslar GPU, CPU, tarmoq echimlari va to'liq dasturiy ta'minot to'plamini — CUDA-X dan TensorRT-LLM va Dynamo ramkalariga birlashtiradi.
Blackwell va NeMo tibbiyot va moliyadan tortib ilm-fan va davlat boshqaruvigacha bo'lgan AI ilovalarining yangi avlodi uchun asos bo'lib xizmat qilmoqda. Nvidia chip ishlab chiqaruvchisidan tizim integratoriga o'tish unga texnologik yetakchilikni saqlab qolish va butun dunyo bo'ylab AI infratuzilmasini o'zgartirishni tezlashtirish imkonini berishiga ishonchi komil.