NVIDIA GB200 NVL72 показывают 28× преимущество над AMD MI355X и ведут по интеллекту на доллар

NVIDIA GB200 NVL72 показывают 28× преимущество над AMD MI355X и ведут по интеллекту на доллар


146
25 поделились, 146 баллы

Испытания показали, что серверные стойки NVL72 на базе графических процессоров Blackwell GB200 заметно опережают решения на AMD Instinct MI355X в среде Mixture of Experts (MoE). Разрыв по производительности в отчётах оценивается как крайне значительный.

Многие современные модели ИИ смещаются в сторону архитектур MoE, поскольку они позволяют эффективнее использовать вычислительные ресурсы за счёт выделения отдельных подсетей — «экспертов». При этом масштабирование MoE создаёт серьёзные узкие места из‑за интенсивной all‑to‑all коммуникации между узлами, что увеличивает задержки и нагрузку на пропускную способность сети.

В независимых бенчмарках отмечается, что пропускная способность на один GPU при 75 токенах в секунду у GB200 превосходит показатели MI355X примерно в 28 раз в сопоставимых конфигурациях. Также в отчётах приводятся соотношения эффективности по затратам — около 3,1× при 25 токенах в секунду и примерно 15× при 75 токенах в секунду.

Для снижения проблем масштабирования в MoE применяется подход «совместного проектирования» (co‑design): конфигурация стойки с 72 чипами GB200 и общей быстрой памятью объёмом около 30 ТБ. Такая архитектура позволяет более эффективно распараллеливать работу «экспертов» и уменьшать накладные расходы на передачу данных.

Анализ цен в облачных прайсах показывает, что стойки GB200 NVL72 обеспечивают существенно более низкую стоимость на токен — примерно в одну пятнадцатую по сравнению с альтернативами при более высокой интерактивности. В совокупности это даёт заметное преимущество по показателю «производительность на доллар» и объясняет широкое распространение этой платформы у крупных облачных провайдеров.

Решения на базе MI355X сохраняют конкурентные преимущества в высокоплотных конфигурациях благодаря большой ёмкости HBM3e. Тем не менее в задачах, ориентированных именно на MoE, текущая лидирующая позиция за платформой GB200, и конкуренция, вероятно, усилится с появлением новых стоечных решений, таких как Helios и Vera Rubin.


Понравилось? Поделитесь с друзьями!

146
25 поделились, 146 баллы

Какова ваша реакция?

Чего? Чего?
3
Чего?
Плачу Плачу
10
Плачу
Прикол Прикол
9
Прикол
Ого Ого
8
Ого
Злой Злой
7
Злой
Ржака Ржака
6
Ржака
Ух, ты! Ух, ты!
5
Ух, ты!
Ужас Ужас
3
Ужас
Супер Супер
10
Супер
Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.

Комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Выберите формат
Пост
Форматированный текст с вставками и визуальными элементами
Опрос
Голосование для принятия решений или определения мнений
Изображение
Фото или GIF
Видео
Вставки с YouTube, Vimeo или Vine
Аудио
Вставки с SoundCloud или Mixcloud
Мем
Загружайте свои изображения для создания собственных мемов
Send this to a friend