NVIDIA GPU обучали GPT-5.2 OpenAI; Blackwell и Blackwell Ultra превосходят по эффективности и цене

NVIDIA GPU обучали GPT-5.2 OpenAI; Blackwell и Blackwell Ultra превосходят по эффективности и цене


138
24 поделились, 138 баллы

OpenAI представила новую модель GPT-5.2, обученную и развернутую на графических ускорителях NVIDIA, включая архитектуры Blackwell и Hopper. Компания называет её одним из наиболее продвинутых так называемых frontier‑моделей ИИ. По оценке OpenAI, корпоративные пользователи смогут экономить примерно 40–60 минут в день, а интенсивные пользователи — более 10 часов в неделю.

Создание и ввод в эксплуатацию GPT‑5.2 выполнялись в сотрудничестве с NVIDIA и Microsoft. Инфраструктура обучения опирается на дата‑центры Azure и GPU NVIDIA, в том числе H100, H200 и GB200‑NVL72, что, по словам разработчиков, позволяет масштабировать вычисления и ускорять вывод новых моделей на рынок.

Набор внутренних бенчмарков показывает существенные улучшения производительности GPT‑5.2 по сравнению с предыдущими версиями. В таблице результатов отмечены значительные выигрыши в задачах обработки знаний и рассуждений: например, показатель GDPval вырос до 70,9% против 38,8% у ранних версий, GPQA Diamond достиг 92,4% против 88,1%, а в задаче AIME 2025 модель показала 100% против 94% у предыдущей итерации.

Основой производительности GPT‑5.2 стала инфраструктура NVIDIA и оптимизации на уровне аппаратного обеспечения. С применением формата NVFP4 и других оптимизаций платформа GB200 NVL72 продемонстрировала прирост производительности до 45% в сравнении MLPerf v5.1 с MLPerf v5.0 при обучении Llama 3.1 405B на масштабе 512 GPU.

Blackwell Ultra показывает ещё более высокие показатели: по данным производителя, эти платформы в среднем в 1,9 раза быстрее GB200 NVL72 и до 4,2 раза быстрее решений на основе Hopper H100 в соответствующих тестах. Кроме того, GB200 NVL72 обеспечивает заметное улучшение эффективности по показателю «производительность на доллар» по сравнению с H100.

В ряде сценариев Blackwell‑системы обеспечивают многократный рост продуктивности: приведённые данные указывают на примерно 90% улучшение производительности обучения на доллар по сравнению с H100 и общую прибавку порядка 3,2× к скорости обучения в отдельных конфигурациях. Платформы GB200 и GB300 NVL72, как сообщается, обеспечивают существенные ускорения при обучении крупных моделей в индустриальных бенчмарках.

GPU семейства Blackwell и Blackwell Ultra уже доступны у ведущих облачных провайдеров, в «neo‑cloud» операторах и у производителей серверов, а их развёртывание продолжается. Соответствующие инстансы на базе Blackwell доступны через основные облачные сервисы.


Понравилось? Поделитесь с друзьями!

138
24 поделились, 138 баллы

Какова ваша реакция?

Чего? Чего?
8
Чего?
Плачу Плачу
5
Плачу
Прикол Прикол
4
Прикол
Ого Ого
3
Ого
Злой Злой
2
Злой
Ржака Ржака
1
Ржака
Ух, ты! Ух, ты!
10
Ух, ты!
Ужас Ужас
8
Ужас
Супер Супер
5
Супер
Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.

Комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Выберите формат
Пост
Форматированный текст с вставками и визуальными элементами
Опрос
Голосование для принятия решений или определения мнений
Изображение
Фото или GIF
Видео
Вставки с YouTube, Vimeo или Vine
Аудио
Вставки с SoundCloud или Mixcloud
Мем
Загружайте свои изображения для создания собственных мемов
Send this to a friend