4 месяца назад 4 месяца назад

NVIDIA GPU обучали GPT-5.2 OpenAI; Blackwell и Blackwell Ultra превосходят по эффективности и цене

Опубликовано: Admin 4 месяца назад4 месяца назад

153Просмотра

OpenAI представила новую модель GPT-5.2, обученную и развернутую на графических ускорителях NVIDIA, включая архитектуры Blackwell и Hopper. Компания называет её одним из наиболее продвинутых так называемых frontier‑моделей ИИ. По оценке OpenAI, корпоративные пользователи смогут экономить примерно 40–60 минут в день, а интенсивные пользователи — более 10 часов в неделю.

Создание и ввод в эксплуатацию GPT‑5.2 выполнялись в сотрудничестве с NVIDIA и Microsoft. Инфраструктура обучения опирается на дата‑центры Azure и GPU NVIDIA, в том числе H100, H200 и GB200‑NVL72, что, по словам разработчиков, позволяет масштабировать вычисления и ускорять вывод новых моделей на рынок.

Набор внутренних бенчмарков показывает существенные улучшения производительности GPT‑5.2 по сравнению с предыдущими версиями. В таблице результатов отмечены значительные выигрыши в задачах обработки знаний и рассуждений: например, показатель GDPval вырос до 70,9% против 38,8% у ранних версий, GPQA Diamond достиг 92,4% против 88,1%, а в задаче AIME 2025 модель показала 100% против 94% у предыдущей итерации.

Основой производительности GPT‑5.2 стала инфраструктура NVIDIA и оптимизации на уровне аппаратного обеспечения. С применением формата NVFP4 и других оптимизаций платформа GB200 NVL72 продемонстрировала прирост производительности до 45% в сравнении MLPerf v5.1 с MLPerf v5.0 при обучении Llama 3.1 405B на масштабе 512 GPU.

Blackwell Ultra показывает ещё более высокие показатели: по данным производителя, эти платформы в среднем в 1,9 раза быстрее GB200 NVL72 и до 4,2 раза быстрее решений на основе Hopper H100 в соответствующих тестах. Кроме того, GB200 NVL72 обеспечивает заметное улучшение эффективности по показателю «производительность на доллар» по сравнению с H100.

В ряде сценариев Blackwell‑системы обеспечивают многократный рост продуктивности: приведённые данные указывают на примерно 90% улучшение производительности обучения на доллар по сравнению с H100 и общую прибавку порядка 3,2× к скорости обучения в отдельных конфигурациях. Платформы GB200 и GB300 NVL72, как сообщается, обеспечивают существенные ускорения при обучении крупных моделей в индустриальных бенчмарках.

GPU семейства Blackwell и Blackwell Ultra уже доступны у ведущих облачных провайдеров, в «neo‑cloud» операторах и у производителей серверов, а их развёртывание продолжается. Соответствующие инстансы на базе Blackwell доступны через основные облачные сервисы.

Какова ваша реакция?

Чего?

Плачу

Прикол

Ого

Злой

Ржака

Ух, ты!

Ужас

Супер

Автор: Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.