Сможет ли Китай создать GPU для ИИ, сопоставимые с Nvidia

Сможет ли Китай создать GPU для ИИ, сопоставимые с Nvidia


96
20 поделились, 96 баллы

Стратегия «наслоения» микросхем рассматривается как ответ Китая на ужесточение американских ограничений на экспорт передовых технологий производства процессоров. Идея сводится к тому, чтобы объединять более простые, производимые внутри страны кристаллы в сложные системы, пытаясь сократить отставание от лидеров в области графических процессоров.

Суть подхода — «строить вверх, а не вперед». Вэй Шаоцзюнь, вице‑президент Китайской ассоциации полупроводниковой промышленности и профессор университета Цинхуа, описал архитектуру, в которой 14‑нанометровые логические кристаллы совмещаются с 18‑нанометровой оперативной памятью при помощи трёхмерного гибридного бондирования.

Это важно на стыке технологических ограничений: американские экспортные меры направлены на производство логики на узлах 14 нм и тоньше и оперативной памяти на узлах 18 нм и тоньше. Предложение использует те техпроцессы, которые пока остаются доступными китайским производителям.

Ключевой технический элемент — концепция «близкой к памяти вычислительной архитектуры, определяемой программно». Вместо постоянной пересылки данных между процессором и памятью — узкого места в задачах ИИ — расчётные блоки и память размещаются в непосредственной близости за счёт вертикального наслоения.

Трёхмерное гибридное бондирование обеспечивает прямые соединения «медь‑к‑меди» с шагом менее 10 микрометров, что существенно сокращает физические расстояния, замедляющие традиционные архитектуры.

По оценке Вэя, такая конфигурация теоретически может приблизиться по эффективности к 4‑нанометровым GPU и при этом снизить затраты и энергопотребление. Он приводит показатели порядка 2 TFLOPS на ватт и суммарно около 120 TFLOPS, тогда как сравниваемый ориентир в статье — GPU A100 — указывается с более высоким пиковой производительностью, около 312 TFLOPS.

Эта разница подчёркивает главный вопрос применимости подхода. Хотя архитектурная инновация реальна, на практике существенные преимущества узлов передовых техпроцессов — плотность транзисторов, энергоэффективность и тепловые характеристики — не исчезают при простом наслоении устаревших кристаллов.

Стратегический расчёт Китая выходит за рамки чисто скоростных показателей. Основатели и лидеры отрасли предлагают сосредоточиться на кластеризации и системной интеграции, а не на прямой конкуренции по узлам техпроцесса, поскольку доступ к 3‑ и 2‑нанометровым решениям остаётся закрытым.

Ещё одна проблема — программная экосистема. Доминирование Nvidia основано не только на аппаратуре, но и на зрелых программных стэках вроде CUDA. Производителям придётся либо воссоздать аналогичную экосистему, либо убедить разработчиков перейти на иные платформы, что занимает годы.

С технической точки зрения трёхмерное наслоение уже применяется в высокоскоростной памяти и продвинутой упаковке чипов. Новизна заключается в попытке использовать эти приёмы для создания принципиально иных вычислительных архитектур, а не только для улучшения существующих решений.

При этом остаются серьёзные препятствия: охлаждение становится гораздо сложнее при наличии нескольких активных слоёв, тепловыделение 14‑нанометровых кристаллов выше, чем у 4–5 нм, и наслоение усиливает эту проблему. Технология также чувствительна к браку — дефект в одном слое может вывести из строя весь стек — а программная поддержка для эффективного использования таких систем пока отсутствует и потребует времени на развитие.

Наиболее реалистичный сценарий — успех в узких применениях, где важнее пропускная способность памяти, чем чистая вычислительная мощность. Это могут быть задачи инференса в ИИ, отдельные аналитические нагрузки и специализированные прикладные решения. Сопоставить же полную производительность современных GPU в задачах обучения и широкого круга рабочих нагрузок — пока маловероятно.

В стратегическом плане появление подхода «наслоения» сигнализирует о смещении акцентов в полупроводниковой политике. Даже при ограничениях на доступ к передовым техпроцессам отрасль ищет варианты конкурентоспособности через архитектуру, упаковку и совместную оптимизацию аппаратных и программных решений. Этот архитектурный поворот усложняет картину конкуренции в сфере ИИ‑чипов и заслуживает пристального наблюдения.


Понравилось? Поделитесь с друзьями!

96
20 поделились, 96 баллы

Какова ваша реакция?

Чего? Чего?
5
Чего?
Плачу Плачу
2
Плачу
Прикол Прикол
1
Прикол
Ого Ого
10
Ого
Злой Злой
9
Злой
Ржака Ржака
8
Ржака
Ух, ты! Ух, ты!
7
Ух, ты!
Ужас Ужас
5
Ужас
Супер Супер
2
Супер
Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.

Комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Выберите формат
Пост
Форматированный текст с вставками и визуальными элементами
Опрос
Голосование для принятия решений или определения мнений
Изображение
Фото или GIF
Видео
Вставки с YouTube, Vimeo или Vine
Аудио
Вставки с SoundCloud или Mixcloud
Мем
Загружайте свои изображения для создания собственных мемов
Send this to a friend