
Стратегия «наслоения» микросхем рассматривается как ответ Китая на ужесточение американских ограничений на экспорт передовых технологий производства процессоров. Идея сводится к тому, чтобы объединять более простые, производимые внутри страны кристаллы в сложные системы, пытаясь сократить отставание от лидеров в области графических процессоров.
Суть подхода — «строить вверх, а не вперед». Вэй Шаоцзюнь, вице‑президент Китайской ассоциации полупроводниковой промышленности и профессор университета Цинхуа, описал архитектуру, в которой 14‑нанометровые логические кристаллы совмещаются с 18‑нанометровой оперативной памятью при помощи трёхмерного гибридного бондирования.
Это важно на стыке технологических ограничений: американские экспортные меры направлены на производство логики на узлах 14 нм и тоньше и оперативной памяти на узлах 18 нм и тоньше. Предложение использует те техпроцессы, которые пока остаются доступными китайским производителям.
Ключевой технический элемент — концепция «близкой к памяти вычислительной архитектуры, определяемой программно». Вместо постоянной пересылки данных между процессором и памятью — узкого места в задачах ИИ — расчётные блоки и память размещаются в непосредственной близости за счёт вертикального наслоения.
Трёхмерное гибридное бондирование обеспечивает прямые соединения «медь‑к‑меди» с шагом менее 10 микрометров, что существенно сокращает физические расстояния, замедляющие традиционные архитектуры.
По оценке Вэя, такая конфигурация теоретически может приблизиться по эффективности к 4‑нанометровым GPU и при этом снизить затраты и энергопотребление. Он приводит показатели порядка 2 TFLOPS на ватт и суммарно около 120 TFLOPS, тогда как сравниваемый ориентир в статье — GPU A100 — указывается с более высоким пиковой производительностью, около 312 TFLOPS.
Эта разница подчёркивает главный вопрос применимости подхода. Хотя архитектурная инновация реальна, на практике существенные преимущества узлов передовых техпроцессов — плотность транзисторов, энергоэффективность и тепловые характеристики — не исчезают при простом наслоении устаревших кристаллов.
Стратегический расчёт Китая выходит за рамки чисто скоростных показателей. Основатели и лидеры отрасли предлагают сосредоточиться на кластеризации и системной интеграции, а не на прямой конкуренции по узлам техпроцесса, поскольку доступ к 3‑ и 2‑нанометровым решениям остаётся закрытым.
Ещё одна проблема — программная экосистема. Доминирование Nvidia основано не только на аппаратуре, но и на зрелых программных стэках вроде CUDA. Производителям придётся либо воссоздать аналогичную экосистему, либо убедить разработчиков перейти на иные платформы, что занимает годы.
С технической точки зрения трёхмерное наслоение уже применяется в высокоскоростной памяти и продвинутой упаковке чипов. Новизна заключается в попытке использовать эти приёмы для создания принципиально иных вычислительных архитектур, а не только для улучшения существующих решений.
При этом остаются серьёзные препятствия: охлаждение становится гораздо сложнее при наличии нескольких активных слоёв, тепловыделение 14‑нанометровых кристаллов выше, чем у 4–5 нм, и наслоение усиливает эту проблему. Технология также чувствительна к браку — дефект в одном слое может вывести из строя весь стек — а программная поддержка для эффективного использования таких систем пока отсутствует и потребует времени на развитие.
Наиболее реалистичный сценарий — успех в узких применениях, где важнее пропускная способность памяти, чем чистая вычислительная мощность. Это могут быть задачи инференса в ИИ, отдельные аналитические нагрузки и специализированные прикладные решения. Сопоставить же полную производительность современных GPU в задачах обучения и широкого круга рабочих нагрузок — пока маловероятно.
В стратегическом плане появление подхода «наслоения» сигнализирует о смещении акцентов в полупроводниковой политике. Даже при ограничениях на доступ к передовым техпроцессам отрасль ищет варианты конкурентоспособности через архитектуру, упаковку и совместную оптимизацию аппаратных и программных решений. Этот архитектурный поворот усложняет картину конкуренции в сфере ИИ‑чипов и заслуживает пристального наблюдения.


Комментариев