
Google официально представила «Ironwood» — седьмое поколение своих тензорных процессоров (TPU v7), обозначив существенный поворот в стратегии разработки кремния. В отличие от предыдущих поколений, ориентированных главным образом на обучение крупных моделей, Ironwood спроектирован специально для эпохи инференса — когда модели обслуживают миллионы пользователей в режиме реального времени.
Главной новацией Ironwood является не только сам кристалл, но и способ объединения тысяч таких чипов в единую систему. Google разработала архитектуру, в которой процессоры работают как единый «суперкомпьютер», а не как разрозненные узлы.
Для этого используются оптические коммутационные схемы собственной разработки (Optical Circuit Switches, OCS), позволяющие группировать чипы в сверхмассивные «супер-поды» вместимостью до 9 216 кристаллов. Такая организация обеспечивает очень низкую задержку при обмене данными и позволяет системе действовать как единый «мозг», что важно для моделей, которые не помещаются на один чип.
Ещё одна ключевая особенность — общий пул памяти объёмом примерно 1,77 петабайта высокопроизводительной HBM, доступный всему поду. Это устраняет узкие места, связанные с передачей данных между отдельными серверами, и ускоряет выполнение инференса.
В конструктивном плане Ironwood демонстрирует значительный прогресс в энергоэффективности и управлении теплом. Чип имеет двухблочную компоновку (dual-chiplet), что повышает выход годных при производстве и улучшает отвод тепла.
Кроме того, Google использует продвинутые системы жидкостного охлаждения, позволяющие чипам работать ближе к их тепловым пределам без снижения производительности. Аппаратные характеристики включают 192 ГБ HBM на чип и вычислительную мощность порядка 4,6 петафлопса в формате FP8, что делает Ironwood эффективным решением для вычислений генеративного ИИ.
По утверждениям Google, Ironwood обеспечивает вдвое большую производительность на ватт по сравнению с предшествующим шестым поколением TPU под названием «Trillium». Поскольку компания контролирует стек от кристалла до дата‑центра и системы охлаждения, она может оптимизировать суммарную стоимость владения эффективнее, чем сторонние поставщики.
На рынке коммерческих чипов лидирует NVIDIA, однако Ironwood стал для Google серьёзной внутренней альтернативой, снижающей зависимость от продуктов конкурента. Это особенно заметно в задачах масштабного облачного инференса, где важна энергоэффективность при обслуживании больших моделей.
По сравнению с NVIDIA Blackwell B200 подходы компаний различаются: B200 задуман как универсальный ускоритель, хорошо подходящий и для обучения, и для графики, тогда как Ironwood — специализированное решение, оптимизированное под рабочие нагрузки Google, в том числе под JAX и TensorFlow. NVIDIA сохраняет преимущество по универсальности и экосистеме программного обеспечения (CUDA), а Ironwood, вероятно, выигрывает в эффективности для внутренних задач Google.
Ещё одно отличие — масштаб связности. NVIDIA обычно объединяет ускорители B200 в кластеры с использованием NVLink по 72 устройства, тогда как Google соединяет Ironwood в поды на тысячи кристаллов. Хотя отдельные ссылки NVIDIA обеспечивают более высокую пропускную способность, способность Google объединять гораздо большее число чипов в единый домен даёт преимущество при запуске самых крупных моделей.
В прямом сопоставлении характеристик оба чипа близки: оба предлагают по 192 ГБ HBM на кристалл, вычислительная мощность Ironwood оценивается примерно в 4,6 петафлопса (FP8) против около 4,5 петафлопса у B200. По памяти NVIDIA сохраняет небольшое преимущество в пропускной способности — примерно 8,0 ТБ/с против 7,4 ТБ/с у Ironwood.
В итоге Ironwood демонстрирует, что Google переходит от попыток «догнать» конкурентов к формированию собственного пути в области масштабного облачного инференса. Ключевой акцент сделан на эффективности и оптимизации всей инфраструктуры под конкретные задачи компании.


Комментариев