6 месяцев назад 6 месяцев назад

Gradient считает, что триллионные модели в будущем не будут у OpenAI или Google

Опубликовано: Admin 6 месяцев назад6 месяцев назад

139Просмотров

Генеральный директор Gradient Эрик Янг считает, что следующий крупный этап развития искусственного интеллекта произойдёт не за счёт увеличения размеров закрытых моделей или более мощных дата‑центров. По его мнению, ключевое изменение будет в подходе к обучению — переход к распределённой подготовке моделей на глобальной, открытой сети вычислений, а не внутри корпоративных суперкомпьютеров.

Янг утверждает, что нынешние ведущие лаборатории ИИ — OpenAI, Google, Anthropic и xAI — исходят из предположения, что базовые модели можно обучать только внутри массивной централизованной инфраструктуры. Gradient делает ставку на то, что это представление скоро устареет.

Компания сообщает о проведённых успешных запусках обучения с подкреплением, распределённых между независимыми дата‑центрами, где по показателям производительность сопоставима с централизованными рабочими процессами RLHF. Эти эксперименты, по его словам, демонстрируют практическую осуществимость распределённого подхода.

Это, как полагает Янг, открывает возможность пост‑обучения триллионнопараметрных моделей не одной компанией, а тысячами поставщиков вычислений по всему миру. В таком сценарии масштабная модель развивается через совместный вклад множества участников, а не в пределах одной закрытой системы.

Экономические последствия могут быть значительными: формируется рынок с оплатой за выполненные задачи, где операторы GPU, дата‑центры и небольшие инфраструктурные провайдеры конкурируют за предоставление вычислений. Участники получают вознаграждение за поставку ресурсов по минимально доступной цене, что снижает стоимость обучения по сравнению с централизованными альтернативами. Это способно изменить доступность и ценообразование вычислительных мощностей.

Янг также подчёркивает преимущества с точки зрения безопасности и доверия. Если вывод моделей можно делать полностью на устройствах, принадлежащих пользователю — ноутбуках, настольных компьютерах или домашних GPU — личные данные остаются на устройстве и не передаются в сторонние сервисы. По его мнению, это уменьшит объём чувствительной информации, попадающей в централизованные ИИ‑системы.

Он добавляет, что прозрачность процессов обучения можно обеспечить посредством учёта происхождения данных и участников на блокчейне, что позволит видеть, какие окружения и провайдеры формировали модель. По мнению Янга, такой подход может служить противовесом предвзятости и непрозрачному редакционному контролю, наблюдаемым в централизованных системах.

В долгосрочной перспективе Янг ожидает не монополию одной крупной модели, а «море» специализированных моделей, обученных и принадлежащих совместным сообществам и организациям. Когда компании начнут использовать ИИ так же повсеместно, как сегодня применяют аналитику, он полагает, что глобальная децентрализованная сеть вычислений станет единственным масштабируемым решением.

Какова ваша реакция?

Чего?

Плачу

Прикол

Ого

Злой

Ржака

Ух, ты!

Ужас

Супер

Автор: Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.