Gradient считает, что триллионные модели в будущем не будут у OpenAI или Google

Gradient считает, что триллионные модели в будущем не будут у OpenAI или Google


126
23 поделились, 126 баллы

Генеральный директор Gradient Эрик Янг считает, что следующий крупный этап развития искусственного интеллекта произойдёт не за счёт увеличения размеров закрытых моделей или более мощных дата‑центров. По его мнению, ключевое изменение будет в подходе к обучению — переход к распределённой подготовке моделей на глобальной, открытой сети вычислений, а не внутри корпоративных суперкомпьютеров.

Янг утверждает, что нынешние ведущие лаборатории ИИ — OpenAI, Google, Anthropic и xAI — исходят из предположения, что базовые модели можно обучать только внутри массивной централизованной инфраструктуры. Gradient делает ставку на то, что это представление скоро устареет.

Компания сообщает о проведённых успешных запусках обучения с подкреплением, распределённых между независимыми дата‑центрами, где по показателям производительность сопоставима с централизованными рабочими процессами RLHF. Эти эксперименты, по его словам, демонстрируют практическую осуществимость распределённого подхода.

Это, как полагает Янг, открывает возможность пост‑обучения триллионнопараметрных моделей не одной компанией, а тысячами поставщиков вычислений по всему миру. В таком сценарии масштабная модель развивается через совместный вклад множества участников, а не в пределах одной закрытой системы.

Экономические последствия могут быть значительными: формируется рынок с оплатой за выполненные задачи, где операторы GPU, дата‑центры и небольшие инфраструктурные провайдеры конкурируют за предоставление вычислений. Участники получают вознаграждение за поставку ресурсов по минимально доступной цене, что снижает стоимость обучения по сравнению с централизованными альтернативами. Это способно изменить доступность и ценообразование вычислительных мощностей.

Янг также подчёркивает преимущества с точки зрения безопасности и доверия. Если вывод моделей можно делать полностью на устройствах, принадлежащих пользователю — ноутбуках, настольных компьютерах или домашних GPU — личные данные остаются на устройстве и не передаются в сторонние сервисы. По его мнению, это уменьшит объём чувствительной информации, попадающей в централизованные ИИ‑системы.

Он добавляет, что прозрачность процессов обучения можно обеспечить посредством учёта происхождения данных и участников на блокчейне, что позволит видеть, какие окружения и провайдеры формировали модель. По мнению Янга, такой подход может служить противовесом предвзятости и непрозрачному редакционному контролю, наблюдаемым в централизованных системах.

В долгосрочной перспективе Янг ожидает не монополию одной крупной модели, а «море» специализированных моделей, обученных и принадлежащих совместным сообществам и организациям. Когда компании начнут использовать ИИ так же повсеместно, как сегодня применяют аналитику, он полагает, что глобальная децентрализованная сеть вычислений станет единственным масштабируемым решением.


Понравилось? Поделитесь с друзьями!

126
23 поделились, 126 баллы

Какова ваша реакция?

Чего? Чего?
8
Чего?
Плачу Плачу
5
Плачу
Прикол Прикол
4
Прикол
Ого Ого
3
Ого
Злой Злой
2
Злой
Ржака Ржака
1
Ржака
Ух, ты! Ух, ты!
10
Ух, ты!
Ужас Ужас
8
Ужас
Супер Супер
5
Супер
Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.

Комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Выберите формат
Пост
Форматированный текст с вставками и визуальными элементами
Опрос
Голосование для принятия решений или определения мнений
Изображение
Фото или GIF
Видео
Вставки с YouTube, Vimeo или Vine
Аудио
Вставки с SoundCloud или Mixcloud
Мем
Загружайте свои изображения для создания собственных мемов
Send this to a friend