6 месяцев назад 6 месяцев назад

Чат-бот IBM на основе ИИ можно запускать локально в веб-браузере

Опубликовано: Admin 6 месяцев назад6 месяцев назад

126Просмотров

IBM выпустила серию компактных моделей Granite 4.0 Nano, которые можно запускать локально прямо в веб‑браузере. Модели выпускаются в вариантах от 350 миллионов до 1,5 миллиарда параметров и загружаются без необходимости в сервере, платной подписке или постоянном интернет‑соединении. Поскольку обработка идёт на устройстве, переписки остаются приватными и данные не покидают ваш компьютер.

Для работы достаточно ноутбука или настольного компьютера с не менее чем 8 ГБ оперативной памяти и браузера с поддержкой WebGPU, например Chrome или Edge. В линейке представлены версии Granite-4.0-H-1B (1,5 млрд параметров), Granite-4.0-H-350M (350 млн), Granite-4.0-1B и Granite-4.0-350M. Все модели используют гибридную архитектуру Mamba/трансформер, которая, по информации производителя, уменьшает требования к памяти без потери производительности.

Модель на 1,5 миллиарда параметров обеспечивает более качественные ответы и более сложные рассуждения, но для неё может потребоваться отдельная видеокарта с дополнительной видеопамятью порядка 6–8 ГБ. Загрузка самой модели требует подключения к интернету, однако после установки модель работает офлайн. После загрузки такие модели можно применять для задач вроде написания кода, суммаризации документов и составления писем.

Облачные чат‑боты, например ChatGPT и Claude, опираются на очень большие языковые модели с миллиардами параметров и требуют значительных вычислительных мощностей, серверной инфраструктуры и постоянного подключения к сети. Параметры модели определяют, как она обрабатывает информацию и формирует ответы; обычно большее число параметров улучшает способности к рассуждению.

При этом качество вывода зависит не только от числа параметров, но и от архитектуры, объёма и качества обучающих данных, а также от оптимизаций модели. Локальные Nano‑модели удобны для простых и повторяющихся задач: они сохраняют данные на устройстве, работают без подписки и дают минимальную задержку ответа.

Ограничения остаются: такие компактные модели обычно не достигают глубины рассуждений и объёма вывода, доступных в полноразмерных LLM вроде GPT‑4 или Claude. Мелкие модели хуже справляются с длинными входными текстами и не могут запрашивать свежую информацию из интернета. Тем не менее, сжатые локальные модели полезны для кастомизированных задач, а при необходимости более сложного анализа стоит рассматривать полноразмерные языковые модели.

Какова ваша реакция?

Чего?

Плачу

Прикол

Ого

Злой

Ржака

Ух, ты!

Ужас

Супер

Автор: Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.