
Пекин, 5 февраля 2026 года — компания Kling AI представила серию моделей Kling 3.0: Video 3.0, Video 3.0 Omni, Image 3.0 и Image 3.0 Omni. Обновление направлено на расширение управления сюжетом и повышение согласованности при генерации видео с помощью ИИ.
Серия 3.0 включает значительные улучшения в согласованности кадров, фотореалистичном качестве, поддержке длительности видео до 15 секунд и встроенной генерации звука на нескольких языках и диалектах. Модели основаны на единой мультимодальной архитектуре, которая объединяет понимание, генерацию и редактирование видео в одном рабочем процессе.
Реализация опирается на унифицированную тренировочную платформу и обеспечивает работу с текстом, изображениями, аудио и видео. В одну архитектуру интегрированы задачи текст‑видео, изображение‑видео, генерация по референсам и редактирование внутри роликов.
Доступ к моделям Kling AI 3.0 предоставляется в рамках раннего доступа для подписчиков Ultra; в ближайшее время функциональность станет доступна широкой публике. Компания заявляет о поэтапном развёртывании возможностей для разных категорий пользователей.
Video 3.0 ориентирована на создание кинематографичных роликов и улучшает согласованность визуальных элементов благодаря возможности загрузки референсных видео и нескольких изображений. Это позволяет сохранять внешний вид персонажей, объектов и сцен непрерывным в последовательных кадрах.
Модель поддерживает нативную генерацию речи на английском, китайском, японском, корейском и испанском языках, а также на разных акцентах, включая американский, британский и индийский. Поддерживаются многоактёрные диалоги, где каждый персонаж может говорить на своём языке с точным управлением содержанием, интонацией и порядком реплик.
Длительность генерируемого видео увеличена до 15 секунд, что позволяет моделировать сложные сценические последовательности, длинные планы и несколько сюжетных поворотов с плавными переходами. Это расширение даёт больше пространства для драматургии и монтажа.
Модель понимает инструкции для многосценного и многофрагментного повествования и автоматически подбирает ракурсы и монтаж в соответствии с творческим заданием. Поддерживаются классические режиссёрские приёмы, такие как смена планов для диалогов, склейки между сценами и использование голосовой дорожки.
Video 3.0 улучшает воспроизведение текстовых элементов на изображениях — вывесок, подписей и брендовых логотипов — сохраняя их чёткость и читаемость на протяжении всего ролика. Это важно для рекламных и коммерческих задач, где критична сохранность фирменных знаков.
Модель способна генерировать фотореалистичные сцены с живыми персонажами и выразительной мимикой, что повышает ощущение реализма в созданных материалах. Такой подход применим как в рекламе, так и в полномасштабных продакшн‑задачах.
Video 3.0 Omni расширяет возможности сториборда и управления референсами, позволяя извлекать визуальные черты и голосовые характеристики из загруженных материалов и воспроизводить их в новых сценах. Это обеспечивает более строгую привязку к исходному образу персонажа и визуальной стилистике.
Функция мультикадрового сториборда даёт пользователям возможность задавать длительность, размер кадра, перспективу, содержимое сюжета и движения камеры для каждого плана. Такой подход приближает автоматическую генерацию к традиционному режиссёрскому сценарию и облегчает подготовку профессиональных съёмок.
Image 3.0 и Image 3.0 Omni добавляют поддержку разрешений 2K и 4K и ориентированы на профессиональное использование — от визуализации виртуальных сцен до создания полноценных производственных материалов. Модели сохраняют текстуры, освещение и свойства материалов с высокой точностью и последовательностью.
Серия Kling 3.0 опирается на предыдущие версии O1 и 2.6 и реализует концепцию мультимодального визуального языка (MVL), что отражает эволюцию технологии от базовой генерации к профессиональной оркестрации. Обновления подчёркивают улучшение точности повествования, качества вывода и кинематографического контроля.
По состоянию на запуск в июне 2024 года компания отмечает, что её платформа обслуживает более 60 миллионов создателей контента и, по данным компании, сгенерировала свыше 600 миллионов видео, а также сотрудничает более чем с 30 000 корпоративными клиентами. Технологии используются в кино и рекламе для ускорения визуализации раскадровок, демонстрации продуктовых концептов и оптимизации производственных процессов.
Выпуск серии Kling 3.0 компания рассматривает как переход от инструмента генерации к интеллектуальному творческому партнёру, позволяющему преобразовывать идеи в готовые фильмы и визуальные материалы. Новые возможности призваны расширить доступ к профессиональным приёмам режиссуры и производства.


Комментариев