
Kling AI, судя по имеющимся данным, готовит выпуск версии 2.6, которая интегрирует нативный аудиослой непосредственно в модель генерации видео.
Внутренние упоминания указывают на поддержку разговорной речи, пения и звуковых эффектов под слоганом «Увидеть звук, услышать изображение».
Это означает, что дорожки звука будут генерироваться одновременно с изображением в одном прогоне, а не создаваться отдельными инструментами или вручную.
Такая возможность может усилить конкурентоспособность Kling 2.6 Pro по сравнению с ведущими моделями для генерации видео, предложив полноценный мультимодальный рабочий процесс (видео + аудио + преобразование изображений в видео) с поддержкой звука для глобального рынка и высоким качеством производства.
Линейка Kling развивалась от версий 1.6 до 2.5 в уровнях Turbo, Pro и Master, последовательно повышая качество визуальной составляющей и возможности управления.
Для создателей контента и студий, использующих Kling 2.5 и Kling Omni через сторонние платформы, планируемая встроенная поддержка английского и китайского языков в версии 2.6 Pro сократит разрыв с конкурентами, которые уже объединяют речь и атмосферные звуки.
Кроме того, обновление опирается на предыдущие разработки, которые добавили возможности генерации аудио в реальном времени в экосистему Kling.
Анонс может быть приурочен к неделе запуска Kling Omni, когда компания, принадлежащая китайской платформе коротких видео Kuaishou, обещала серию релизов в начале декабря.
В таком контексте показ версии 2.6 примерно 3 декабря выглядит правдоподобно.
Обновление, вероятно, сначала появится в веб-инструментах Kling и интеграциях с партнёрами, а более широкая доступность будет зависеть от того, как пройдет неделя запусков.


Комментариев