SenseTime запускает платформу Seko 2.0 для генерации драматических сериалов

SenseTime запускает платформу Seko 2.0 для генерации драматических сериалов


127
23 поделились, 127 баллы

22 декабря 2025 года компания SenseTime представила Seko 2.0 — агент для генерации многосерийных коротких драм и motion‑комиксов, рассчитанный на создание до 100 эпизодов. Seko 2.0 обеспечивает согласованность образов, сцен и реквизита между эпизодами и сокращает время производства комикс‑драм на 80–90% по сравнению с традиционными методами.

Seko 2.0 работает на открытом фреймворке LightX2V — первом в отрасли решении вывода, способном генерировать видео в реальном времени. Это сочетание архитектур и оптимизаций позволяет добиваться высокой пропускной способности при относительно низких затратах на производство.

Первая версия Seko была выпущена в июле 2025 года и за два месяца привлекла более 100 000 создателей; менее чем за полгода база пользователей превысила 200 000 человек. Около 30% пользователей занимались короткими драмами, а примерно 20% — комикс‑драмами.

Seko 2.0 снижает порог входа для создателей и делает процесс производства более эффективным. Среди ключевых улучшений — переработанный интерфейс, расширенные возможности многосерийной генерации с управлением длинным контекстом и интеллигентное планирование сцен и персонажей.

Переработанный пользовательский интерфейс оптимизирован для визуального представления и нацелен на более погружённый творческий опыт. Это упрощает подбор образов, компоновку сцен и работу с визуальными элементами проекта.

Поддержка многосерийной генерации позволяет создавать до 100 эпизодов с сохранением преемственности сюжета и визуальных характеристик персонажей. Управление длинным контекстом важно для проектов с большим числом эпизодов и сложной сквозной логикой.

Интеллектуальное планирование агентов даёт возможность гибко связывать персонажей, сцены и предметы между эпизодами и адаптировать макияж и стилизацию под разные сценарии. Такая система уменьшает вероятность визуальных несоответствий при смене ракурсов и выражений.

По словам Сюй Ли, председателя правления и генерального директора SenseTime, Seko открывает доступ к творчеству для людей с воображением, но без профессиональных навыков производства, позволяя им войти в экосистему созидания. Компания также ожидает, что по мере развития ИИ качество генерируемого контента будет повышаться, позволяя сосуществовать как более утончённым, так и массовым форматам.

В Китае наблюдается стремительный рост рынка AI‑комиксов и коротких драм: в первой половине года предложение комикс‑драм в материковом Китае росло со среднегодовым темпом 83%. За этот период было создано более 3 000 произведений, а суммарные доходы увеличились в 12 раз, что привлекло множество отдельных авторов и небольших команд.

В Seko 2.0 реализована технология SekoIDX, обеспечивающая консистентность персонажей в многосерийных и сквозных съёмках. В систему введены «негативные эталонные изображения» на фазе высокого шума диффузионных моделей, что снижает избыточное копирование образов и сохраняет естественность при различных позах и эмоциях.

Технология SekoTalk отвечает за многоперсное движение губ и точную аудиовизуальную синхронизацию. Решение рассчитано на сценарии с несколькими участниками и обеспечивает синхронизацию как для обычных диалогов, так и для интенсивных сцен с эмоциональными всплесками.

Эти технологические достижения напрямую повышают производительность производства. По сравнению с традиционным рабочим процессом, где команда тратила более трёх месяцев на 50 эпизодов, Seko 2.0 сокращает цикл производства на 80–90% и позволяет независимым авторам работать в модели «один человек — одна команда».

Для снижения стоимости многосерийной генерации SenseTime разработала фазовую DMD‑дистилляцию в сочетании с моделью Mixture of Experts (MoE), что позволяет распределять задачи между специализированными моделями. Один 5‑секундный фрагмент требует почти 100 000 токенов, а 10–20 кадров могут потребовать от 1 до 2 миллионов токенов; фазовая дистилляция и разделение задач по этапам уменьшают общие издержки без увеличения затрат на инференс.

LightX2V был открытым релизом и включает оптимизации, такие как ускорение DiT‑дистилляции, облегчённый VAE и разреженное внимание. По заявлению компании, фреймворк способен генерировать 5‑секундное видео на потребительских графических картах менее чем за 5 секунд и собрал более 5,3 миллиона загрузок.

На отечественных аппаратных платформах Seko достигает сопоставимой скорости: зарубежные платформы показывают примерно 1,25 секунды видео в секунду работы, а отечественные — около 1,0625 секунды в секунду. По мере роста производительности и развития экосистемы SenseTime ожидает дальнейшего сокращения этого разрыва и намерена предлагать внутренние решения для удешевления создания видео.

Seko уже способствовала появлению ряда популярных проектов; например, игровая короткая драма «Wan Xin Ji» возглавляла чарты AI‑коротких драм в Douyin. Кроме того, SenseTime объявила стратегическое партнёрство с Yangtze River Film Group для совместной работы над короткими драмами на основе цзинчуской культурной и исторической тематики и со‑инкубации полнометражных AIGC‑фильмов.


Понравилось? Поделитесь с друзьями!

127
23 поделились, 127 баллы

Какова ваша реакция?

Чего? Чего?
1
Чего?
Плачу Плачу
8
Плачу
Прикол Прикол
7
Прикол
Ого Ого
6
Ого
Злой Злой
5
Злой
Ржака Ржака
4
Ржака
Ух, ты! Ух, ты!
3
Ух, ты!
Ужас Ужас
1
Ужас
Супер Супер
8
Супер
Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.

Комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Выберите формат
Пост
Форматированный текст с вставками и визуальными элементами
Опрос
Голосование для принятия решений или определения мнений
Изображение
Фото или GIF
Видео
Вставки с YouTube, Vimeo или Vine
Аудио
Вставки с SoundCloud или Mixcloud
Мем
Загружайте свои изображения для создания собственных мемов
Send this to a friend