
22 декабря 2025 года компания SenseTime представила Seko 2.0 — агент для генерации многосерийных коротких драм и motion‑комиксов, рассчитанный на создание до 100 эпизодов. Seko 2.0 обеспечивает согласованность образов, сцен и реквизита между эпизодами и сокращает время производства комикс‑драм на 80–90% по сравнению с традиционными методами.
Seko 2.0 работает на открытом фреймворке LightX2V — первом в отрасли решении вывода, способном генерировать видео в реальном времени. Это сочетание архитектур и оптимизаций позволяет добиваться высокой пропускной способности при относительно низких затратах на производство.
Первая версия Seko была выпущена в июле 2025 года и за два месяца привлекла более 100 000 создателей; менее чем за полгода база пользователей превысила 200 000 человек. Около 30% пользователей занимались короткими драмами, а примерно 20% — комикс‑драмами.
Seko 2.0 снижает порог входа для создателей и делает процесс производства более эффективным. Среди ключевых улучшений — переработанный интерфейс, расширенные возможности многосерийной генерации с управлением длинным контекстом и интеллигентное планирование сцен и персонажей.
Переработанный пользовательский интерфейс оптимизирован для визуального представления и нацелен на более погружённый творческий опыт. Это упрощает подбор образов, компоновку сцен и работу с визуальными элементами проекта.
Поддержка многосерийной генерации позволяет создавать до 100 эпизодов с сохранением преемственности сюжета и визуальных характеристик персонажей. Управление длинным контекстом важно для проектов с большим числом эпизодов и сложной сквозной логикой.
Интеллектуальное планирование агентов даёт возможность гибко связывать персонажей, сцены и предметы между эпизодами и адаптировать макияж и стилизацию под разные сценарии. Такая система уменьшает вероятность визуальных несоответствий при смене ракурсов и выражений.
По словам Сюй Ли, председателя правления и генерального директора SenseTime, Seko открывает доступ к творчеству для людей с воображением, но без профессиональных навыков производства, позволяя им войти в экосистему созидания. Компания также ожидает, что по мере развития ИИ качество генерируемого контента будет повышаться, позволяя сосуществовать как более утончённым, так и массовым форматам.
В Китае наблюдается стремительный рост рынка AI‑комиксов и коротких драм: в первой половине года предложение комикс‑драм в материковом Китае росло со среднегодовым темпом 83%. За этот период было создано более 3 000 произведений, а суммарные доходы увеличились в 12 раз, что привлекло множество отдельных авторов и небольших команд.
В Seko 2.0 реализована технология SekoIDX, обеспечивающая консистентность персонажей в многосерийных и сквозных съёмках. В систему введены «негативные эталонные изображения» на фазе высокого шума диффузионных моделей, что снижает избыточное копирование образов и сохраняет естественность при различных позах и эмоциях.
Технология SekoTalk отвечает за многоперсное движение губ и точную аудиовизуальную синхронизацию. Решение рассчитано на сценарии с несколькими участниками и обеспечивает синхронизацию как для обычных диалогов, так и для интенсивных сцен с эмоциональными всплесками.
Эти технологические достижения напрямую повышают производительность производства. По сравнению с традиционным рабочим процессом, где команда тратила более трёх месяцев на 50 эпизодов, Seko 2.0 сокращает цикл производства на 80–90% и позволяет независимым авторам работать в модели «один человек — одна команда».
Для снижения стоимости многосерийной генерации SenseTime разработала фазовую DMD‑дистилляцию в сочетании с моделью Mixture of Experts (MoE), что позволяет распределять задачи между специализированными моделями. Один 5‑секундный фрагмент требует почти 100 000 токенов, а 10–20 кадров могут потребовать от 1 до 2 миллионов токенов; фазовая дистилляция и разделение задач по этапам уменьшают общие издержки без увеличения затрат на инференс.
LightX2V был открытым релизом и включает оптимизации, такие как ускорение DiT‑дистилляции, облегчённый VAE и разреженное внимание. По заявлению компании, фреймворк способен генерировать 5‑секундное видео на потребительских графических картах менее чем за 5 секунд и собрал более 5,3 миллиона загрузок.
На отечественных аппаратных платформах Seko достигает сопоставимой скорости: зарубежные платформы показывают примерно 1,25 секунды видео в секунду работы, а отечественные — около 1,0625 секунды в секунду. По мере роста производительности и развития экосистемы SenseTime ожидает дальнейшего сокращения этого разрыва и намерена предлагать внутренние решения для удешевления создания видео.
Seko уже способствовала появлению ряда популярных проектов; например, игровая короткая драма «Wan Xin Ji» возглавляла чарты AI‑коротких драм в Douyin. Кроме того, SenseTime объявила стратегическое партнёрство с Yangtze River Film Group для совместной работы над короткими драмами на основе цзинчуской культурной и исторической тематики и со‑инкубации полнометражных AIGC‑фильмов.


Комментариев