SkyReels V2: ИИ-инструмент с открытым исходным кодом для создания видеороликов неограниченной длины
Общее введение
SkyReels-V2 - это модель генерации видео с открытым исходным кодом, разработанная SkyworkAI. Она поддерживает генерацию видео неограниченной длины с помощью передовых технологий Diffusion Forcing для задач преобразования текста в видео (T2V) и изображения в видео (I2V). Пользователи могут генерировать высококачественный видеоконтент кинематографического качества, используя текстовые описания или входные изображения. Модель хорошо зарекомендовала себя в сообществе разработчиков с открытым исходным кодом, а ее производительность сопоставима с коммерческими моделями, такими как Kling и Runway-Gen4. Она предоставляет гибкие схемы вывода, подходящие для разработчиков, создателей и исследователей, а код и веса модели SkyReels-V2 находятся в открытом доступе на GitHub для легкой загрузки и развертывания.

Список функций
- Создание видео неограниченной длины: Поддержка создания видео любой длины, подходящих как для короткометражных, так и для полнометражных фильмов.
- Текст в видео (T2V): Генерируйте видеоконтент, соответствующий описанию, с помощью текстовых подсказок.
- Передача изображения в видео (I2V): Генерируйте динамическое видео на основе входного изображения, сохраняя его характеристики.
- мультимодальная поддержка: Сочетание крупномасштабного моделирования языка (MLLM) и обучения с подкреплением для улучшения качества генерации видео.
- Поколение историй: Автоматическое создание раскадровок видео, соответствующих логике повествования.
- управление камерой: Предоставляет режиссерскую точку зрения с поддержкой настройки углов камеры и движения.
- Многосубъектная согласованность: Обеспечьте визуальную согласованность в многоролевых видеороликах с помощью системы SkyReels-A2.
- Эффективная система рассуждений: Поддержка мульти-GPU для оптимизации скорости генерации и использования ресурсов.
Использование помощи
Процесс установки
SkyReels-V2 - это проект с открытым исходным кодом на основе Python, вам необходимо настроить среду локально или на сервере. Вот подробные шаги по установке:
- склад клонов
Откройте терминал и выполните следующую команду, чтобы получить код SkyReels-V2:git clone https://github.com/SkyworkAI/SkyReels-V2 cd SkyReels-V2
- Создание виртуальной среды
Рекомендуется создавать виртуальную среду с использованием Python 3.10.12, чтобы избежать конфликтов зависимостей:conda create -n skyreels-v2 python=3.10 conda activate skyreels-v2
- Установка зависимостей
Установите библиотеки Python, необходимые для проекта, и запустите его:pip install -r requirements.txt
- Скачать модельные веса
Модельные веса для SkyReels-V2 размещены на сайте Hugging Face. Загрузите их с помощью следующей команды:pip install -U "huggingface_hub[cli]" huggingface-cli download Skywork/SkyReels-V2 --local-dir ./models
Убедитесь, что у вас достаточно места на диске (размер модели может составлять десятки гигабайт).
- требования к оборудованию
- минимальная конфигурация: Одноблочный RTX 4090 (24 ГБ VRAM) с поддержкой FP8 для количественного снижения требований к памяти.
- Рекомендуемые конфигурации: Несколько графических процессоров (например, 4-8 A100) для поддержки эффективного параллельного вывода.
- Не менее 32 ГБ системной памяти и 100 ГБ дискового пространства.
Использование
SkyReels-V2 предоставляет две основные функции: преобразование текста в видео (T2V) и изображения в видео (I2V). Ниже описана конкретная процедура работы:
Текст в видео (T2V)
- Подготовка подсказок
Напишите текстовые подсказки, описывающие содержание видео, например:A serene lake surrounded by towering mountains, with swans gliding across the water.
Чтобы избежать нежелательных элементов, можно добавить негативные сигналы:
low quality, deformation, bad composition
- Запустите сгенерированный скрипт
модификацииgenerate_video.py
параметры, установите разрешение, частоту кадров и т.д:python generate_video.py --model_id "Skywork/SkyReels-V2-T2V-14B-540P" --prompt "A serene lake surrounded by mountains" --num_frames 97 --fps 24 --outdir ./output
--model_id
: Выберите модель (например, 540P или 720P).--num_frames
: Установка частоты кадров видео (по умолчанию 97).--fps
: Частота кадров (по умолчанию 24).--outdir
: Путь сохранения выходного видео.
- Просмотр выходных данных
Созданное видео будет сохранено в формате MP4, например.output/serene_lake_42_0.mp4
.
Передача изображения в видео (I2V)
- Подготовка входного изображения
Предоставьте изображение высокого качества (например, PNG или JPG), убедившись, что разрешение соответствует модели (по умолчанию 960x544). - Запустите сгенерированный скрипт
существоватьgenerate_video.py
Укажите путь к изображению в полеpython generate_video.py --model_id "Skywork/SkyReels-V2-I2V-14B-540P" --prompt "A warrior fighting in a forest" --image ./input_image.jpg --num_frames 97 --fps 24 --outdir ./output
--image
: Введите путь к изображению.- Остальные параметры аналогичны параметрам T2V.
- Настройки оптимизации
- пользоваться
--guidance_scale
(По умолчанию 6,0) Регулирует интенсивность рулевого управления текстом. - пользоваться
--inference_steps
(по умолчанию 30) Контролирует качество генерации, чем больше шагов, тем выше качество, но тем больше времени это занимает. - начать использовать
--offload
Оптимизация использования памяти для устройств с малым объемом графической памяти.
- пользоваться
Функциональное управление
- Видео неограниченной длины
SkyReels-V2 использует технологию Diffusion Forcing для создания очень длинных видео. Запускайте сценарии вывода длинных видео:python inference_long_video.py --model_id "Skywork/SkyReels-V2-T2V-14B-720P" --prompt "A sci-fi movie scene" --num_frames 1000
- Рекомендуется генерировать их сегментами по 97-192 кадра в каждом, а затем сшивать их вместе с помощью инструментов постпродакшна.
- Поколение историй
Используйте функцию Story Generation системы SkyReels-A2, чтобы ввести описание сюжета:A hero’s journey through a futuristic city, facing challenges.
Бег:
python story_generate.py --prompt "A hero’s journey" --output story_video.mp4
Система будет генерировать видео с раскадровкой, автоматически расставляя сцены и кадры.
- управление камерой
пройти (законопроект, проверку и т.д.)--camera_angle
Параметр задает вид объектива (например, "фронтальный" или "профильный"):python generate_video.py --prompt "A car chase" --camera_angle "profile" --outdir ./output
- Многосубъектная согласованность
SkyReels-A2 поддерживает многосимвольные сцены. Предоставляет несколько эталонных изображений для запуска:python multi_subject.py --prompt "Two characters talking" --images "char1.jpg,char2.jpg" --outdir ./output
Убедитесь, что персонажи визуально соответствуют друг другу в видео.
Оптимизация и отладка
- дефицит памяти: Включить
--quant
Количественное определение с помощью FP8, или--offload
Переложите часть вычислений на центральный процессор. - Создание качества: Увеличить
--inference_steps
(например, 50) или настроить--guidance_scale
(например, 8,0). - Поддержка общества: Проверьте проблемы на GitHub Issues или присоединяйтесь к SkyReels Обсуждение сообщества.
сценарий применения
- Создание коротких видеороликов
Создатели могут использовать функцию T2V для быстрого создания коротких видеоклипов на основе текста, подходящих для создания контента для социальных сетей. - Предварительное производство фильма
Режиссеры могут использовать функции создания видео неограниченной длины и сюжетов для создания трейлеров к фильмам или концепт-фильмов, что позволяет сократить первоначальные расходы. - Виртуальная витрина электронной коммерции
Используйте функцию I2V, чтобы превратить изображения товара в динамичные видеоролики, демонстрирующие его использование в виртуальной сцене. - Образовательная анимация
Учителя могут создавать обучающие анимации на основе текстовых описаний, чтобы наглядно представить сложные концепции, например, процесс научного эксперимента. - разработка игр
Разработчики могут генерировать игровые сцены или анимации персонажей, чтобы использовать их в качестве материала для прототипов или переходов.
QA
- Какие разрешения поддерживает SkyReels-V2?
В настоящее время поддерживается 540P (960x544) и 720P (1280x720), с возможностью расширения до более высоких разрешений в будущем. - Сколько видеопамяти мне нужно для работы?
Один RTX 4090 (24 ГБ) может выполнять базовые рассуждения, а конфигурации с несколькими GPU - ускорять сырое и выращенное видео. - Как улучшить качество создаваемых видеороликов?
Увеличьте количество шагов рассуждения (--inference_steps
), оптимизировать слова подсказки или использовать высококачественные входные изображения. - Поддерживает ли он генерацию в режиме реального времени?
В настоящее время генерация в автономном режиме, генерация в реальном времени требует более высокой аппаратной поддержки и может быть оптимизирована в будущем. - Являются ли модели весов бесплатными?
Да, SkyReels-V2 - это полностью открытый исходный код, и весы можно бесплатно загрузить с сайта Hugging Face.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...