本文于 2025-02-23 14:26 更新,部分内容具有时效性,如有失效,请留言
综合介绍
SkyReels-V1 是由 SkyworkAI 团队开发的一个开源项目,专注于生成高品质、以人类为中心的视频内容。该项目基于 HunyuanVideo 模型,通过对数千万高质量影视片段的微调,打造出全球首个人类动作视频基础模型。它不仅支持文本转视频(T2V)和图像转视频(I2V)功能,还能生成具有33种面部表情和400多种自然动作的逼真动画,画面质量媲美影视级别。SkyReels-V1 的开源特性使其在同类工具中脱颖而出,适合创作者、教育者以及AI研究者用于短剧制作、动画设计或技术探索。项目托管在 GitHub 上,提供详细的代码、模型权重和使用文档,方便用户快速上手。
功能列表
- 文本转视频(T2V): 根据用户输入的文本描述生成动态视频,如“一只戴墨镜的猫在泳池边当救生员”。
- 图像转视频(I2V): 将静态图像转化为动态视频,保留原始图像特征并添加自然动作。
- 高级面部动画: 支持33种细腻表情和400多种动作组合,精确呈现人类情感和肢体语言。
- 影视级画面质量: 利用高质量影视数据训练,提供专业构图、光影效果和镜头感。
- 高效推理框架: 通过 SkyReelsInfer 实现快速视频生成,支持多GPU并行计算,提升生成效率。
- 灵活参数调整: 用户可自定义视频分辨率(如544x960)、帧数(如97帧)、引导尺度等参数。
- 开源模型权重: 提供预训练模型,方便开发者直接下载和二次开发。
使用帮助
安装流程
SkyReels-V1 是一个基于 Python 的工具,需要一定的硬件和软件环境支持。以下是详细的安装与使用步骤:
环境要求
- 硬件: 建议使用配备 NVIDIA GPU(如 RTX 4090 或 A800)的电脑,确保 CUDA 支持。
- 操作系统: Windows、Linux 或 macOS(后者可能需额外配置)。
- 软件依赖: Python 3.10+、CUDA 12.2、PyTorch、Git。
安装步骤
- 克隆仓库
打开终端,输入以下命令下载 SkyReels-V1 项目代码:
git clone https://github.com/SkyworkAI/SkyReels-V1.git
cd SkyReels-V1
这会在本地创建一个项目文件夹。
- 创建虚拟环境(可选但推荐)
为避免依赖冲突,建议使用虚拟环境:
conda create -n skyreels python=3.10
conda activate skyreels
- 安装依赖
项目提供了一个requirements.txt
文件,运行以下命令安装所需库:
pip install -r requirements.txt
确保网络畅通,可能需要几分钟完成安装。
- 下载模型权重
SkyReels-V1 的模型权重托管在 Hugging Face 上,可手动下载至本地,或直接通过代码指定路径。访问 Hugging Face 模型页面,下载SkyReels-V1-Hunyuan-T2V
文件夹,放置在项目目录下(如/path/to/SkyReels-V1/models
)。 - 验证安装
运行示例命令测试环境是否正常:
python3 video_generate.py --model_id ./models/SkyReels-V1-Hunyuan-T2V --prompt "FPS-24, A dog running in a park"
若无报错并生成视频,则安装成功。
操作主要功能
文本转视频(T2V)
- 准备提示词
编写一个描述视频内容的提示词,需以 "FPS-24" 开头,例如:
FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool
- 运行生成命令
在终端输入以下命令:
python3 video_generate.py
--model_id /path/to/SkyReels-V1-Hunyuan-T2V
--guidance_scale 6.0
--height 544
--width 960
--num_frames 97
--prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool"
--embedded_guidance_scale 1.0
--quant --offload --high_cpu_memory
--gpu_num 1
--guidance_scale
: 控制文本引导强度,推荐 6.0。--height
和--width
: 设置视频分辨率,默认 544x960。--num_frames
: 生成帧数,97 帧约等于 4 秒视频(24 FPS)。--quant
、--offload
: 优化内存使用,适合低配设备。
- 输出结果
生成的视频将保存在results/skyreels
文件夹中,文件名为提示词+种子值,例如FPS-24_A_cat_wearing_sunglasses_42_0.mp4
。
图像转视频(I2V)
- 准备图像
上传一张静态图像(如 PNG 或 JPG),确保图像清晰,推荐分辨率接近 544x960。 - 运行命令
添加--task_type i2v
和--image
参数,例如:
python3 video_generate.py
--model_id /path/to/SkyReels-V1-Hunyuan-T2V
--task_type i2v
--guidance_scale 6.0
--height 544
--width 960
--num_frames 97
--prompt "FPS-24, A person dancing"
--image ./input/cat_photo.png
--embedded_guidance_scale 1.0
- 查看结果
输出视频将基于图像生成动态内容,同样保存在results/skyreels
文件夹。
调整参数优化效果
- 帧率与时长: 修改
--num_frames
和--fps
(默认 24),如需 10 秒视频,设置为 240 帧。 - 画面质量: 增加
--num_inference_steps
(默认 30),提升细节但耗时更长。 - 多GPU支持: 设置
--gpu_num
为可用 GPU 数量,加速处理。
特色功能操作
高级面部动画
SkyReels-V1 的核心亮点是其面部动画能力。提示词中描述具体表情(如“惊讶”或“微笑”),模型会自动生成33种表情之一,并搭配自然动作。例如:
FPS-24, A woman laughing heartily in a cafe
生成后,视频中的人物会展示逼真的笑脸和身体微动,细节媲美真人表演。
影视级画面
无需额外配置,SkyReels-V1 默认输出具有专业光影和构图的视频。提示词中加入场景描述(如“夜晚霓虹灯下”),即可获得更具电影感的画面。
注意事项
- 硬件限制: 若 GPU 显存不足(如低于 12GB),建议启用
--quant
和--offload
,或降低分辨率至 512x320。 - 提示词技巧: 简洁具体的描述效果最佳,避免模糊词语。
- 社区支持: 遇到问题可访问 GitHub Issues 页面提交反馈,或查阅社区讨论。
通过以上步骤,用户可以轻松上手 SkyReels-V1,生成高质量视频内容,无论是短剧创作还是动画实验都游刃有余。