AI个人学习
和实操指南
资源推荐1

SkyReels-V1:生成高品质人体动作视频的开源视频模型

本文于 2025-02-23 14:26 更新,部分内容具有时效性,如有失效,请留言

综合介绍

SkyReels-V1 是由 SkyworkAI 团队开发的一个开源项目,专注于生成高品质、以人类为中心的视频内容。该项目基于 HunyuanVideo 模型,通过对数千万高质量影视片段的微调,打造出全球首个人类动作视频基础模型。它不仅支持文本转视频(T2V)和图像转视频(I2V)功能,还能生成具有33种面部表情和400多种自然动作的逼真动画,画面质量媲美影视级别。SkyReels-V1 的开源特性使其在同类工具中脱颖而出,适合创作者、教育者以及AI研究者用于短剧制作、动画设计或技术探索。项目托管在 GitHub 上,提供详细的代码、模型权重和使用文档,方便用户快速上手。

SkyReels-V1:生成高品质人体动作视频的开源视频模型-1


 

功能列表

  • 文本转视频(T2V): 根据用户输入的文本描述生成动态视频,如“一只戴墨镜的猫在泳池边当救生员”。
  • 图像转视频(I2V): 将静态图像转化为动态视频,保留原始图像特征并添加自然动作。
  • 高级面部动画: 支持33种细腻表情和400多种动作组合,精确呈现人类情感和肢体语言。
  • 影视级画面质量: 利用高质量影视数据训练,提供专业构图、光影效果和镜头感。
  • 高效推理框架: 通过 SkyReelsInfer 实现快速视频生成,支持多GPU并行计算,提升生成效率。
  • 灵活参数调整: 用户可自定义视频分辨率(如544x960)、帧数(如97帧)、引导尺度等参数。
  • 开源模型权重: 提供预训练模型,方便开发者直接下载和二次开发。

 

使用帮助

安装流程

SkyReels-V1 是一个基于 Python 的工具,需要一定的硬件和软件环境支持。以下是详细的安装与使用步骤:

环境要求

  • 硬件: 建议使用配备 NVIDIA GPU(如 RTX 4090 或 A800)的电脑,确保 CUDA 支持。
  • 操作系统: Windows、Linux 或 macOS(后者可能需额外配置)。
  • 软件依赖: Python 3.10+、CUDA 12.2、PyTorch、Git。

安装步骤

  1. 克隆仓库
    打开终端,输入以下命令下载 SkyReels-V1 项目代码:
git clone https://github.com/SkyworkAI/SkyReels-V1.git
cd SkyReels-V1

这会在本地创建一个项目文件夹。

  1. 创建虚拟环境(可选但推荐)
    为避免依赖冲突,建议使用虚拟环境:
conda create -n skyreels python=3.10
conda activate skyreels
  1. 安装依赖
    项目提供了一个 requirements.txt 文件,运行以下命令安装所需库:
pip install -r requirements.txt

确保网络畅通,可能需要几分钟完成安装。

  1. 下载模型权重
    SkyReels-V1 的模型权重托管在 Hugging Face 上,可手动下载至本地,或直接通过代码指定路径。访问 Hugging Face 模型页面,下载 SkyReels-V1-Hunyuan-T2V 文件夹,放置在项目目录下(如 /path/to/SkyReels-V1/models)。
  2. 验证安装
    运行示例命令测试环境是否正常:
python3 video_generate.py --model_id ./models/SkyReels-V1-Hunyuan-T2V --prompt "FPS-24, A dog running in a park"

若无报错并生成视频,则安装成功。

操作主要功能

文本转视频(T2V)

  1. 准备提示词
    编写一个描述视频内容的提示词,需以 "FPS-24" 开头,例如:
FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool
  1. 运行生成命令
    在终端输入以下命令:
python3 video_generate.py 
--model_id /path/to/SkyReels-V1-Hunyuan-T2V 
--guidance_scale 6.0 
--height 544 
--width 960 
--num_frames 97 
--prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool" 
--embedded_guidance_scale 1.0 
--quant --offload --high_cpu_memory 
--gpu_num 1
  • --guidance_scale: 控制文本引导强度,推荐 6.0。
  • --height 和 --width: 设置视频分辨率,默认 544x960。
  • --num_frames: 生成帧数,97 帧约等于 4 秒视频(24 FPS)。
  • --quant--offload: 优化内存使用,适合低配设备。
  1. 输出结果
    生成的视频将保存在 results/skyreels 文件夹中,文件名为提示词+种子值,例如 FPS-24_A_cat_wearing_sunglasses_42_0.mp4

图像转视频(I2V)

  1. 准备图像
    上传一张静态图像(如 PNG 或 JPG),确保图像清晰,推荐分辨率接近 544x960。
  2. 运行命令
    添加 --task_type i2v 和 --image 参数,例如:
python3 video_generate.py 
--model_id /path/to/SkyReels-V1-Hunyuan-T2V 
--task_type i2v 
--guidance_scale 6.0 
--height 544 
--width 960 
--num_frames 97 
--prompt "FPS-24, A person dancing" 
--image ./input/cat_photo.png 
--embedded_guidance_scale 1.0
  1. 查看结果
    输出视频将基于图像生成动态内容,同样保存在 results/skyreels 文件夹。

调整参数优化效果

  • 帧率与时长: 修改 --num_frames 和 --fps(默认 24),如需 10 秒视频,设置为 240 帧。
  • 画面质量: 增加 --num_inference_steps(默认 30),提升细节但耗时更长。
  • 多GPU支持: 设置 --gpu_num 为可用 GPU 数量,加速处理。

特色功能操作

高级面部动画

SkyReels-V1 的核心亮点是其面部动画能力。提示词中描述具体表情(如“惊讶”或“微笑”),模型会自动生成33种表情之一,并搭配自然动作。例如:

FPS-24, A woman laughing heartily in a cafe

生成后,视频中的人物会展示逼真的笑脸和身体微动,细节媲美真人表演。

影视级画面

无需额外配置,SkyReels-V1 默认输出具有专业光影和构图的视频。提示词中加入场景描述(如“夜晚霓虹灯下”),即可获得更具电影感的画面。

注意事项

  • 硬件限制: 若 GPU 显存不足(如低于 12GB),建议启用 --quant 和 --offload,或降低分辨率至 512x320。
  • 提示词技巧: 简洁具体的描述效果最佳,避免模糊词语。
  • 社区支持: 遇到问题可访问 GitHub Issues 页面提交反馈,或查阅社区讨论。

通过以上步骤,用户可以轻松上手 SkyReels-V1,生成高质量视频内容,无论是短剧创作还是动画实验都游刃有余。

内容1
未经允许不得转载:首席AI分享圈 » SkyReels-V1:生成高品质人体动作视频的开源视频模型

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文