SkyReels-V1：生成高品质人体动作视频的开源视频模型

114.2K 00

综合介绍

SkyReels-V1 是由 SkyworkAI 团队开发的一个开源项目，专注于生成高品质、以人类为中心的视频内容。该项目基于 HunyuanVideo 模型，通过对数千万高质量影视片段的微调，打造出全球首个人类动作视频基础模型。它不仅支持文本转视频（T2V）和图像转视频（I2V）功能，还能生成具有33种面部表情和400多种自然动作的逼真动画，画面质量媲美影视级别。SkyReels-V1 的开源特性使其在同类工具中脱颖而出，适合创作者、教育者以及AI研究者用于短剧制作、动画设计或技术探索。项目托管在 GitHub 上，提供详细的代码、模型权重和使用文档，方便用户快速上手。

功能列表

文本转视频（T2V）: 根据用户输入的文本描述生成动态视频，如“一只戴墨镜的猫在泳池边当救生员”。
图像转视频（I2V）: 将静态图像转化为动态视频，保留原始图像特征并添加自然动作。
高级面部动画: 支持33种细腻表情和400多种动作组合，精确呈现人类情感和肢体语言。
影视级画面质量: 利用高质量影视数据训练，提供专业构图、光影效果和镜头感。
高效推理框架: 通过 SkyReelsInfer 实现快速视频生成，支持多GPU并行计算，提升生成效率。
灵活参数调整: 用户可自定义视频分辨率（如544x960）、帧数（如97帧）、引导尺度等参数。
开源模型权重: 提供预训练模型，方便开发者直接下载和二次开发。

使用帮助

安装流程

SkyReels-V1 是一个基于 Python 的工具，需要一定的硬件和软件环境支持。以下是详细的安装与使用步骤：

环境要求

硬件: 建议使用配备 NVIDIA GPU（如 RTX 4090 或 A800）的电脑，确保 CUDA 支持。
操作系统: Windows、Linux 或 macOS（后者可能需额外配置）。
软件依赖: Python 3.10+、CUDA 12.2、PyTorch、Git。

安装步骤

克隆仓库
打开终端，输入以下命令下载 SkyReels-V1 项目代码：

git clone https://github.com/SkyworkAI/SkyReels-V1.git
cd SkyReels-V1

这会在本地创建一个项目文件夹。

创建虚拟环境（可选但推荐）
为避免依赖冲突，建议使用虚拟环境：

conda create -n skyreels python=3.10
conda activate skyreels

安装依赖
项目提供了一个 requirements.txt 文件，运行以下命令安装所需库：

pip install -r requirements.txt

确保网络畅通，可能需要几分钟完成安装。

下载模型权重
SkyReels-V1 的模型权重托管在 Hugging Face 上，可手动下载至本地，或直接通过代码指定路径。访问 Hugging Face 模型页面，下载 SkyReels-V1-Hunyuan-T2V 文件夹，放置在项目目录下（如 /path/to/SkyReels-V1/models）。
验证安装
运行示例命令测试环境是否正常：

python3 video_generate.py --model_id ./models/SkyReels-V1-Hunyuan-T2V --prompt "FPS-24, A dog running in a park"

若无报错并生成视频，则安装成功。

操作主要功能

文本转视频（T2V）

准备提示词
编写一个描述视频内容的提示词，需以 "FPS-24" 开头，例如：

FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool

运行生成命令
在终端输入以下命令：

python3 video_generate.py 
--model_id /path/to/SkyReels-V1-Hunyuan-T2V 
--guidance_scale 6.0 
--height 544 
--width 960 
--num_frames 97 
--prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool" 
--embedded_guidance_scale 1.0 
--quant --offload --high_cpu_memory 
--gpu_num 1

--guidance_scale: 控制文本引导强度，推荐 6.0。
--height 和 --width: 设置视频分辨率，默认 544x960。
--num_frames: 生成帧数，97 帧约等于 4 秒视频（24 FPS）。
--quant、--offload: 优化内存使用，适合低配设备。

输出结果
生成的视频将保存在 results/skyreels 文件夹中，文件名为提示词+种子值，例如 FPS-24_A_cat_wearing_sunglasses_42_0.mp4。

图像转视频（I2V）

准备图像
上传一张静态图像（如 PNG 或 JPG），确保图像清晰，推荐分辨率接近 544x960。
运行命令
添加 --task_type i2v 和 --image 参数，例如：

python3 video_generate.py 
--model_id /path/to/SkyReels-V1-Hunyuan-T2V 
--task_type i2v 
--guidance_scale 6.0 
--height 544 
--width 960 
--num_frames 97 
--prompt "FPS-24, A person dancing" 
--image ./input/cat_photo.png 
--embedded_guidance_scale 1.0

查看结果
输出视频将基于图像生成动态内容，同样保存在 results/skyreels 文件夹。

调整参数优化效果

帧率与时长: 修改 --num_frames 和 --fps（默认 24），如需 10 秒视频，设置为 240 帧。
画面质量: 增加 --num_inference_steps（默认 30），提升细节但耗时更长。
多GPU支持: 设置 --gpu_num 为可用 GPU 数量，加速处理。

特色功能操作

高级面部动画

SkyReels-V1 的核心亮点是其面部动画能力。提示词中描述具体表情（如“惊讶”或“微笑”），模型会自动生成33种表情之一，并搭配自然动作。例如：

FPS-24, A woman laughing heartily in a cafe

生成后，视频中的人物会展示逼真的笑脸和身体微动，细节媲美真人表演。

影视级画面

无需额外配置，SkyReels-V1 默认输出具有专业光影和构图的视频。提示词中加入场景描述（如“夜晚霓虹灯下”），即可获得更具电影感的画面。

注意事项

硬件限制: 若 GPU 显存不足（如低于 12GB），建议启用 --quant 和 --offload，或降低分辨率至 512x320。
提示词技巧: 简洁具体的描述效果最佳，避免模糊词语。
社区支持: 遇到问题可访问 GitHub Issues 页面提交反馈，或查阅社区讨论。

通过以上步骤，用户可以轻松上手 SkyReels-V1，生成高质量视频内容，无论是短剧创作还是动画实验都游刃有余。

文章版权归 AI分享圈所有，未经允许请勿转载。

VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

Llama 3.2 Reasoning WebGPU：在浏览器中运行LLama-3.2

AI新闻 # AI开源项目 # 本地部署开源大模型工具

1年前

050.3K

AR Drawing：利用AR和AI技术提升现实手绘技能的APP应用

最新AI资源 # AI开放服务

1年前

065.5K

Open Notebook：个性化AI笔记工具，Notebook LM开源替代方案

最新AI资源 # AI开源项目 # AI笔记

1年前

0110.2K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

SkyReels-V1：生成高品质人体动作视频的开源视频模型

综合介绍

功能列表

使用帮助

安装流程

环境要求

安装步骤

操作主要功能

文本转视频（T2V）

图像转视频（I2V）

调整参数优化效果

特色功能操作

高级面部动画

影视级画面

注意事项

Privatemode：提供端到端加密的AI聊天应用，保护企业数据隐私

MedKnows：医学领域临床和科研信息搜索

相关文章

VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

Llama 3.2 Reasoning WebGPU：在浏览器中运行LLama-3.2

AR Drawing：利用AR和AI技术提升现实手绘技能的APP应用

Open Notebook：个性化AI笔记工具，Notebook LM开源替代方案

暂无评论

最新收录

最新文章

SkyReels-V1：生成高品质人体动作视频的开源视频模型

综合介绍

功能列表

使用帮助

安装流程

环境要求

安装步骤

操作主要功能

文本转视频（T2V）

图像转视频（I2V）

调整参数优化效果

特色功能操作

高级面部动画

影视级画面

注意事项

Privatemode：提供端到端加密的AI聊天应用，保护企业数据隐私

MedKnows：医学领域临床和科研信息搜索

相关文章

VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

Llama 3.2 Reasoning WebGPU：在浏览器中运行LLama-3.2

AR Drawing：利用AR和AI技术提升现实手绘技能的APP应用

Open Notebook：个性化AI笔记工具，Notebook LM开源替代方案

暂无评论

AI工具精选

最新收录

最新文章