LTX Video（LTXV）：生成高质量视频的实时视频生成开源模型

95.5K 00

综合介绍

LTX-Video是由Lightricks开发的首个基于DiT（Diffusion Transformer）的实时视频生成模型。该模型能够在768x512分辨率下以24帧每秒的速度生成高质量视频，速度快于观看视频的时间。LTX-Video经过大规模多样化视频数据集的训练，能够生成具有真实感和多样化内容的高分辨率视频。该模型的设计旨在提供快速且高效的视频生成解决方案，适用于各种创意和专业应用场景。

LTXV有明显的缺点，不要输入简单的提示词，要对视频画面进行详细的描述，或对提示词扩展。

体验地址：https://huggingface.co/spaces/Lightricks/LTX-Video-Playground

LTX Video 图像转视频工作流

LTX Video 文本转视频工作流

功能列表

实时视频生成：在768x512分辨率下以24帧每秒的速度生成视频。
高质量输出：生成高分辨率、真实感强且内容多样的视频。
多种生成模式：支持文本到视频、图像到视频和视频到视频的生成模式。
优化性能：LTX-VideoQ8版本在NVIDIA ADA GPU上优化，性能提升高达3倍。
集成支持：支持与 ComfyUI 和Diffusers的集成，提供灵活的工作流程。

使用帮助

安装流程

安装ComfyUI：
- 下载并安装ComfyUI。
克隆LTX-Video仓库：
- 在ComfyUI安装目录的custom-nodes文件夹中克隆LTX-Video仓库。
- 运行以下命令安装所需的Python包： bash cd custom_nodes/ComfyUI-LTXVideo pip install -r requirements.txt
- 对于便携式ComfyUI安装，运行以下命令： bash .\python_embeded\python.exe -m pip install -r .\ComfyUI\custom_nodes\ComfyUI-LTXVideo\requirements.txt
下载模型：
- 从Hugging Face下载ltx-video-2b-v0.9.1.safetensors并放置在models/checkpoints文件夹中。
- 安装T5文本编码器，例如googlet5-v11-xxl_encoderonly，可以使用ComfyUI Model Manager进行安装。