MuseV+Muse Talk: полная система генерации цифрового человеческого видео | портрет в видео | поза в видео | синхронизация губ

Общее введение

MuseV - это публичный проект на GitHub, предназначенный для создания аватарных видео неограниченной длины и высокой достоверности. Он основан на технологии диффузии и предоставляет различные возможности, такие как Image2Video, Text2Image2Video, Video2Video и другие. Подробно описана структура модели, примеры использования, краткое руководство, скрипты вывода и благодарности.

MuseV - это система создания видеороликов с виртуальными людьми, основанная на диффузионной модели и обладающая следующими возможностями:

Она поддерживает генерацию изображений бесконечной длины с использованием новой визуальной условно-параллельной схемы разрядки без проблемы накопления ошибок, особенно для сцен с фиксированным положением камеры.
Предоставляется предварительно обученная модель для создания видео аватаров, обученная на наборе данных о типах персонажей.
Поддерживает преобразование изображений в видео, текста в изображения и видео в видео.
Совместим с экосистемой создания графики Stable Diffusion, включая base_model, lora, controlnet и другие.
Поддержка нескольких технологий создания эталонных изображений, включая IPAdapter, ReferenceOnly, ReferenceNet, IPAdapterFaceID.
Позже мы также выпустим учебный код.

 

MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

 

 

Список функций

Создание видео неограниченной длины
Высокоточные виртуальные изображения человека
Универсальная поддержка: Image2Video, Text2Image2Video, Video2Video
Четкая структура модели и примеры использования
Быстрый старт и сценарии рассуждений

 

 

Использование помощи

Посещайте репозитории GitHub для получения обновлений и загружаемых ресурсов
Для первоначальной настройки проекта следуйте руководству по быстрому запуску
Создайте видеоконтент, используя предоставленные сценарии вывода

 

Комбинированный метод использования:

Метод 1: запись живого видео + Muse Talk

Метод 2: Изображение + MuseV + Muse Talk

 

готовый продукт

Из зацикленного видео сделайте аниме-персонажа говорящим, у мультяшного персонажа отсутствуют губы, что делает его речь странной, в следующий раз замените изображение на "губы", желательно "реальных людей". 45 секунд видео в официальном Подождите около 15 минут, чтобы получить тестовое окружение.

 

Заставить видео говорить в рабочих процессах ComfyUI

Мы запускаем MuseTalk MuseTalk - это высококачественная модель синхронизации рта в реальном времени (30fps+ на NVIDIA Tesla V100). MuseTalk может применяться с входным видео, например, генерируемым MuseV, в качестве комплексного решения для аватаров.

ComfyUI-MuseTalk

MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

 

 

MuseV Online Experience / Пакет установки в один клик для Windows

Онлайн-опыт MuseV

Опыт работы в сети MuseTalk

Модель синхронизации рта компаньона MuseV MuseTalk

Ссылка: https://pan.quark.cn/s/ed896ceda5c8
Код для извлечения: JygA

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...