X-Dyna: референс портрета видео Поза поколения видео, чтобы заставить фотографии Мисси танцевать

Последние ресурсы по искусственному интеллектуОбновлено 11 месяцев назад Круг обмена ИИ

39.5K 00

Общее введение

X-Dyna - это проект с открытым исходным кодом, разработанный компанией ByteDance для создания динамических портретных анимаций с помощью техники диффузии с нулевой выборкой. Проект использует мимику и движения тела в видеоролике для анимирования отдельных портретных изображений, создавая реалистичные и контекстно-зависимые анимации. x-Dyna повышает живость и детализацию портретных видеоанимаций, внедряя модуль динамического адаптера, который плавно интегрирует внешний контекст опорного изображения в пространственное внимание опорной сети диффузии.

Список функций

Генерация динамической портретной анимации: создание реалистичной динамической портретной анимации с использованием мимики и движений тела в видеозаписи с диска.
Метод диффузии с нулевой выборкой: генерирует высококачественные анимации без предварительного обучения.
Модуль динамического адаптера: интеграция контекста опорного изображения для повышения детализации и живости анимации.
Передача выражения лица: захват выражения лица с помощью локального модуля управления для точной передачи выражения.
Коды оценки: Предоставьте различные метрики оценки (например, DTFVD, Face-Cos, Face-Det, FID и т. д.) для оценки качества анимации.
Открытый исходный код и модели: полный код вывода и предварительно обученные модели предоставляются для простоты использования и вторичной разработки.

Использование помощи

Процесс установки

Хранилище проектов клонирования:

   git clone https://github.com/bytedance/X-Dyna.git
cd X-Dyna

Установите зависимость:

   pip install -r requirements.txt

Установите среду PyTorch 2.0:

   bash env_torch2_install.sh

Использование

Подготовьте входное изображение и приводное видео:
- Входное изображение: одно портретное изображение.
- Drive Video: видео, содержащее мимику и движения тела цели.
Запустите код вывода, чтобы сгенерировать анимацию:

   python inference_xdyna.py --input_image path_to_image --driving_video path_to_video

Оцените качество созданной анимации:
- Качество созданных анимаций оценивалось с помощью предоставленного кода оценки и набора данных.

   python evaluate.py --generated_video path_to_generated_video --metrics DTFVD,Face-Cos,Face-Det,FID

Подробный порядок работы функций

Генерация динамической анимации портрета::
- Выберите в качестве исходного материала статичное портретное изображение.
- Выберите видео с диска, на котором запечатлены движения и выражения лица объекта.
- Запустите код вывода для создания динамической анимации портрета.
передача выражения лица::
- Запечатлейте выражения лиц на видеороликах с дисками с помощью модуля локального управления.
- Перенесите запечатленное выражение лица на входное изображение для точной анимации выражения.
Модуль динамического адаптера::
- Модуль динамического адаптера легко интегрирует внешний контекст эталонного изображения в пространственное внимание диффузной магистральной сети.
- Таким образом, созданная анимация сохраняет больше деталей и живости.
Код оценки::
- Для оценки качества созданных анимаций предусмотрены различные метрики (например, DTFVD, Face-Cos, Face-Det, FID и т. д.).
- Пользователи могут полностью оценить созданные анимации на основе этих показателей.
Открытый исходный код и моделирование::
- Проект предоставляет полный код вывода и предварительно обученные модели, которые могут быть легко использованы пользователями для вторичной разработки и индивидуальных приложений.

Часто задаваемые вопросы.

Анимация не плавная: постарайтесь увеличитьnum_mixили корректировкиddim_steps.
несоответствие в выражении лица: Убедитесь, что выборbest_frameсоответствует кадру в видеозаписи диска, который наиболее похож по выражению на исходное изображение.

Продвинутое использование.

оптимизировать производительность: Скорость генерации может быть улучшена за счет сокращения количества шагов вывода при использовании модели LCM LoRA.
Пользовательские модели: Если у вас есть особые потребности, вы можете изменить или расширить модель в соответствии с указаниями в README.

Следуя этим шагам, пользователи смогут легко начать работу с X-Dyna для создания высококачественных динамических портретных анимаций, а также полностью оценить и оптимизировать созданные анимации.

Последние ресурсы по искусственному интеллекту # AI Преобразование изображений в видео # AI Java Open Source Projecct

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Music Muse - платформа для создания музыки с искусственным интеллектом, которая генерирует музыкальные композиции по простым описаниям

Последние ресурсы по искусственному интеллекту

7 месяцев назад

034.7K

GirlfriendGPT：使用ChatGPT技术打造你的个性化专属AI女友（NSFW）

GirlfriendGPT: создайте свою персональную и эксклюзивную девушку с искусственным интеллектом, используя технологию ChatGPT (NSFW)

Последние ресурсы по искусственному интеллекту Ролевая игра # AI

1 год назад

065.4K

Seed GR-3 - робототехническая модель общего назначения от команды Wordpress Seed

Последние ресурсы по искусственному интеллекту

5 месяцев назад

033.1K

Vmake AI: инструмент для улучшения качества видео и изображений, удаления водяных знаков в один клик

Последние ресурсы по искусственному интеллекту # AI Увеличение и восстановление изображений # AI-ключ для смены фона

10 месяцев назад

054.2K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

X-Dyna: референс портрета видео Поза поколения видео, чтобы заставить фотографии Мисси танцевать

Общее введение

Список функций

Использование помощи

Процесс установки

Использование

Подробный порядок работы функций

Часто задаваемые вопросы.

Продвинутое использование.

Tencent Hybrid 3D (Hunyuan3D): создание 3D-активов высокого разрешения, несколько рабочих процессов создания 3D-материалов

Go-with-the-Flow: управляет движением объектов в видео, добавляя или вычитая любые движущиеся объекты в видео.

Похожие статьи

Music Muse - платформа для создания музыки с искусственным интеллектом, которая генерирует музыкальные композиции по простым описаниям

GirlfriendGPT: создайте свою персональную и эксклюзивную девушку с искусственным интеллектом, используя технологию ChatGPT (NSFW)

Seed GR-3 - робототехническая модель общего назначения от команды Wordpress Seed

Vmake AI: инструмент для улучшения качества видео и изображений, удаления водяных знаков в один клик

Нет комментариев

Последние коллекции

Последние статьи

X-Dyna: референс портрета видео Поза поколения видео, чтобы заставить фотографии Мисси танцевать

Общее введение

Список функций

Использование помощи

Процесс установки

Использование

Подробный порядок работы функций

Часто задаваемые вопросы.

Продвинутое использование.

Tencent Hybrid 3D (Hunyuan3D): создание 3D-активов высокого разрешения, несколько рабочих процессов создания 3D-материалов

Go-with-the-Flow: управляет движением объектов в видео, добавляя или вычитая любые движущиеся объекты в видео.

Похожие статьи

Music Muse - платформа для создания музыки с искусственным интеллектом, которая генерирует музыкальные композиции по простым описаниям

GirlfriendGPT: создайте свою персональную и эксклюзивную девушку с искусственным интеллектом, используя технологию ChatGPT (NSFW)

Seed GR-3 - робототехническая модель общего назначения от команды Wordpress Seed

Vmake AI: инструмент для улучшения качества видео и изображений, удаления водяных знаков в один клик

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи