ChatAnyone: инструмент для создания видеороликов с портретом человека в половину тела на основе фотографий

Последние ресурсы по искусственному интеллектуОпубликовано 12 месяцев назад Круг обмена ИИ

59.5K 00

Общее введение

ChatAnyone - это инновационный проект, разработанный командой HumanAIGC. Он использует технологию искусственного интеллекта для создания цифрового портретного видео человека с движениями верхней части тела на основе одной фотографии и аудиоданных. Основываясь на иерархической модели распространения движения, проект генерирует движения головы, жесты и выражения, подходящие для представления аватаров или анимации цифровых людей. ChatAnyone отличается эффективной генерацией, поддерживая разрешение 512×768 и вывод видео со скоростью 30 кадров в секунду. В настоящее время проект демонстрирует технические детали на GitHub, но еще не полностью открыт, привлекая внимание многих пользователей, заинтересованных в технологии генерации цифровых людей.

Список функций

Фотогенерация Видео: Создание цифровых видеороликов человека с движениями верхней части тела на основе одной фотографии и аудиоданных.
управление движением: Поддержка генерации естественных движений головы, жестов и выражений.
аудиосинхронизация: Движения губ согласованы со звуком для повышения реалистичности.
Высокая производительность: Поддерживает разрешение 512×768 при 30 кадрах в секунду на графическом процессоре 4090.
Технологическая витрина: Поделитесь результатами на странице GitHub, чтобы пользователи могли изучать и исследовать их.

Использование помощи

ChatAnyone в настоящее время является демонстрационным проектом технологии и не является полностью открытым исходным кодом, поэтому не может быть непосредственно загружен или установлен. Нижеследующее содержание основано на официальной информации и подробно описывает его функциональность и логику работы, чтобы помочь пользователям понять проект и рассчитывать на возможное открытое использование в будущем.

Основные функции

1. Создание видео из фотографий

логика работы: Пользователь предоставляет портретную фотографию и аудиозапись (например, запись разговора или пения), а система генерирует видеоролик с изображением цифрового человека с движениями верхней части тела. Видео включает такие движения, как повороты головы и жесты.
эффект: Выходное видео разрешением до 512 x 768 с частотой 30 кадров в секунду. Цифровые движения человека согласованы с темпом звука, что подходит для отображения виртуальных образов.
Использование: В настоящее время о функциональности известно из официальных демонстрационных видеороликов или документации, а бета-версия может быть открыта в будущем.

2. Управление движением

логика работы: Система генерирует естественные движения верхней части тела на основе аудио, включая динамику головы и рук. Пользователи могут ознакомиться с диапазоном движений на примерах.
эффект: Созданный цифровой человек может представлять различные стили движения, такие как кивок и изменение жестов, для повышения выразительности.
Использование: Эта функция находится на стадии демонстрации, и пользователи могут посмотреть, как она работает, на странице GitHub.

3. Аудиосинхронизация

логика работы: После ввода чистого звука система генерирует движения губ, соответствующие ритму звука.
эффектГубы синхронизируются со звуком для виртуальных ведущих или анимированных презентаций.
Использование: В настоящее время опыт работы с системой осуществляется с помощью официального образца видеоролика, в будущем может быть реализована поддержка пользовательского тестирования.

Как получить дополнительную информацию

Посетите официальную страницу: Перейти к https://github.com/HumanAIGC/chat-anyoneПосмотрите описание проекта и презентационный ролик.
Следите за обновлениями: Проект пока не имеет открытого исходного кода, но команда может выпустить код или инструменты в будущем. Рекомендуется регулярно проверять репозиторий GitHub.
Свяжитесь с командойДля получения дополнительной информации, пожалуйста, оставьте сообщение на GitHub или найдите официальную контактную информацию.

предостережение

В настоящее время ChatAnyone является демонстрационным проектом и не может быть использован напрямую.
Для генерации требуется высокопроизводительное оборудование (например, 4090 GPU), с которым обычному пользователю сложно работать локально.
В будущем проект может стать открытым ресурсом, и тогда появится более подробное руководство.

сценарий применения

Презентация виртуального изображения
Пользователи могут создавать видеоролики с цифровыми людьми и фотографиями, чтобы показать индивидуальные виртуальные образы.
Производство анимационного контента
Создатели могут использовать сгенерированное видео с полуфигурой цифрового человека для создания короткометражных фильмов или презентационного контента.
Технические исследования
В рамках проекта исследователи смогут изучить методы создания цифровых людей с помощью звука.

QA

Может ли ChatAnyone общаться в режиме реального времени?
В настоящее время нет. Он ориентирован на создание видео из фотографий и аудио, а не на создание живого чата.
Какие типы фотографий поддерживаются?
Официальная презентация основана на портретных фотографиях, а конкретные требования можно найти в последующих документах.
Имеется ли видео в свободной продаже?
В настоящее время нет явной лицензии, нужно дождаться открытых исходников, чтобы увидеть соглашение.