DH live: ИИ цифровых людей с плавным взаимодействием в реальном времени на видеокартах серии 30/40
Общее введение
DH_live - это проект цифрового человека в реальном времени, основанный на обучении по принципу "образец меньше", цель которого - обеспечить пользователям плавную и интерактивную трансляцию в реальном времени. Проект поддерживает видеокарты NVIDIA 30 и 40 серий и способен работать в режиме реального времени со скоростью 25+ кадров в секунду. Пользователи могут создавать и использовать цифровых людей в простых шагах, обеспечивая создание видео со звуком и взаимодействие в реальном времени.
Список функций
- Производительность в реальном времени: поддержка видеокарт NVIDIA серий 30 и 40 для плавной интерактивной работы в реальном времени.
- Обучение на нескольких примерах: система способна обучаться на небольшом количестве примеров, чтобы генерировать реалистичные ответы.
- Подготовка видео: используйте сценарий data_preparation для подготовки видеоданных.
- Аудиодрайвер: поддерживает управление цифровыми людьми через аудиофайлы для создания синхронизированного видео.
- Вход для микрофона в режиме реального времени: поддерживает работу в режиме реального времени через микрофон.
Использование помощи
Создание среды и распаковка файла модели
- Создайте виртуальную среду и активируйте ее:
conda create -n dh_live python=3.12 conda activate dh_live
- Установите зависимость:
pip install torch --index-url https://download.pytorch.org/whl/cu124 pip install -r requirements.txt
- Распакуйте файлы модели:
- Linux.
cd checkpoint cat render.pth.gz.001 render.pth.gz.002 > render.pth.gz gzip -d -c render.pth.gz > render.pth
- Windows: Распакуйте файл контрольной точки с помощью 7zip или WinRAR.
- Linux.
Подготовка видео
- пользоваться
data_preparation.py
Видеоролик о подготовке сценария:python data_preparation.py YOUR_VIDEO_PATH
Результаты будут сохранены в
./video_data
Каталог.
Работа с аудиофайлами
- Убедитесь, что аудиофайл имеет формат .wav с частотой дискретизации 16 кГц, 16-битный монофонический формат.
- Запустите демонстрационный сценарий:
python demo.py video_data/test video_data/audio0.wav 1.mp4
работа в режиме реального времени
- Используйте микрофон для работы в режиме реального времени:
python demo_avatar.py
общие проблемы
- Невозможность распаковать файл модели: Убедитесь, что все файлы вложенных томов завершены и правильно распакованы.
- Неправильный формат аудиофайла: Пожалуйста, используйте соответствующий файл .wav.
DH live one-click installer
Ссылка: https://pan.quark.cn/s/5a34bc9c2f76
Код экстракта: sZT4
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...