HelloMeme: генерировать локальные высокой точностью выражения действия последовательное изображение или видео, подиум Act один открытый источник пинг-понг!

Последние ресурсы по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

58.2K 00

Общее введение

HelloMeme - это проект с открытым исходным кодом, разработанный компанией HelloVision для генерации высококачественных изображений и видео путем интеграции Spatial Knitting Attentions для встраивания высокоуровневых и высокоточных условий в диффузионные модели. Код проекта и реализация модели размещены на GitHub и могут быть свободно загружены и использованы пользователями. HelloMeme предоставляет множество функциональных модулей, включая генерацию изображений, генерацию видео и интеграцию с Gradio и ComfyUI Интеграция удобна для различных экспериментов и приложений.

ConsisID: портретная справочная карта для создания видео с учетом характера, быстрая многотерминальная интеграция(с открытым исходным кодом)

Reface: замена лица и создание видео с помощью искусственного интеллекта для создания забавных анимированных изображений (платно)

HelloMeme：生成局部高保真表情动作一致的图像或视频，Runway Act one 开源平替

Список функций

Генерация изображений: Создание высококачественных изображений из эталонных и драйверных изображений.
Поколение видео: Создавайте видеоролики с высокой точностью на основе эталонных видеороликов и видеороликов водителей.
Интеграция Gradio: Предоставляет интерфейс Gradio для взаимодействия с пользователем.
Интеграция с ComfyUI: Поддерживает интерфейс ComfyUI для упрощения процесса работы пользователя.
экспериментальный модуль: Включает в себя различные экспериментальные коды, чтобы облегчить пользователю проведение различных экспериментов и тестов.
эффективный алгоритм: Оптимизация алгоритмов для снижения потребления VRAM и повышения эффективности генерации.

Использование помощи

Процесс установки

Создание среды Conda::

   conda create -n hellomeme python=3.10.11
conda activate hellomeme

Установка PyTorch и FFmpeg: Пожалуйста, обратитесь к официальным сайтам PyTorch и FFmpeg для подробной установки.
Установка зависимостей::

   pip install diffusers transformers einops scipy opencv-python tqdm pillow onnxruntime onnx safetensors accelerate peft

склад клонов::

   git clone https://github.com/HelloVision/HelloMeme
cd HelloMeme

работающий код::
- Генерация изображений: bash python inference_image.py
- Поколение видео: bash python inference_video.py
Установка приложения Gradio::

   pip install gradio
pip install imageio[ffmpeg]
python app.py

Функции Поток операций

Генерация изображений

Подготовка входного изображения: Подготовьте эталонный образ и образ диска.
Запустите сценарий создания изображения::

   python inference_image.py --reference_image path/to/reference.jpg --drive_image path/to/drive.jpg

Просмотр сгенерированных результатов: Созданное изображение будет сохранено в указанном каталоге.

Поколение видео

Подготовка к вводу видео: Подготовьте справочные видеоматериалы и видеоролики для водителей.
Запустите сценарий создания видео::

   python inference_video.py --reference_video path/to/reference.mp4 --drive_video path/to/drive.mp4

Просмотр сгенерированных результатов: Созданное видео будет сохранено в указанном каталоге.

Использование интерфейса Gradio

Запуск приложения Gradio::

   python app.py

Доступ через браузер: Откройте браузер и посетите http://localhost:7860Интерфейс Gradio можно использовать для создания изображений и видео.

Использование интерфейса ComfyUI

Установите ComfyUI: Пожалуйста, обратитесь к официальному сайту ComfyUI для установки.
Запустите HelloMeme::

   python comfyui_hellomeme.py

Управление через интерфейс ComfyUI: Выберите функцию генерации изображения или видео, загрузите эталонные файлы и файлы драйверов и нажмите кнопку Generate.

предостережение

версия зависимости: Обратите внимание на требования к версии диффузоров, в настоящее время поддерживаются следующие версии diffusers==0.31.0.
Использование VRAM: При генерации видео, чем длиннее видео, тем больше VRAM требуется, поэтому настройте его в соответствии с реальной ситуацией.
Скачать модель: При первом запуске все модели будут загружены автоматически, что может занять больше времени.