¡HelloMeme: Genera local de alta fidelidad de expresión acción coherente imagen o vídeo, Runway Acto uno de código abierto de ping pong!

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

52.6K 00

Introducción general

HelloMeme es un proyecto de código abierto desarrollado por HelloVision para generar imágenes y vídeos de alta calidad mediante la integración de Spatial Knitting Attentions para incrustar condiciones de alto nivel y alta fidelidad en modelos de difusión. El código del proyecto y la implementación del modelo están alojados en GitHub y pueden ser descargados y utilizados libremente por los usuarios. HelloMeme proporciona una variedad de módulos funcionales, incluyendo generación de imágenes, generación de vídeo e integración con Gradio y ComfyUI La integración es fácil de usar para una gran variedad de experimentos y aplicaciones.

Relacionado:

LivePortrait: herramienta de animación para generar retratos dinámicos a partir de imágenes fijas y vídeos(código abierto)

ConsisID: un mapa de referencia de retratos para generar vídeos coherentes con los personajes, rápida integración multiterminal(código abierto)

Reface: sustitución de caras y generación de vídeos mediante IA para crear divertidas imágenes animadas (de pago)

HelloMeme：生成局部高保真表情动作一致的图像或视频，Runway Act one 开源平替

Lista de funciones

Generación de imágenes: Genera imágenes de alta calidad a partir de imágenes de referencia y de controladores.
Generación de vídeo: Genera vídeos de alta fidelidad basados en vídeos de referencia y de conductores.
Integración de Gradio: Proporciona una interfaz Gradio para la interacción con el usuario.
Integración de ComfyUI: Soporta la interfaz ComfyUI para simplificar el proceso de operación del usuario.
Módulos experimentales: Incluye una variedad de códigos experimentales para facilitar al usuario la realización de diferentes experimentos y pruebas.
algoritmo eficaz: Optimiza los algoritmos para reducir el uso de VRAM y mejorar la eficiencia de la generación.

Utilizar la ayuda

Proceso de instalación

Creación de un entorno Conda::

   conda create -n hellomeme python=3.10.11
conda activate hellomeme

Instalación de PyTorch y FFmpegPara una instalación más detallada, consulte los sitios web oficiales de PyTorch y FFmpeg.
Instalación de dependencias::

   pip install diffusers transformers einops scipy opencv-python tqdm pillow onnxruntime onnx safetensors accelerate peft

almacén de clones::

   git clone https://github.com/HelloVision/HelloMeme
cd HelloMeme

código en ejecución::
- Generación de imágenes: bash python inference_image.py
- Generación de vídeo: bash python inference_video.py
Instalación de la aplicación Gradio::

   pip install gradio
pip install imageio[ffmpeg]
python app.py

Función Flujo de operaciones

Generación de imágenes

Preparación de la imagen de entradaPrepara la imagen de referencia y la imagen de la unidad.
Ejecutar el script de generación de imágenes::

   python inference_image.py --reference_image path/to/reference.jpg --drive_image path/to/drive.jpg

Ver resultados generados: La imagen generada se guardará en el directorio especificado.

Generación de vídeo

Preparar la entrada de vídeo: Prepara vídeos de referencia y vídeos de conductores.
Ejecutar el script de generación de vídeo::

   python inference_video.py --reference_video path/to/reference.mp4 --drive_video path/to/drive.mp4

Ver resultados generados: El vídeo generado se guardará en el directorio especificado.

Uso de la interfaz de Gradio

Iniciar la aplicación Gradio::

   python app.py

Acceso a través del navegadorAbre tu navegador y visita http://localhost:7860La interfaz de Gradio puede utilizarse para generar imágenes y vídeos.

Uso de la interfaz ComfyUI

Instalar ComfyUIPor favor, consulte el sitio web oficial de ComfyUI para la instalación.
Ejecutar HelloMeme::

   python comfyui_hellomeme.py

Funcionamiento a través de la interfaz ComfyUISeleccione la función de generación de imagen o vídeo que desee, cargue los archivos de referencia y controladores y haga clic en el botón Generar.

advertencia

versión de dependenciaNota: Tenga en cuenta el requisito de versión de los difusores, actualmente las versiones compatibles son diffusers==0.31.0.
Uso de VRAMCuando se genera vídeo, cuanto más largo es el vídeo de la unidad, más VRAM se requiere, así que por favor ajústelo de acuerdo a la situación real.
Descarga de modelos: En la primera ejecución, todos los modelos se descargarán automáticamente, lo que puede llevar más tiempo.