¡HelloMeme: Genera local de alta fidelidad de expresión acción coherente imagen o vídeo, Runway Acto uno de código abierto de ping pong!
Últimos recursos sobre IAActualizado hace 9 meses Círculo de intercambio de inteligencia artificial 11.6K 00
Introducción general
HelloMeme es un proyecto de código abierto desarrollado por HelloVision para generar imágenes y vídeos de alta calidad mediante la integración de Spatial Knitting Attentions para incrustar condiciones de alto nivel y alta fidelidad en modelos de difusión. El código del proyecto y la implementación del modelo están alojados en GitHub y pueden ser descargados y utilizados libremente por los usuarios. HelloMeme proporciona una variedad de módulos funcionales, incluyendo generación de imágenes, generación de vídeo e integración con Gradio y ComfyUI La integración es fácil de usar para una gran variedad de experimentos y aplicaciones.
Relacionado:
LivePortrait: herramienta de animación para generar retratos dinámicos a partir de imágenes fijas y vídeos(código abierto)
ConsisID: un mapa de referencia de retratos para generar vídeos coherentes con los personajes, rápida integración multiterminal(código abierto)


Lista de funciones
- Generación de imágenes: Genera imágenes de alta calidad a partir de imágenes de referencia y de controladores.
- Generación de vídeo: Genera vídeos de alta fidelidad basados en vídeos de referencia y de conductores.
- Integración de Gradio: Proporciona una interfaz Gradio para la interacción con el usuario.
- Integración de ComfyUI: Soporta la interfaz ComfyUI para simplificar el proceso de operación del usuario.
- Módulos experimentales: Incluye una variedad de códigos experimentales para facilitar al usuario la realización de diferentes experimentos y pruebas.
- algoritmo eficaz: Optimiza los algoritmos para reducir el uso de VRAM y mejorar la eficiencia de la generación.
Utilizar la ayuda
Proceso de instalación
- Creación de un entorno Conda::
conda create -n hellomeme python=3.10.11
conda activate hellomeme
- Instalación de PyTorch y FFmpegPara una instalación más detallada, consulte los sitios web oficiales de PyTorch y FFmpeg.
- Instalación de dependencias::
pip install diffusers transformers einops scipy opencv-python tqdm pillow onnxruntime onnx safetensors accelerate peft
- almacén de clones::
git clone https://github.com/HelloVision/HelloMeme
cd HelloMeme
- código en ejecución::
- Generación de imágenes:
bash
python inference_image.py - Generación de vídeo:
bash
python inference_video.py
- Generación de imágenes:
- Instalación de la aplicación Gradio::
pip install gradio
pip install imageio[ffmpeg]
python app.py
Función Flujo de operaciones
Generación de imágenes
- Preparación de la imagen de entradaPrepara la imagen de referencia y la imagen de la unidad.
- Ejecutar el script de generación de imágenes::
python inference_image.py --reference_image path/to/reference.jpg --drive_image path/to/drive.jpg
- Ver resultados generados: La imagen generada se guardará en el directorio especificado.
Generación de vídeo
- Preparar la entrada de vídeo: Prepara vídeos de referencia y vídeos de conductores.
- Ejecutar el script de generación de vídeo::
python inference_video.py --reference_video path/to/reference.mp4 --drive_video path/to/drive.mp4
- Ver resultados generados: El vídeo generado se guardará en el directorio especificado.
Uso de la interfaz de Gradio
- Iniciar la aplicación Gradio::
python app.py
- Acceso a través del navegadorAbre tu navegador y visita
http://localhost:7860
La interfaz de Gradio puede utilizarse para generar imágenes y vídeos.
Uso de la interfaz ComfyUI
- Instalar ComfyUIPor favor, consulte el sitio web oficial de ComfyUI para la instalación.
- Ejecutar HelloMeme::
python comfyui_hellomeme.py
- Funcionamiento a través de la interfaz ComfyUISeleccione la función de generación de imagen o vídeo que desee, cargue los archivos de referencia y controladores y haga clic en el botón Generar.
advertencia
- versión de dependenciaNota: Tenga en cuenta el requisito de versión de los difusores, actualmente las versiones compatibles son
diffusers==0.31.0
. - Uso de VRAMCuando se genera vídeo, cuanto más largo es el vídeo de la unidad, más VRAM se requiere, así que por favor ajústelo de acuerdo a la situación real.
- Descarga de modelos: En la primera ejecución, todos los modelos se descargarán automáticamente, lo que puede llevar más tiempo.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...