HelloMeme: Erzeugen Sie lokale High-Fidelity-Ausdruck Aktion konsistente Bild oder Video, Runway Act ein Open-Source-Ping-Pong!

Neueste AI-RessourcenAktualisiert vor 9 Monaten AI-Austauschkreis

19.6K 00

Allgemeine Einführung

HelloMeme ist ein Open-Source-Projekt, das von HelloVision entwickelt wurde, um qualitativ hochwertige Bilder und Videos durch die Integration von Spatial Knitting Attentions zu generieren, um hochgradige und realitätsnahe Bedingungen in Diffusionsmodelle einzubetten. Der Code und die Modellimplementierung des Projekts werden auf GitHub gehostet und können von den Nutzern frei heruntergeladen und verwendet werden. HelloMeme bietet eine Vielzahl von Funktionsmodulen, einschließlich Bilderzeugung, Videoerzeugung und Integration mit Gradio und ComfyUI Die Integration ist benutzerfreundlich für eine Vielzahl von Experimenten und Anwendungen.

Verwandt:

LivePortrait: Animationswerkzeug zur Erstellung dynamischer Porträts aus Standbildern und Videos(offene Quelle)

ConsisID: Eine Porträt-Referenzkarte zur Erzeugung zeichenkonsistenter Videos, schnelle Integration mehrerer Terminals(offene Quelle)

Reface: Ersetzen von Gesichtern und Erstellen von Videos mithilfe von KI, um lustige animierte Bilder zu erstellen (kostenpflichtig)

HelloMeme：生成局部高保真表情动作一致的图像或视频，Runway Act one 开源平替

Funktionsliste

BilderzeugungGenerieren Sie qualitativ hochwertige Bilder aus Referenz- und Treiberbildern.
Generation VideoGenerieren von originalgetreuen Videos auf der Grundlage von Referenz- und Fahrervideos.
Gradio-IntegrationGradio: Bietet eine Gradio-Schnittstelle für die Benutzerinteraktion.
ComfyUI-IntegrationUnterstützt die ComfyUI-Schnittstelle zur Vereinfachung der Benutzerführung.
experimentelles ModulEnthält eine Vielzahl von experimentellen Codes, die es dem Benutzer erleichtern, verschiedene Experimente und Tests durchzuführen.
effizienter AlgorithmusOptimierung von Algorithmen zur Verringerung der VRAM-Nutzung und zur Verbesserung der Generierungseffizienz.

Hilfe verwenden

Einbauverfahren

Erstellen einer Conda-Umgebung::

   conda create -n hellomeme python=3.10.11
conda activate hellomeme

Installation von PyTorch und FFmpegBitte lesen Sie die offiziellen PyTorch- und FFmpeg-Webseiten für eine detaillierte Installation.
Installation von Abhängigkeiten::

   pip install diffusers transformers einops scipy opencv-python tqdm pillow onnxruntime onnx safetensors accelerate peft

Klon-Lager::

   git clone https://github.com/HelloVision/HelloMeme
cd HelloMeme

laufender Code::
- Bilderzeugung: bash python inference_image.py
- Video Generation: bash python inference_video.py
Installation der Gradio-Anwendung::

   pip install gradio
pip install imageio[ffmpeg]
python app.py

Funktion Betriebsablauf

Bilderzeugung

Vorbereiten des EingabebildesVorbereiten des Referenzbildes und des Laufwerksbildes.
Führen Sie das Skript zur Bilderzeugung aus::

   python inference_image.py --reference_image path/to/reference.jpg --drive_image path/to/drive.jpg

Generierte Ergebnisse anzeigen: Das erzeugte Bild wird im angegebenen Verzeichnis gespeichert.

Generation Video

Vorbereiten der VideoeingabeVorbereitung von Referenzvideos und Fahrervideos.
Führen Sie das Skript zur Videoerstellung aus::

   python inference_video.py --reference_video path/to/reference.mp4 --drive_video path/to/drive.mp4

Generierte Ergebnisse anzeigenDas erzeugte Video wird im angegebenen Verzeichnis gespeichert.

Verwendung der Gradio-Schnittstelle

Starten der Gradio-Anwendung::

   python app.py

Zugang über Browser: Öffnen Sie Ihren Browser und besuchen Sie http://localhost:7860Die Gradio-Schnittstelle kann für die Erstellung von Bildern und Videos verwendet werden.

Verwendung der ComfyUI-Schnittstelle

ComfyUI installierenBitte besuchen Sie die offizielle Website von ComfyUI für die Installation.
HelloMeme ausführen::

   python comfyui_hellomeme.py

Bedienung über ComfyUI-SchnittstelleWählen Sie die gewünschte Bild- oder Videogenerierungsfunktion, laden Sie die Referenz- und Treiberdateien hoch und klicken Sie auf die Schaltfläche Generieren.

caveat

abhängige VersionBitte beachten Sie die Versionsanforderung für die Diffusoren, derzeit werden folgende Versionen unterstützt diffusers==0.31.0.
VRAM-NutzungJe länger das Laufwerksvideo ist, desto mehr VRAM wird bei der Videoerstellung benötigt. Bitte passen Sie den Wert entsprechend der tatsächlichen Situation an.
Modell DownloadBeim ersten Durchlauf werden alle Modelle automatisch heruntergeladen, was länger dauern kann.