Allgemeine Einführung
HelloMeme ist ein Open-Source-Projekt, das von HelloVision entwickelt wurde, um qualitativ hochwertige Bilder und Videos durch die Integration von Spatial Knitting Attentions zu generieren, um High-Level- und High-Fidelity-Bedingungen in Diffusionsmodelle einzubetten. Der Projektcode und die Modellimplementierung werden auf GitHub gehostet und können von den Nutzern frei heruntergeladen und verwendet werden. HelloMeme bietet eine Vielzahl von Funktionsmodulen, einschließlich Bilderzeugung, Videoerzeugung und Integration mit Gradio und ComfyUI Die Integration ist benutzerfreundlich für eine Vielzahl von Experimenten und Anwendungen.
Verwandt:
LivePortrait: Animationswerkzeug zur Erstellung dynamischer Porträts aus Standbildern und Videos(offene Quelle)
ConsisID: eine Porträt-Referenzkarte zur Erzeugung zeichenkonsistenter Videos, schnelle Integration mehrerer Terminals(offene Quelle)
Funktionsliste
- BilderzeugungGenerieren Sie qualitativ hochwertige Bilder aus Referenz- und Treiberbildern.
- Generation VideoGenerieren von originalgetreuen Videos auf der Grundlage von Referenz- und Fahrervideos.
- Gradio-IntegrationGradio: Bietet eine Gradio-Schnittstelle für die Benutzerinteraktion.
- ComfyUI-IntegrationUnterstützt die ComfyUI-Schnittstelle zur Vereinfachung der Benutzerführung.
- Experimentelle ModuleEnthält eine Vielzahl von experimentellen Codes, die es dem Benutzer erleichtern, verschiedene Experimente und Tests durchzuführen.
- effizienter AlgorithmusOptimierung von Algorithmen zur Verringerung der VRAM-Nutzung und zur Verbesserung der Generierungseffizienz.
Hilfe verwenden
Ablauf der Installation
- Erstellen einer Conda-Umgebung::
conda create -n hellomeme python=3.10.11
conda activate hellomeme
- Installation von PyTorch und FFmpegBitte lesen Sie die offiziellen PyTorch- und FFmpeg-Webseiten für eine detaillierte Installation.
- Installation von Abhängigkeiten::
pip install diffusers transformers einops scipy opencv-python tqdm pillow onnxruntime onnx safetensors accelerate peft
- Klon-Lager::
git clone https://github.com/HelloVision/HelloMeme
cd HelloMeme
- laufender Code::
- Bilderzeugung:
bash
python inference_image.py
- Video Generation:
bash
python inference_video.py
- Bilderzeugung:
- Installation der Gradio-Anwendung::
pip install gradio
pip install imageio[ffmpeg]
python app.py
Funktion Betriebsablauf
Bilderzeugung
- Vorbereiten des EingabebildesVorbereiten des Referenzbildes und des Laufwerksbildes.
- Führen Sie das Skript zur Bilderzeugung aus::
python inference_image.py --reference_image path/to/reference.jpg --drive_image path/to/drive.jpg
- Generierte Ergebnisse anzeigen: Das erzeugte Bild wird im angegebenen Verzeichnis gespeichert.
Generation Video
- Vorbereiten der VideoeingabeVorbereitung von Referenzvideos und Fahrervideos.
- Führen Sie das Skript zur Videoerstellung aus::
python inference_video.py --reference_video path/to/reference.mp4 --drive_video path/to/drive.mp4
- Generierte Ergebnisse anzeigenDas erzeugte Video wird im angegebenen Verzeichnis gespeichert.
Verwendung der Gradio-Schnittstelle
- Starten der Gradio-Anwendung::
python app.py
- Zugang über Browser: Öffnen Sie Ihren Browser und besuchen Sie
http://localhost:7860
Die Gradio-Schnittstelle kann für die Erstellung von Bildern und Videos verwendet werden.
Verwendung der ComfyUI-Schnittstelle
- ComfyUI installierenBitte besuchen Sie die offizielle Website von ComfyUI für die Installation.
- HelloMeme ausführen::
python comfyui_hellomeme.py
- Bedienung über ComfyUI-SchnittstelleWählen Sie die gewünschte Bild- oder Videogenerierungsfunktion, laden Sie die Referenz- und Treiberdateien hoch und klicken Sie auf die Schaltfläche Generieren.
caveat
- abhängige VersionBitte beachten Sie die Versionsanforderung für die Diffusoren, derzeit werden folgende Versionen unterstützt
Diffusoren==0.31.0
. - VRAM-NutzungJe länger das Laufwerksvideo ist, desto mehr VRAM wird bei der Videoerstellung benötigt. Bitte passen Sie den Wert entsprechend der tatsächlichen Situation an.
- Modell DownloadBeim ersten Durchlauf werden alle Modelle automatisch heruntergeladen, was länger dauern kann.