Allgemeine Einführung
InfiniteYou ist ein Open-Source-Projekt, das vom ByteDance Intelligent Creation Team entwickelt wurde. Es basiert auf der Technologie der Diffusionstransformatoren (DiTs) und nutzt die FLUXDie Kernfunktion des .1-dev-Modells besteht darin, dass Benutzer ein Foto hochladen und eine Textbeschreibung eingeben können, um ein neues Bild zu erzeugen, wobei die Identität der Person erhalten bleibt. Das Projekt nutzt die InfuseNet-Technologie zur Verbesserung der Identitätsähnlichkeit, kombiniert mit einem mehrstufigen Training zur Optimierung der Bildqualität und der Textausrichtung.InfiniteYou wurde im März 2025 mit Code, Modellen und einer Online-Demo veröffentlicht und hat die Aufmerksamkeit der technischen Gemeinschaft auf sich gezogen. Es unterstützt mehrere Plug-ins und ist für Entwickler, Forscher und allgemeine Benutzer einfach zu verwenden.
Funktionsliste
- Neugestaltung des IdentitätserhaltsLaden Sie ein Foto und eine Textbeschreibung hoch, um ein neues Bild zu erstellen und die Gesichtszüge der Person zu erhalten.
- Hochwertige BilderzeugungGibt klare Bilder aus und reduziert Unschärfe, Handverzerrungen und andere Probleme.
- Optimierung der TextausrichtungGenerieren Sie Ergebnisse, die in hohem Maße mit dem Inhalt der Beschreibung übereinstimmen, um Verzerrungen zu vermeiden.
- Auswahl des Modells: Vorausgesetzt
aes_stage2
(Ästhetik bevorzugt) undsim_stage1
(Identität zuerst) zwei Modi. - Plug-in-ErweiterungenUnterstützt ControlNet, LoRA, IP-Adapter, etc. für mehr Flexibilität bei der Erzeugung.
Hilfe verwenden
Einbauverfahren
InfiniteYou erfordert eine lokale Installation, um zu funktionieren. Nachfolgend finden Sie die detaillierten Schritte:
- Vorbereitung der Umwelt
- Stellen Sie sicher, dass Python 3.8 oder höher auf Ihrem System installiert ist.
- Installieren Sie Git zum Herunterladen von Code.
- NVIDIA-GPUs und CUDA werden empfohlen, um die Generierungsgeschwindigkeit zu verbessern.
- Klonen von Code
Geben Sie ihn in das Terminal ein:
git clone https://github.com/bytedance/InfiniteYou.git
Besuchen Sie den Katalog:
cd InfiniteYou
- Installation von Abhängigkeiten
Führen Sie den folgenden Befehl aus, um die erforderlichen Bibliotheken zu installieren:
pip install -r requirements.txt
Wenn Sie einen Grafikprozessor verwenden, müssen Sie z. B. die entsprechende PyTorch-Version installieren:
pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
- Modelle herunterladen
Besuchen Sie https://huggingface.co/ByteDance/InfiniteYou zum Herunterladeninfu_flux_v1.0
Ordner imaes_stage2
vielleichtsim_stage1
Modell in den entsprechenden Speicherort im Projektverzeichnis. - Laufende Demo
Gradio installieren:
pip install gradio
Starten Sie die lokale Schnittstelle:
python app.py
Der Browser wird geöffnet http://127.0.0.1:7860
Im Folgenden finden Sie eine Liste der bekanntesten und beliebtesten Produkte auf dem Markt.
Hauptfunktionen
Identitätserhalt Fotorekonstruktion
- Fotos hochladen
Klicken Sie in der Gradio-Oberfläche auf "Identitätsbild hochladen" und wählen Sie ein deutliches Foto Ihres Gesichts aus. - Beschreibung der Eingabe
Geben Sie in das Feld "Aufforderungstext" eine spezifische Beschreibung ein, z. B. "Eine Frau in einem roten Kleid im Wald". - Einstellung der Parameter
- Modellauswahl:
aes_stage2
Konzentration auf die Ästhetik.sim_stage1
Betonung der Identitätsähnlichkeit. - Parametereinstellung: Standard
infusenet_conditioning_scale
wegen1.0
(math.) Gattunginfusenet_guidance_start
wegen0.0
. Wenn die Identitäten nicht ähnlich genug sind, versuchen Sie, den letzteren auf den0.1
. - Seed-Wert (Seed): Standardwert beibehalten oder manuell einstellen.
- Bilder generieren
Klicken Sie auf "Generieren" und warten Sie etwa 120 Sekunden, bis das Ergebnis auf dem Bildschirm angezeigt wird.
Rapid Script Reasoning
Läuft im Terminal:
python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results
Die erzeugten Ergebnisse werden in der Datei results
Mappe.
Online-Demo
Besuchen Sie https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX, um es ohne Installation auszuprobieren.
Plug-in-Verwendung
- ControlNetHochladen eines Posenreferenzbildes zur Steuerung der Aktion, die das Ergebnis erzeugt.
- LoRADie Plug-ins Realism und Anti-blur werden unterstützt, und der Pfad muss manuell angegeben werden, z. B.
<path_to_lora>
. - IP-Adapter: Fügen Sie eine Stilreferenztabelle für ein individuelles Styling hinzu.
Beispiel für den Betrieb
Sie möchten ein Bild eines "Mannes im Anzug in einem Konferenzraum" erzeugen:
- Laden Sie ein Foto des Mannes hoch.
- Geben Sie eine Beschreibung ein: "Ein Mann im Anzug in einem Konferenzraum".
- Option
aes_stage2
Klicken Sie auf "Erzeugen". - Überprüfen Sie die Ergebnisse und fügen Sie die Worte "ein Mann" hinzu, wenn Sie das Geschlecht anpassen müssen.
caveat
- Die Fotos sollten klar und nach vorne gerichtet sein, damit sie nicht verdeckt werden.
- Seien Sie in Ihren Beschreibungen konkret und vermeiden Sie vage Worte wie "schön".
- Die Generierungszeit variiert je nach Hardware und kann bei GPUs 30-60 Sekunden betragen.
Anwendungsszenario
- Inhalt der sozialen Medien
Die Nutzer laden ein Selfie hoch und geben "in Fitnesskleidung im Fitnessstudio" ein, um ein Foto zum Thema Fitness zu erstellen und zu teilen. - Kunst
Der Künstler lädt ein Porträt hoch, das einen "Ritter in mittelalterlicher Tracht" zeigt, um einen Entwurf zu erstellen. - Forschungstest
Die Forscher verwendeten InfiniteYou, um die Auswirkungen der Identitätsbindung zu vergleichen und die Leistung der erstellten Modelle zu validieren.
QA
- Ist es kostenlos?
Ja. Der Code und das Modell sind quelloffen und können kostenlos für die akademische Forschung verwendet werden. - Wie lange dauert die Erstellung?
120 Sekunden im Durchschnitt, schneller mit der GPU. - Unterstützt es Multiplayer-Fotos?
Derzeit für Einzelspieler optimiert, muss die Mehrspielerunterstützung weiter ausgebaut werden.