AI Personal Learning
und praktische Anleitung
讯飞绘镜

InfiniteYou: ein Werkzeug zur Erstellung und Bearbeitung von Fotos, das die Gesichtszüge bewahrt

Allgemeine Einführung

InfiniteYou ist ein Open-Source-Projekt, das vom ByteDance Intelligent Creation Team entwickelt wurde. Es basiert auf der Technologie der Diffusionstransformatoren (DiTs) und nutzt die FLUXDie Kernfunktion des .1-dev-Modells besteht darin, dass Benutzer ein Foto hochladen und eine Textbeschreibung eingeben können, um ein neues Bild zu erzeugen, wobei die Identität der Person erhalten bleibt. Das Projekt nutzt die InfuseNet-Technologie zur Verbesserung der Identitätsähnlichkeit, kombiniert mit einem mehrstufigen Training zur Optimierung der Bildqualität und der Textausrichtung.InfiniteYou wurde im März 2025 mit Code, Modellen und einer Online-Demo veröffentlicht und hat die Aufmerksamkeit der technischen Gemeinschaft auf sich gezogen. Es unterstützt mehrere Plug-ins und ist für Entwickler, Forscher und allgemeine Benutzer einfach zu verwenden.

InfiniteYou:保留人脸特征的照片生成与编辑工具-1


 

Funktionsliste

  • Neugestaltung des IdentitätserhaltsLaden Sie ein Foto und eine Textbeschreibung hoch, um ein neues Bild zu erstellen und die Gesichtszüge der Person zu erhalten.
  • Hochwertige BilderzeugungGibt klare Bilder aus und reduziert Unschärfe, Handverzerrungen und andere Probleme.
  • Optimierung der TextausrichtungGenerieren Sie Ergebnisse, die in hohem Maße mit dem Inhalt der Beschreibung übereinstimmen, um Verzerrungen zu vermeiden.
  • Auswahl des Modells: Vorausgesetzt aes_stage2(Ästhetik bevorzugt) und sim_stage1(Identität zuerst) zwei Modi.
  • Plug-in-ErweiterungenUnterstützt ControlNet, LoRA, IP-Adapter, etc. für mehr Flexibilität bei der Erzeugung.

 

Hilfe verwenden

Einbauverfahren

InfiniteYou erfordert eine lokale Installation, um zu funktionieren. Nachfolgend finden Sie die detaillierten Schritte:

  1. Vorbereitung der Umwelt
    • Stellen Sie sicher, dass Python 3.8 oder höher auf Ihrem System installiert ist.
    • Installieren Sie Git zum Herunterladen von Code.
    • NVIDIA-GPUs und CUDA werden empfohlen, um die Generierungsgeschwindigkeit zu verbessern.
  2. Klonen von Code
    Geben Sie ihn in das Terminal ein:
git clone https://github.com/bytedance/InfiniteYou.git

Besuchen Sie den Katalog:

cd InfiniteYou
  1. Installation von Abhängigkeiten
    Führen Sie den folgenden Befehl aus, um die erforderlichen Bibliotheken zu installieren:
pip install -r requirements.txt

Wenn Sie einen Grafikprozessor verwenden, müssen Sie z. B. die entsprechende PyTorch-Version installieren:

pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
  1. Modelle herunterladen
    Besuchen Sie https://huggingface.co/ByteDance/InfiniteYou zum Herunterladen infu_flux_v1.0 Ordner im aes_stage2 vielleicht sim_stage1 Modell in den entsprechenden Speicherort im Projektverzeichnis.
  2. Laufende Demo
    Gradio installieren:
pip install gradio

Starten Sie die lokale Schnittstelle:

python app.py

Der Browser wird geöffnet http://127.0.0.1:7860Im Folgenden finden Sie eine Liste der bekanntesten und beliebtesten Produkte auf dem Markt.

Hauptfunktionen

Identitätserhalt Fotorekonstruktion

  1. Fotos hochladen
    Klicken Sie in der Gradio-Oberfläche auf "Identitätsbild hochladen" und wählen Sie ein deutliches Foto Ihres Gesichts aus.
  2. Beschreibung der Eingabe
    Geben Sie in das Feld "Aufforderungstext" eine spezifische Beschreibung ein, z. B. "Eine Frau in einem roten Kleid im Wald".
  3. Einstellung der Parameter
  • Modellauswahl:aes_stage2 Konzentration auf die Ästhetik.sim_stage1 Betonung der Identitätsähnlichkeit.
  • Parametereinstellung: Standard infusenet_conditioning_scale wegen 1.0(math.) Gattunginfusenet_guidance_start wegen 0.0. Wenn die Identitäten nicht ähnlich genug sind, versuchen Sie, den letzteren auf den 0.1.
  • Seed-Wert (Seed): Standardwert beibehalten oder manuell einstellen.
  1. Bilder generieren
    Klicken Sie auf "Generieren" und warten Sie etwa 120 Sekunden, bis das Ergebnis auf dem Bildschirm angezeigt wird.

Rapid Script Reasoning

Läuft im Terminal:

python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results

Die erzeugten Ergebnisse werden in der Datei results Mappe.

Online-Demo

Besuchen Sie https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX, um es ohne Installation auszuprobieren.

Plug-in-Verwendung

  • ControlNetHochladen eines Posenreferenzbildes zur Steuerung der Aktion, die das Ergebnis erzeugt.
  • LoRADie Plug-ins Realism und Anti-blur werden unterstützt, und der Pfad muss manuell angegeben werden, z. B. <path_to_lora>.
  • IP-Adapter: Fügen Sie eine Stilreferenztabelle für ein individuelles Styling hinzu.

Beispiel für den Betrieb

Sie möchten ein Bild eines "Mannes im Anzug in einem Konferenzraum" erzeugen:

  1. Laden Sie ein Foto des Mannes hoch.
  2. Geben Sie eine Beschreibung ein: "Ein Mann im Anzug in einem Konferenzraum".
  3. Option aes_stage2Klicken Sie auf "Erzeugen".
  4. Überprüfen Sie die Ergebnisse und fügen Sie die Worte "ein Mann" hinzu, wenn Sie das Geschlecht anpassen müssen.

caveat

  • Die Fotos sollten klar und nach vorne gerichtet sein, damit sie nicht verdeckt werden.
  • Seien Sie in Ihren Beschreibungen konkret und vermeiden Sie vage Worte wie "schön".
  • Die Generierungszeit variiert je nach Hardware und kann bei GPUs 30-60 Sekunden betragen.

 

Anwendungsszenario

  1. Inhalt der sozialen Medien
    Die Nutzer laden ein Selfie hoch und geben "in Fitnesskleidung im Fitnessstudio" ein, um ein Foto zum Thema Fitness zu erstellen und zu teilen.
  2. Kunst
    Der Künstler lädt ein Porträt hoch, das einen "Ritter in mittelalterlicher Tracht" zeigt, um einen Entwurf zu erstellen.
  3. Forschungstest
    Die Forscher verwendeten InfiniteYou, um die Auswirkungen der Identitätsbindung zu vergleichen und die Leistung der erstellten Modelle zu validieren.

 

QA

  1. Ist es kostenlos?
    Ja. Der Code und das Modell sind quelloffen und können kostenlos für die akademische Forschung verwendet werden.
  2. Wie lange dauert die Erstellung?
    120 Sekunden im Durchschnitt, schneller mit der GPU.
  3. Unterstützt es Multiplayer-Fotos?
    Derzeit für Einzelspieler optimiert, muss die Mehrspielerunterstützung weiter ausgebaut werden.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " InfiniteYou: ein Werkzeug zur Erstellung und Bearbeitung von Fotos, das die Gesichtszüge bewahrt
de_DEDeutsch