AI Personal Learning
und praktische Anleitung

InstantID: Laden Sie ein Bild hoch und migrieren Sie die Porträtfunktionen, um verschiedene Bildstile zu erzeugen.

Allgemeine Einführung

 

InstantID ist eine hochmoderne Technologie, die sich auf die sekundenschnelle Erstellung von Bildern mit individuellem Stil oder individueller Pose auf der Grundlage eines einzigen ID-Referenzbildes konzentriert und dabei ein hohes Maß an Authentizität gewährleistet. Die Technologie verwendet eine auf einem Diffusionsmodell basierende Lösung, die den Bilderzeugungsprozess durch die Integration von Gesichtsbildern, Bildern von Orientierungspunkten und textlichen Hinweisen genau steuert. Zu den Hauptmerkmalen gehören die originalgetreue Bilderzeugung, die Kompatibilität mit gängigen, vorab trainierten Text-Bild-Diffusionsmodellen, die ohne umfangreiche Feinabstimmung oder mehrere Referenzbilder verwendet werden können, sowie die hohe Originaltreue des Gesichts und die Textbearbeitungsfunktionen.


 

InstantID ist eine neue, hochmoderne, anpassungsfreie Methode zur Generierung von Avatar-Merkmalen aus einem einzigen Bild, die eine Vielzahl von nachgelagerten Aufgaben unterstützt. Klonen Sie Gesichter aus nur einem Foto und verwenden Sie Stichwörter, um verschiedene Bilder desselben Gesichts zu erzeugen.

 

InstantID: Personalisierte Identitätserhaltung in Sekundenschnelle Bilderzeugungstechnologie-1

 

InstantID: Personalisierte Identitätserhaltung in Sekundenschnelle Bilderzeugungstechnologie-2

 

InstantID: Personalisierte Identitätserhaltung in Sekundenschnelle Bilderzeugungstechnologie-3

 

 

Funktionsliste

 

  • Identitätserhaltung ohne Muster: Sie brauchen nicht mehrere Bilder, sondern nur ein einziges Frontalbild, um mehrere Porträtstile zu erstellen.
  • Hohe Wiedergabetreue: Die erzeugten Ergebnisse haben eine hohe Wiedergabetreue und können die Identitätsmerkmale des Originalbildes gut bewahren.
  • Unterstützung mehrerer nachgelagerter Aufgaben: Unterstützt mehrere nachgelagerte Aufgaben wie Stilmigration, Bildbearbeitung usw.
  • Offener Quellcode und Modelle: Offener Quellcode und vortrainierte Modelle werden zum einfachen Herunterladen und zur Verwendung bereitgestellt.
  • Starke Kompatibilität: Unterstützt die Kompatibilität mit anderen Projekten wie InstantStyle und Kolors.

 

 

Hilfe verwenden

Laden Sie ein Personenbild hoch. Bei Bildern von mehreren Personen erkennen wir nur die größten Gesichter. Achten Sie darauf, dass das Gesicht nicht zu klein und nicht sichtbar verdeckt oder unscharf ist.
(Optional) Laden Sie ein weiteres Bild der Figur als Referenzpose hoch. Falls nicht hochgeladen, wird das Bild der ersten Person verwendet, um die Orientierungspunkte zu extrahieren. Wenn in Schritt 1 ein ausgeschnittenes Gesicht verwendet wurde, ist es empfehlenswert, dieses hochzuladen, um eine neue Pose zu extrahieren.
Eingabeaufforderungen für Text, wie bei normalen Text-Bild-Modellen.
Klicken Sie auf die Schaltfläche Senden, um mit der Anpassung zu beginnen.

Die Benutzer müssen ein einziges Referenz-ID-Bild angeben
Verschiedene Stile und Posen können für die individuelle Bilderstellung ausgewählt werden
Keine Feinabstimmung während der Prüfung oder Sammlung mehrerer Bilder für die Feinabstimmung erforderlich
Die erzeugten Bilder können direkt für die Fusion mit gängigen vortrainierten Modellen und Kontrollnetzen verwendet werden
Unterstützt das flexible Hinzufügen von Identitätsattributen zu nicht-menschlichen Rollen

 

Ablauf der Installation

  1. Klonen Sie ein GitHub-Repository:
    git klonen. https://github.com/instantX-research/InstantID.git
    cd InstantID
    

     

  2. Installieren Sie die Abhängigkeit:
    pip install -r anforderungen.txt
    

     

  3. Laden Sie das vortrainierte Modell herunter:
    von huggingface_hub importieren hf_hub_download
    hf_hub_download(repo_id="InstantX/InstantID", filename="ControlNetModel/config.json", local_dir=". /checkpoints")
    hf_hub_download(repo_id="InstantX/InstantID", filename="ControlNetModel/diffusion_pytorch_model.safetensors", local_dir=". /checkpoints")
    hf_hub_download(repo_id="InstantX/InstantID", filename="ip-adapter.bin", local_dir=". /checkpoints")
    

 

Verwendung Prozess

  1. Bereiten Sie das Bild vor:
    von Durchlässe.Hilfsmittel importieren load_image
    image = load_image("ihr-beispiel.jpg")
    
  2. Modelle laden:
    von Auslässe importieren StableDiffusionXLInstantIDPipeline, ControlNetModel
    controlnet = ControlNetModel.from_pretrained(". /checkpoints/ControlNetModel", torch_dtype=torch.float16)
    pipe = StableDiffusionXLInstantIDPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", controlnet=controlnet, torch_dtype=torch.float16)
    pipe.cuda()
    pipe.load_ip_adapter_instantid(". /checkpoints/ip-adapter.bin")
    
  3. Erzeugen Sie ein Bild:
    Aufforderung = "analoges filmfoto eines mannes. verblichener film, entsättigt, 35mm foto, körnig, vignette, vintage, Kodachrome, Lomographie, fleckig, detailreich, found Filmmaterial, Meisterwerk, beste Qualität"
    negative_prompt = ("lowres", "low quality", "worst quality:1.2"), (text:1.2), Wasserzeichen, Gemälde, Zeichnung, Illustration, Glitch, deformiert, mutiert, schielend, hässlich, entstellt"
    image = pipe(prompt, image_embeds=face_emb, image=face_kps, controlnet_conditioning_scale=0.8).images[0]
    

Detaillierte Vorgehensweise

  1. Vorbereiten der UmgebungVergewissern Sie sich, dass die erforderlichen Abhängigkeiten installiert sind und das trainierte Modell heruntergeladen wurde.
  2. Bild laden: Verwendung laden_bild lädt das zu bearbeitende Bild.
  3. Modelle laden: Verwendung von_ausgebildet Methode lädt das vorab trainierte ControlNet-Modell und die StableDiffusionXLInstantIDPipeline.
  4. Bilder generierenCue Word und Negative Cue Word für das erzeugte Bild durch Aufruf der Funktion Rohr Methode, um ein Bild zu erzeugen.

Wenn Sie diese Schritte befolgen, können Sie mit InstantID ganz einfach authentische Bilder zur Identitätssicherung erstellen.

 

 

ComfyUI Einführungsprogramm

 

Wählen Sie das SDXL Base Dock. Sie können auch das 4-Schritt-Verfahren von SDXL Turbo ausprobieren, das für schnelle Tests sehr effektiv ist.

Das erste Laden dauert in der Regel mehr als 60 Sekunden, aber der Knoten tut sein Bestes, um das Modell zwischenzuspeichern.

https://github.com/huxiuhan/ComfyUI-InstantID

 

InstantID-Erlebnis-Adresse

 

Chef-KI-AustauschkreisDieser Inhalt wurde vom Autor versteckt. Bitte geben Sie den Verifizierungscode ein, um den Inhalt zu sehen.
Captcha:
Bitte beachten Sie diese Website WeChat öffentliche Nummer, Antwort "CAPTCHA, eine Art Challenge-Response-Test (Computer)", erhalten Sie den Verifizierungscode. Suchen Sie in WeChat nach "Chef-KI-Austauschkreis"oder"Looks-AI" oder WeChat, indem Sie die rechte Seite des QR-Codes scannen, können Sie die öffentliche WeChat-Nummer dieser Website aufrufen.

AI Leichtes Lernen

Der Leitfaden für Laien zum Einstieg in die KI

Hilft Ihnen, die Nutzung von KI-Tools kostengünstig und von Null an zu erlernen.KI ist, wie Bürosoftware, eine wesentliche Fähigkeit für jeden. Die Beherrschung von KI verschafft Ihnen einen Vorteil bei der Stellensuche und die Hälfte des Aufwands bei Ihrer zukünftigen Arbeit und Ihrem Studium.

Details ansehen>
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " InstantID: Laden Sie ein Bild hoch und migrieren Sie die Porträtfunktionen, um verschiedene Bildstile zu erzeugen.

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)