AI Personal Learning
und praktische Anleitung
讯飞绘镜

AI-ClothingTryOn: Zwillingsbasiertes Tool zur virtuellen Anprobe von Kleidung

Allgemeine Einführung

AI-ClothingTryOn ist eine Open-Source-Desktop-Anwendung auf Python-Basis, die vom Entwickler speedTD erstellt und auf GitHub gehostet wird. Sie nutzt Google Zwillinge Technologie der künstlichen Intelligenz, die es den Nutzern ermöglicht, Fotos von Personen und Bildern von Kleidungsstücken hochzuladen, um virtuelle Anprobeergebnisse zu erzielen. Die Nutzer können sehen, wie die Kleidungsstücke an ihnen aussehen, und so mitentscheiden, ob sie etwas kaufen möchten oder nicht. Die Anwendung verwendet PyQt6, um eine intuitive Schnittstelle durch die Zwillings-API Verarbeitet Bilder, um realistische Anpassungsergebnisse zu erzielen. Dieses Tool eignet sich für Online-Shopping-Enthusiasten, aber auch für Entwickler, die sich mit KI-Technologie beschäftigen wollen. Das Projekt bietet zwei Möglichkeiten zur Verwendung der EXE-Datei und des Quellcodes, was für verschiedene Benutzer praktisch ist.

AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具-1


 

Funktionsliste

  • Fotos hochladenUnterstützung des getrennten Hochladens von Charakterfotos und Kleidungsbildern.
  • Erzeugen von AnpassungsergebnissenGenerieren Sie 10 verschiedene Bilder der Anpassungsergebnisse auf einmal.
  • Benutzerdefinierte TippsBenutzer können Textaufforderungen eingeben, um den KI-Erzeugungseffekt anzupassen.
  • Ergebnisse speichernSie können Ihre bevorzugten Anpassungsbilder lokal speichern.
  • intuitive SchnittstelleBietet eine benutzerfreundliche grafische Oberfläche, die einfach zu bedienen ist.
  • StapeldateiUnterstützt die gleichzeitige Verarbeitung mehrerer Bilder zur Steigerung der Effizienz.

 

Hilfe verwenden

AI-ClothingTryOn ist ein Desktop-Tool, das direkt aus einer vorkompilierten EXE-Datei oder aus dem Quellcode ausgeführt werden kann. Nachfolgend finden Sie eine detaillierte Installations- und Nutzungsanleitung, die Ihnen einen schnellen Einstieg ermöglicht.

Einbauverfahren

Methode 1: Verwendung einer EXE-Datei (für normale Benutzer geeignet)

  1. Programm herunterladen
    • Besuchen Sie die GitHub-Seite unter https://github.com/speedTD/AI-ClothingTryOn.
    • Laden Sie die neueste Version der EXE-Datei aus dem Bereich Releases herunter.
    • Wenn Ihr Browser den EXE-Download blockiert, können Sie den alternativen Link verwenden, um die ZIP-Datei herunterzuladen:
      复制复制复制复制复制复制复制
      复制
      https://mega.nz/file/pYpkQbzJ#exFxB7T2QhQFbMUzza1xx_KeAajMreSy3MdBgZOKuQM
    • Nachdem Sie die ZIP-Datei heruntergeladen und extrahiert haben, suchen Sie die AI-ClothingTryOn.exe.
  2. laufendes Programm
    • Doppelklick AI-ClothingTryOn.exe Start.
    • Wenn Sie es zum ersten Mal ausführen, werden Sie aufgefordert, den Google Gemini API-Schlüssel einzugeben.
  3. Konfigurieren des API-Schlüssels
    • Lesen Sie den Abschnitt "Abrufen des Google Gemini API-Schlüssels" unten, um den Schlüssel zu erhalten.
    • Geben Sie den Schlüssel in das Pop-up-Fenster des Programms ein, oder speichern Sie ihn im Stammverzeichnis des Projekts in der Datei api_key.txt Dokumentation.

Methode 2: Verwendung des Quellcodes (für Entwickler)

  1. Vorbereiten der Umgebung
    • Installieren Sie Python 3.8 oder höher von der offiziellen Python-Website.
    • Installieren Sie das Git-Tool, laden Sie es von der Git-Website herunter.
    • Stellen Sie sicher, dass Sie über eine Internetverbindung verfügen, um die Gemini-API aufrufen zu können.
  2. Code herunterladen
    • Öffnen Sie ein Terminal und geben Sie den folgenden Befehl ein, um das Projekt zu klonen:
      复制复制复制复制复制复制
      复制
      git clone https://github.com/speedTD/AI-ClothingTryOn.git
    • Rufen Sie den Projektkatalog auf:
      复制复制复制复制复制
      复制
      cd AI-ClothingTryOn
  3. Installation von Abhängigkeiten
    • Führen Sie den folgenden Befehl aus, um die erforderlichen Bibliotheken zu installieren:
      复制复制复制复制
      复制
      pip install -r requirements.txt
    • Wenn ein Mangel besteht an requirements.txtinstallieren Sie die Kernbibliotheken manuell:
      复制复制复制
      复制
      pip install pyqt6 google-generativeai pillow
  4. laufendes Programm
    • Geben Sie den Befehl zum Starten ein:
      复制复制
      复制
      python main.py

Google Gemini API-Schlüssel erhalten

  1. Öffnen Sie Ihren Browser und besuchen Sie Google AI Studio.
  2. Melden Sie sich mit Ihrem Google-Konto an.
  3. Suchen Sie auf der Seite die Option "API-Schlüssel" und klicken Sie auf "Neuen Schlüssel erstellen".
  4. Kopieren Sie den generierten API-Schlüssel.
  5. Fügen Sie den Schlüssel in das Eingabefeld des Programms ein, oder speichern Sie ihn in der Datei api_key.txt Dokumentation.

Hauptfunktionen

Fotos hochladen

  • Nach dem Start des Programms gibt es zwei Schaltflächen auf der Benutzeroberfläche: "Personenfoto auswählen" und "Kleidungsfoto auswählen".
  • Klicken Sie auf "Personenfoto auswählen" und laden Sie ein klares Ganzkörperfoto hoch (JPG- oder PNG-Format wird empfohlen).
  • Klicken Sie auf "Select Clothes Photo" und laden Sie ein Bild Ihrer Kleidung hoch (vorzugsweise von vorne, ohne Hindernisse).
  • Fotos werden automatisch gespeichert in uploads/ Mappe.

Erzeugen von Anpassungsergebnissen

  • Sobald Sie Ihre Fotos hochgeladen haben, klicken Sie auf die Schaltfläche "10 Anprobebilder generieren".
  • Das Programm ruft die Google Gemini API auf, um 10 verschiedene Bilder der Armatur zu erzeugen.
  • Der Erstellungsprozess dauert je nach Netzwerkgeschwindigkeit und Bildgröße einige Sekunden bis einige Minuten.
  • Die Ergebnisse werden auf der Oberfläche angezeigt und auch in der results/ Mappe.

Benutzerdefinierte Tipps

  • In das Textfeld auf der Benutzeroberfläche können Sie Aufforderungen eingeben, wie z. B. "Tragen bei Außenaufnahmen" oder "Einstellen für einen festen Sitz".
  • Geben Sie den Wert ein und klicken Sie erneut auf die Schaltfläche "Generieren". Die KI passt das Ergebnis entsprechend den Aufforderungen an.

Ergebnisse speichern

  • Unter den 10 erzeugten Bildern befindet sich eine Schaltfläche "Speichern".
  • Klicken Sie auf "Speichern" und wählen Sie den Speicherpfad. Das Bild wird im JPG-Format gespeichert.

caveat

  • BildanforderungenFotos von Personen müssen vollständig sichtbar sein, und Bilder von Kleidung müssen klar und frei von Hintergrundstörungen sein.
  • NetzanforderungDie Anwendung muss vernetzt sein, um die Gemini-API aufrufen zu können.
  • GebührenerinnerungenDie Google Gemini API kann je nach Nutzung Gebühren verursachen. Wir empfehlen daher, die offiziellen Preise von Google zu überprüfen.
  • FehlerbehandlungWenn das Programm abstürzt, überprüfen Sie, ob der API-Schlüssel korrekt ist oder ob die Netzwerkverbindung funktioniert.

Erweiterte Nutzung

  • AnpassungscodeEntwickler können Folgendes ändern main.pywie z. B. die Erhöhung der Anzahl der erzeugten Bilder oder die Optimierung der Schnittstelle.
  • Optimierung mit mehreren ThreadsDas Programm verwendet mehrere Threads, um Bilder zu verarbeiten, und Benutzer, die sich mit der Programmierung auskennen, können die Thread-Parameter anpassen, um die Geschwindigkeit zu erhöhen.
  • Beitrag ProjekteWenn Sie ein Problem finden oder einen Verbesserungsvorschlag haben, können Sie das Projekt aufgabeln und einen Pull Request einreichen.

Mit diesen Schritten können Sie Kleidung mit AI-ClothingGENERATE anprobieren und den Komfort von AI erleben.

 

Anwendungsszenario

  1. Online-Einkaufsentscheidung
    Die Nutzer sehen sich ein Kleidungsstück auf einer E-Commerce-Plattform an und laden mit diesem Tool ihr Foto und ein Bild des Kleidungsstücks hoch, um einen Anprobier-Effekt zu erzeugen und festzustellen, ob es für den Kauf geeignet ist.
  2. Test zur Übereinstimmung der Kleidung
    Nutzer, die verschiedene Kleidungskombinationen ausprobieren möchten, können mehrere Bilder von Kleidungsstücken hochladen, um mehrere Ergebnisse für die Anprobe zu erhalten und die beste Kombination zu finden.
  3. KI-technisches Lernen
    Studenten oder Entwickler können den Projektcode studieren und lernen, wie man Desktop-Anwendungen mit der Google Gemini API und PyQt6 entwickelt.

 

QA

  1. Ist dieses Tool kostenlos?
    Das Projekt selbst ist kostenlos, aber die Nutzung der Google Gemini API kann je nach den Tarifen von Google gebührenpflichtig sein.
  2. Brauche ich ein Netzwerk?
    Ja, das Programm stützt sich auf die Google Gemini API und muss vernetzt sein, um Bilder zu erzeugen.
  3. Ist der Generationeneffekt real?
    Die Ergebnisse hängen von der Qualität des Fotos und des Stichworts ab. Meistens realistisch, aber komplexe Hintergründe können die Ergebnisse beeinflussen.
  4. Kann ich mehr als ein Kleid auf einmal anprobieren?
    In der aktuellen Version wird jeweils ein Kleidungsstück verarbeitet, mehrere Teile erfordern mehrere Durchläufe.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " AI-ClothingTryOn: Zwillingsbasiertes Tool zur virtuellen Anprobe von Kleidung
de_DEDeutsch