AI Personal Learning
und praktische Anleitung
豆包Marscode1

StarVector: ein Basismodell zur Erzeugung von SVG-Vektorgrafiken aus Bildern und Text

Allgemeine Einführung

StarVector ist ein Open-Source-Projekt, das von Entwicklern wie Juan A. Rodriguez ins Leben gerufen wurde, um Bilder und Text in skalierbare Vektorgrafiken (SVG) zu konvertieren. Dieses Tool verwendet ein visuelles Sprachmodell, das Bildinhalte und Textanweisungen versteht, um hochwertigen SVG-Code zu erzeugen. Sein Hauptmerkmal besteht darin, dass es den Vektorisierungsprozess in eine Codegenerierungsaufgabe umwandelt, die für Icons, technische Diagramme, Logos usw. geeignet ist. StarVector wird auf dem SVG-Stack-Datensatz trainiert, der mehr als 2 Millionen echte SVG-Beispiele enthält, was genaue und vielfältige Ergebnisse gewährleistet. Das Projekt wird derzeit u. a. von ServiceNow Research und Mila unterstützt und wurde zuletzt im März 2025 aktualisiert.

StarVector:从图像和文字生成SVG矢量图的基础模型-1


 

Funktionsliste

  • SVG aus Bild generieren: Pixelbild eingeben und entsprechenden Vektorgrafikcode generieren.
  • SVG aus Text generieren: Erstellen Sie brandneue SVG-Grafiken auf der Grundlage von Textbeschreibungen.
  • Unterstützung für eine breite Palette grafischer Elemente: SVG-Grundlagen wie Pfade, Ellipsen, Polygone und Text.
  • Hochpräzise Vektorisierung: Die resultierenden SVGs sind detailgetreu und eignen sich zum Heranzoomen.
  • Open Source und kostenlos: Der Code ist öffentlich zugänglich, die Nutzer können ihn frei herunterladen und verändern.

 

Hilfe verwenden

Die Verwendung von StarVector erfordert einige technische Grundlagen, da es sich um ein codebasiertes Projekt handelt. Nachfolgend finden Sie detaillierte Installations- und Betriebsschritte, um den Benutzern einen schnellen Einstieg zu ermöglichen.

Einbauverfahren

  1. Vorbereiten der Umgebung
    • Stellen Sie sicher, dass Sie Python 3.11.3 auf Ihrem Computer installiert haben. Sie können die Version mit dem Befehl überprüfen:
      python --version
      
    • Wenn nicht, laden Sie es von https://www.python.org herunter und installieren Sie es.
    • Installieren Sie Git, um den Code von GitHub herunterzuladen. Download unter https://git-scm.com.
  2. Erstellen einer virtuellen Umgebung
    • Öffnen Sie ein Terminal und geben Sie den folgenden Befehl ein, um eine neue Python-Umgebung zu erstellen:
      conda create -n starvector python=3.11.3 -y
      
    • Aktivieren Sie die Umwelt:
      conda activate starvector
      
  3. StarVector Code herunterladen
    • Geben Sie ihn in das Terminal ein:
      git clone https://github.com/joanrod/star-vector.git
      
    • Wechseln Sie in den Projektordner:
      cd star-vector
      
  4. Installation von Abhängigkeiten
    • Aktualisieren Sie pip und installieren Sie die erforderlichen Bibliotheken:
      pip install --upgrade pip
      pip install -e .
      
    • Dadurch werden alle Python-Pakete installiert, die für die Ausführung von StarVector erforderlich sind.
  5. Setzen von Umgebungsvariablen
    • Die folgenden Variablen müssen konfiguriert werden, wenn Sie das Modell trainieren oder erweiterte Funktionen verwenden möchten:
      export HF_HOME=<模型存储路径>
      export HF_TOKEN=<你的 Hugging Face 令牌>
      export WANDB_API_KEY=<你的 Weights & Biases 令牌>
      export OUTPUT_DIR=<输出路径>
      
    • Diese können im Terminal eingegeben oder in die Umgebungskonfigurationsdatei geschrieben werden.

Verwendung

SVG aus Bildern generieren

  1. Bereiten Sie das Bild vor
    • Wählen Sie ein Symbol, ein Logo oder ein technisches Diagramm aus, um es in einem gängigen Format (z. B. PNG oder JPG) zu speichern.
    • Hinweis: StarVector eignet sich nicht für die Arbeit mit natürlichen Landschaften oder komplexen Illustrationen, es ist besser, einfache Grafiken zu verwenden.
  2. laufender Code
    • Legen Sie das Bild in den Projektordner und geben Sie es in das Terminal ein:
      python scripts/image_to_svg.py --input <图像路径> --output <输出SVG路径>
      
    • Zum Beispiel:
      python scripts/image_to_svg.py --input icon.png --output icon.svg
      
  3. Ergebnisse anzeigen
    • Die erzeugte SVG-Datei wird unter dem angegebenen Pfad gespeichert. Sie kann mit einem Browser oder einer Vektorgrafiksoftware (z. B. Inkscape) zur Überprüfung geöffnet werden.

SVG aus Text generieren

  1. Textbefehle eingeben
    • Öffnen Sie ein Terminal und führen Sie das Skript zur Texterstellung aus:
      python scripts/text_to_svg.py --text "一个红色圆形" --output circle.svg
      
    • Seien Sie so konkret wie möglich, z. B. "ein schwarzer fünfzackiger Stern" oder "ein blauer rechteckiger Kasten".
  2. Ausgabe prüfen
    • Die erzeugte SVG-Datei wird im angegebenen Pfad gespeichert. Öffnen Sie sie, um zu sehen, ob sie den Erwartungen entspricht.

Erweiterte Funktionen: Trainingsmodelle

  • Wenn Sie das Modell selbst trainieren möchten, können Sie den SVG-Stack-Datensatz verwenden.
  • Führen Sie den Trainingsbefehl aus (z. B. StarVector-1B):
deepspeed scripts/train.py --data_path <SVG-Stack路径> --output_dir <输出路径>
  • Hinweis: Für das Training ist ein höher konfigurierter Computer erforderlich, der möglicherweise GPU-Unterstützung benötigt.

Bedienungskompetenz

  • Komponenten während der Prüfung anpassenWenn die erzeugten Ergebnisse nicht zufriedenstellend sind, prüfen Sie, ob das Eingabebild zu komplex ist oder ob die Textbeschreibung klar ist.
  • PersonalisierungParameter können im Code angepasst werden, z. B. durch Erhöhung der Anzahl der Stichproben zur Verbesserung der Genauigkeit.
  • Dokument anzeigenDie Datei README.md im Hauptverzeichnis des Projekts enthält weitere Anweisungen, die Sie sorgfältig lesen sollten.

Mit diesen Schritten können Sie ganz einfach SVG-Dateien aus Bildern oder Text erzeugen. Der Installationsprozess dauert etwa 10-20 Minuten und ist einfach zu bedienen, so dass es für Designer oder Entwickler mit grundlegenden Programmierkenntnissen geeignet ist.

 

Anwendungsszenario

  1. Ikonen-Design
    Designer können mit StarVector Skizzen schnell in Vektorsymbole umwandeln und so Zeit beim manuellen Nachzeichnen sparen.
  2. technisches Dokument
    Ingenieure können damit Diagramme oder Flussdiagramme erstellen, die direkt in Dokumente oder Webseiten eingebettet werden können.
  3. Pädagogische Demonstrationen
    Lehrkräfte können Lehrgrafiken mit Textbeschreibungen erstellen, um Konzepte visuell zu veranschaulichen.
  4. Web-Entwicklung
    Entwickler können damit schnell zoombare Webelemente erstellen und die Ladegeschwindigkeit erhöhen.

 

QA

  1. Kann StarVector Fotos verarbeiten?
    Kann nicht. Es ist für Icons, Logos und technische Diagramme konzipiert und eignet sich nicht für natürliche Bilder oder komplexe Illustrationen.
  2. Muss ich bezahlen?
    Nein. StarVector ist ein Open-Source-Projekt und der Code und die Grundfunktionalität können kostenlos genutzt werden.
  3. Kann das generierte SVG bearbeitet werden?
    Ja. Die generierten SVGs sind in einem Standardformat und können in Inkscape oder Illustrator bearbeitet werden.
  4. Was ist, wenn die Installation fehlschlägt?
    Überprüfen Sie, ob die Python-Version korrekt ist, stellen Sie sicher, dass Ihre Netzwerkverbindung funktioniert, oder achten Sie auf Terminal-Fehlermeldungen.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " StarVector: ein Basismodell zur Erzeugung von SVG-Vektorgrafiken aus Bildern und Text
de_DEDeutsch