AI Personal Learning
und praktische Anleitung

UI-TARS Desktop: Desktop Intelligentsia Anwendung zur Steuerung von Computern mit natürlicher Sprache

Allgemeine Einführung

UI-TARS Desktop ist eine grafische Interface-Agent-Anwendung, die auf dem von ByteDance entwickelten UI-TARS (Visual Language Model) basiert. UI-TARS Desktop unterstützt den plattformübergreifenden Betrieb, ist kompatibel mit Windows- und macOS-Systemen und bietet Echtzeit-Feedback und Statusanzeigefunktionen. Benutzer können Vorgänge wie Screenshots, visuelle Erkennung und präzise Maus- und Tastatursteuerung durch einfache Sprachbefehle ausführen, was den Komfort und die Intelligenz der Computerbedienung erheblich verbessert.

UI-TARS Desktop: Desktop Intelligentsia-Anwendung zur Computersteuerung durch natürliche Sprache-1


 

Funktionsliste

  • Steuerung in natürlicher Sprache: Steuerung von Computeroperationen durch Sprachbefehle
  • Screenshot und visuelle Erkennung: Unterstützt Screenshot- und Bilderkennungsfunktionen
  • Präzise Maus- und Tastatursteuerung: Ermöglicht hochpräzise Maus- und Tastaturbedienung
  • Plattformübergreifende Unterstützung: Windows und macOS kompatibel.
  • Echtzeit-Feedback und Statusanzeige: Bietet Echtzeit-Feedback und Status-Updates zum Betrieb

 

Hilfe verwenden

Ablauf der Installation

MacOS

  1. Laden Sie die neueste Version der UI-TARS Desktop-App herunter.
  2. Ziehen Sie die Anwendung UI-TARS in den Ordner Anwendungen.
  3. Aktivieren Sie die UI-TARS-Berechtigungen in den macOS-Systemeinstellungen:
    • Systemeinstellungen -> Datenschutz & Sicherheit -> Barrierefreiheit
    • Systemeinstellungen -> Datenschutz & Sicherheit -> Bildschirmaufzeichnung
  4. Öffnen Sie die Anwendung UI-TARS, die im Terminal verwendet werden kann, wenn die Anwendung beschädigt ist sudo xattr -dr com.apple.quarantine /Anwendungen/UI\ TARS.app Die Lösung.

Windows (Computer)

  1. Laden Sie die neueste Version der UI-TARS Desktop-App herunter.
  2. Führen Sie die Anwendung aus und folgen Sie den Anweisungen, um die Installation abzuschließen.

Richtlinien für die Verwendung

  1. Nach dem Öffnen der UI-TARS-Anwendung sehen die Benutzer die Hauptschnittstelle.
  2. Auf der Hauptschnittstelle können die Nutzer verschiedene Vorgänge über Sprachbefehle ausführen, wie z. B. Wetterinformationen abrufen und Tweets versenden.
  3. Die Anwendung unterstützt Visual Language Models (VLMs), die von HuggingFace (in der Cloud) und Ollama (lokal) bereitgestellt werden, und es wird empfohlen, den HuggingFace Inferenz-Endpunkt für eine schnelle Bereitstellung zu verwenden.
  4. Benutzer können sich für die Modellbereitstellung auf die mitgelieferte GUI-Modellbereitstellungsanleitung beziehen.

Hauptfunktionen

natürliche Sprachsteuerung

  1. Tippen Sie in der Hauptschnittstelle auf das Mikrofonsymbol, um die Spracheingabe zu starten.
  2. Sagen Sie Befehle, wie z. B. "Öffnen Sie Ihren Browser und suchen Sie nach Wetter".
  3. Die Anwendung führt die entsprechende Operation gemäß der Anweisung aus und zeigt das Ergebnis auf der Schnittstelle an.

Screenshots und visuelle Erkennung

  1. Wählen Sie in der Hauptschnittstelle die Funktion "Screenshot".
  2. Wählen Sie mit der Maus den Bereich aus, von dem Sie ein Bildschirmfoto machen möchten.
  3. Die App erkennt automatisch den Inhalt des Screenshots und zeigt das Ergebnis an.

Präzise Maus- und Tastatursteuerung

  1. Wählen Sie in der Hauptschnittstelle die Funktion "Maussteuerung" oder "Tastatursteuerung".
  2. Verwenden Sie Sprachbefehle oder geben Sie manuell Befehle ein, um Mausbewegungen und Tastatureingaben zu steuern.
  3. Die Anwendung führt die entsprechenden Aktionen gemäß den Anweisungen aus und gibt ein Echtzeit-Feedback.
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " UI-TARS Desktop: Desktop Intelligentsia Anwendung zur Steuerung von Computern mit natürlicher Sprache

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)