AI Personal Learning
und praktische Anleitung
讯飞绘镜

mac assistant: die KI-Intelligenz, die Desktop-Aktionen auf macOS-Geräten automatisiert

Allgemeine Einführung

mac assistant ist ein Projekt von KI-Intelligenzen, das für macOS entwickelt wurde und darauf abzielt, die Bedienung durch die Kombination von nativer Software und Webfunktionen zu vereinfachen. Das Projekt unterstützt derzeit OpenAI und GEMINI API, und plant die Unterstützung Ollama Läuft auf einem nativen großen Sprachmodell. mac_assistant ist in der Lage, einfache Aufgaben wie das Anklicken von Schaltflächen auf Webseiten und in Anwendungen effizient auszuführen, dank seiner tiefen Integration in den DOM-Baum und die Hilfsfunktionen des Betriebssystems. Allerdings gibt es derzeit Einschränkungen bei der Handhabung von Operationen wie Google Docs und PDF-Dateien. Zukünftige Updates werden die Leistung in diesen Bereichen weiter verbessern. Das Projekt wurde entwickelt von Browser-Nutzung und macOS-Treiber, die es der KI in Zukunft ermöglichen werden, mehr Tools zur Verbesserung ihrer Leistung zu nutzen.

mac assistant:macOS设备中自动执行桌面操作的AI智能体-1


 

Funktionsliste

  • Unterstützung für OpenAI und GEMINI APIs
  • Pläne zur Unterstützung des Ollama Native Large Language Model
  • Effiziente Ausführung von Schaltflächenklickaufgaben in Webseiten und Anwendungen
  • Tief integrierte DOM-Baum- und OS-Hilfsfunktionen
  • Bietet eine benutzerfreundliche Schnittstelle für die Interaktion mit Intelligenzen und APIs

 

Hilfe verwenden

Einbauverfahren

  1. Installation der erforderlichen Bibliotheken: Installieren Sie zunächst die erforderlichen Bibliotheken, indem Sie den folgenden Befehl ausführen:
   pip install PyQt5 pyinstaller langchain-openai browser-use mlx-use python-dotenv
  1. Erstellen von .env-Dateien: Erstellen einer.envDatei und fügen Sie Folgendes hinzu:
   OPENAI_API_KEY=你的OpenAI密钥
GEMINI_API_KEY=你的GEMINI密钥
  1. Ausführen der Anwendung: Führen Sie den folgenden Befehl im Terminal aus, um die Anwendung zu starten:
   python agent_ui.py

Leitlinien für die Verwendung

  1. Einführung in die SchnittstelleNach dem Start der Anwendung wird Ihnen eine Benutzeroberfläche präsentiert, über die Sie mit Intelligenzen und APIs interagieren können. Die Schnittstelle ist einfach und intuitiv gestaltet, um eine benutzerfreundliche Bedienung zu ermöglichen.
  2. betreiben.Über die Schnittstelle können Sie Befehle eingeben, damit die Intelligenz bestimmte Aufgaben ausführt, z. B. das Klicken auf eine Schaltfläche auf einer Webseite oder das Ausführen einer Aktion in einer Anwendung. Die Intelligenz führt diese Aufgaben automatisch gemäß den Anweisungen aus.
  3. Künftige AktualisierungenMit der weiteren Entwicklung des Projekts wird die Unterstützung für weitere Dateitypen (z. B. Google Docs und PDF) hinzugefügt und die Gesamtleistung der Intelligenz verbessert werden.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " mac assistant: die KI-Intelligenz, die Desktop-Aktionen auf macOS-Geräten automatisiert
de_DEDeutsch