mac assistant : l'intelligence artificielle qui automatise les actions de bureau sur les appareils macOS

Introduction générale

mac assistant est un projet d'intelligence artificielle conçu pour macOS, visant à simplifier les opérations de l'utilisateur en combinant des logiciels natifs et des fonctionnalités web. Le projet prend actuellement en charge OpenAI et GEMINI et prévoit de prendre en charge l'API Ollama Mac_assistant est capable d'effectuer efficacement des tâches simples telles que cliquer sur des boutons sur des pages web et dans des applications, grâce à son intégration profonde avec l'arbre DOM et les fonctions d'aide du système d'exploitation. Cependant, il est actuellement limité dans le traitement d'opérations telles que Google Docs et les fichiers PDF. De futures mises à jour permettront d'améliorer ses performances dans ces domaines. Le projet a été développé par utilisation du navigateur et macOS, ce qui permettra à l'avenir à l'IA d'utiliser davantage d'outils pour améliorer ses performances.

mac assistant:macOS设备自动执行桌面操作的AI智能体

 

Liste des fonctions

  • Prise en charge des API OpenAI et GEMINI
  • Projets visant à soutenir le modèle de la grande langue autochtone Ollama
  • Exécution efficace des tâches de clic sur les boutons dans les pages web et les applications
  • Arbre DOM profondément intégré et fonctions d'aide du système d'exploitation
  • Fournit une interface facile à utiliser pour interagir avec les intelligences et les API.

 

Utiliser l'aide

Processus d'installation

  1. Installation des bibliothèques requisesPour ce faire, vous devez d'abord installer les bibliothèques nécessaires en exécutant la commande suivante :
   pip install PyQt5 pyinstaller langchain-openai browser-use mlx-use python-dotenv
  1. Création de fichiers .env: Créer un.envet ajouter ce qui suit :
   OPENAI_API_KEY=你的OpenAI密钥
GEMINI_API_KEY=你的GEMINI密钥
  1. Exécution de l'applicationLancement de l'application : Exécutez la commande suivante dans le terminal pour lancer l'application :
   python agent_ui.py

Lignes directrices pour l'utilisation

  1. Introduction à l'interfaceLancement de l'application : Au lancement de l'application, une interface utilisateur vous permet d'interagir avec les intelligences et les API. L'interface est conçue pour être simple et intuitive afin d'en faciliter l'utilisation.
  2. opérerL'interface permet d'entrer des commandes pour que l'intelligence effectue des tâches spécifiques, comme cliquer sur un bouton sur une page web ou effectuer une action dans une application. L'intelligence effectuera ces tâches automatiquement selon les instructions.
  3. Mises à jour futuresLe projet continuant d'évoluer, la prise en charge d'autres types de fichiers (par exemple, Google Docs et PDF) sera ajoutée à l'avenir et les performances globales des intelligences seront améliorées.
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...