mac assistant : l'intelligence artificielle qui automatise les actions de bureau sur les appareils macOS
Introduction générale
mac assistant est un projet d'intelligence artificielle conçu pour macOS, visant à simplifier les opérations de l'utilisateur en combinant des logiciels natifs et des fonctionnalités web. Le projet prend actuellement en charge OpenAI et GEMINI et prévoit de prendre en charge l'API Ollama Mac_assistant est capable d'effectuer efficacement des tâches simples telles que cliquer sur des boutons sur des pages web et dans des applications, grâce à son intégration profonde avec l'arbre DOM et les fonctions d'aide du système d'exploitation. Cependant, il est actuellement limité dans le traitement d'opérations telles que Google Docs et les fichiers PDF. De futures mises à jour permettront d'améliorer ses performances dans ces domaines. Le projet a été développé par utilisation du navigateur et macOS, ce qui permettra à l'avenir à l'IA d'utiliser davantage d'outils pour améliorer ses performances.

Liste des fonctions
- Prise en charge des API OpenAI et GEMINI
- Projets visant à soutenir le modèle de la grande langue autochtone Ollama
- Exécution efficace des tâches de clic sur les boutons dans les pages web et les applications
- Arbre DOM profondément intégré et fonctions d'aide du système d'exploitation
- Fournit une interface facile à utiliser pour interagir avec les intelligences et les API.
Utiliser l'aide
Processus d'installation
- Installation des bibliothèques requisesPour ce faire, vous devez d'abord installer les bibliothèques nécessaires en exécutant la commande suivante :
pip install PyQt5 pyinstaller langchain-openai browser-use mlx-use python-dotenv
- Création de fichiers .env: Créer un
.env
et ajouter ce qui suit :
OPENAI_API_KEY=你的OpenAI密钥
GEMINI_API_KEY=你的GEMINI密钥
- Exécution de l'applicationLancement de l'application : Exécutez la commande suivante dans le terminal pour lancer l'application :
python agent_ui.py
Lignes directrices pour l'utilisation
- Introduction à l'interfaceLancement de l'application : Au lancement de l'application, une interface utilisateur vous permet d'interagir avec les intelligences et les API. L'interface est conçue pour être simple et intuitive afin d'en faciliter l'utilisation.
- opérerL'interface permet d'entrer des commandes pour que l'intelligence effectue des tâches spécifiques, comme cliquer sur un bouton sur une page web ou effectuer une action dans une application. L'intelligence effectuera ces tâches automatiquement selon les instructions.
- Mises à jour futuresLe projet continuant d'évoluer, la prise en charge d'autres types de fichiers (par exemple, Google Docs et PDF) sera ajoutée à l'avenir et les performances globales des intelligences seront améliorées.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...