mac assistant: la inteligencia artificial que automatiza las acciones del escritorio en dispositivos macOS

Introducción general

mac assistant es un proyecto de inteligencia artificial diseñado para macOS, cuyo objetivo es simplificar las operaciones del usuario combinando software nativo y funciones web. El proyecto es compatible actualmente con OpenAI y GEMINI API, y tiene previsto admitir Ollama Se ejecuta en un modelo de lenguaje nativo de gran tamaño. mac_assistant es capaz de realizar eficazmente tareas sencillas como pulsar botones en páginas web y aplicaciones, gracias a su profunda integración con el árbol DOM y las funciones de ayuda del sistema operativo. Sin embargo, actualmente tiene limitaciones en el manejo de operaciones como Google Docs y archivos PDF. Futuras actualizaciones mejorarán su rendimiento en estos ámbitos. El proyecto ha sido desarrollado por navegador-uso y macOS, que en el futuro permitirán a la IA utilizar más herramientas para mejorar su rendimiento.

mac assistant:macOS设备自动执行桌面操作的AI智能体

 

Lista de funciones

  • Compatibilidad con las API OpenAI y GEMINI
  • Planes para apoyar el modelo de lenguas grandes nativas de Ollama
  • Ejecución eficaz de tareas de pulsación de botones en páginas web y aplicaciones
  • Árbol DOM profundamente integrado y funciones de ayuda del sistema operativo
  • Proporciona una interfaz fácil de usar para interactuar con las inteligencias y las API

 

Utilizar la ayuda

Proceso de instalación

  1. Instalación de las bibliotecas necesariasEn primer lugar, instale las bibliotecas necesarias ejecutando el siguiente comando:
   pip install PyQt5 pyinstaller langchain-openai browser-use mlx-use python-dotenv
  1. Creación de archivos .env: Crear un.envy añada lo siguiente:
   OPENAI_API_KEY=你的OpenAI密钥
GEMINI_API_KEY=你的GEMINI密钥
  1. Ejecutar la aplicaciónEjecute el siguiente comando en el terminal para iniciar la aplicación:
   python agent_ui.py

Normas de uso

  1. Introducción a la interfazInterfaz de usuario: al iniciar la aplicación, se le presentará una interfaz de usuario que le permitirá interactuar con las inteligencias y las API. La interfaz se ha diseñado de forma sencilla e intuitiva para facilitar su uso.
  2. operarLa Inteligencia Artificial: A través de la interfaz, puede introducir comandos para que la Inteligencia realice tareas específicas, como hacer clic en un botón de una página web o realizar una acción en una aplicación. La Inteligencia realizará estas tareas automáticamente siguiendo las instrucciones.
  3. Futuras actualizaciones: A medida que el proyecto siga evolucionando, en el futuro se añadirá compatibilidad con más tipos de archivos (por ejemplo, Google Docs y PDF) y se mejorará el rendimiento general de las inteligencias.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...