Introdução geral
O mac assistant é um projeto de inteligências de IA desenvolvido para o macOS, com o objetivo de simplificar as operações do usuário combinando software nativo e recursos da Web. Atualmente, o projeto é compatível com OpenAI e GÊMEOS API, e planeja oferecer suporte a Ollama O mac_assistant é capaz de executar com eficiência tarefas simples, como clicar em botões em páginas da Web e em aplicativos, graças à sua profunda integração com a árvore DOM e às funções auxiliares do sistema operacional. No entanto, atualmente ele tem limitações para lidar com operações como Google Docs e arquivos PDF. Futuras atualizações aprimorarão ainda mais seu desempenho nessas áreas. O projeto foi desenvolvido por uso do navegador e drivers para macOS, o que, no futuro, permitirá que a IA utilize mais ferramentas para melhorar seu desempenho.
Lista de funções
- Suporte para APIs OpenAI e GEMINI
- Planos para apoiar o modelo de idioma grande nativo Ollama
- Execução eficiente de tarefas de clique de botão em páginas da Web e aplicativos
- Árvore DOM profundamente integrada e funções auxiliares de sistema operacional
- Fornece uma interface fácil de usar para interagir com inteligências e APIs
Usando a Ajuda
Processo de instalação
- Instalação das bibliotecas necessáriasPrimeiro, instale as bibliotecas necessárias executando o seguinte comando:
pip install PyQt5 pyinstaller langchain-openai browser-use mlx-use python-dotenv
- Criação de arquivos .env: Criar um
.env
e adicione o seguinte:
OPENAI_API_KEY=你的OpenAI密钥
GEMINI_API_KEY=你的GEMINI密钥
- Executar o aplicativoExecute o seguinte comando no terminal para iniciar o aplicativo:
python agent_ui.py
Diretrizes para uso
- Introdução à interfaceInterface de usuário: Ao iniciar o aplicativo, você verá uma interface de usuário que permite interagir com inteligências e APIs. A interface foi projetada para ser simples e intuitiva para facilitar a operação.
- operarInterface de usuário: Por meio da interface, você pode inserir comandos para que a Inteligência execute tarefas específicas, como clicar em um botão em uma página da Web ou executar uma ação em um aplicativo. A Inteligência executará essas tarefas automaticamente de acordo com as instruções.
- Atualizações futurasComo o projeto continua a evoluir, o suporte a mais tipos de arquivos (por exemplo, Google Docs e PDF) será adicionado no futuro e o desempenho geral das inteligências será aprimorado.