Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1

OWL: uma ferramenta automatizada para colaboração com várias inteligências em tarefas realistas

Introdução geral

O OWL (Optimized Workforce Learning) é uma estrutura de código-fonte aberto desenvolvida pela equipe CAMEL-AI, cujo foco é otimizar a colaboração de vários corpos inteligentes para a automação de tarefas do mundo real. Com base na arquitetura CAMEL-AI, o OWL aprimora a naturalidade, a eficiência e a robustez do processamento de tarefas por meio de interações dinâmicas de corpos inteligentes. No teste de benchmark GAIA, a OWL obteve uma pontuação média de 58,18, ficando em primeiro lugar entre as estruturas de código aberto. O projeto teve seu código aberto oficialmente em 7 de março de 2025, e o código está hospedado no GitHub (https://github.com/camel-ai/owl), que fornece documentação detalhada e exemplos, com o objetivo de promover a integração da pesquisa de IA e aplicativos do mundo real para cenários de exploração acadêmica e automação de tarefas.

O mais triste sobre a comunidade de língua chinesa é que, como fonte de informações, eles nunca apresentam o CAMEL-AI e o AGENTGPT Em vez disso, eles estão interessados em algo como Manus O OWL é muito interessante. A comercialização de alguns produtos promoverá o progresso tecnológico, outros não.

OWL: Colaboração multiinteligente para a ferramenta de automação de tarefas realistas-1

 

Lista de funções

  • Recuperação de informações em tempo realSuporte ao acesso a informações atualizadas por meio de recursos on-line, como Wikipedia, Google Search, etc.
  • processamento multimodalCapacidade de processar dados de vídeo, imagem e áudio pela rede ou localmente.
  • Automação do navegadorBaseado na estrutura Playwright, ele oferece suporte à simulação de ações do navegador, como rolagem, clique, digitação e download.
  • resolução de documentosExtraia o conteúdo de arquivos do Word, Excel, PDF e PowerPoint e converta-os para o formato de texto ou Markdown.
  • execução de códigoSuporte para escrever e executar código Python para realizar tarefas por meio do interpretador.
  • colaboração de inteligência múltiplaInteligência de IA múltipla: várias inteligências de IA interagem dinamicamente para colaborar em tarefas complexas.

 

Usando a Ajuda

Processo de instalação

O OWL é um projeto de código aberto, os usuários precisam fazer o download do código-fonte do GitHub e configurar o ambiente de tempo de execução. Veja a seguir as etapas detalhadas de instalação:

  1. armazém de clones
    Digite o seguinte comando no terminal para obter o código-fonte OWL:
git clone https://github.com/camel-ai/owl.git
cd owl
  1. Configuração do ambiente
  • Conda recomendada::
    conda create -n owl python=3.11
    conda activate owl
    
  • Uso alternativo do venv::
    python -m venv owl_env
    
    • Ativação do sistema Windows:
      owl_env\Scripts\activate
      
    • Ativação do sistema Unix ou MacOS:
      fonte owl_env/bin/activate
      
  1. Instalação de dependências
    Depois de ativar o ambiente, execute o seguinte comando para instalar as dependências:
python -m pip install -r requirements.txt
instalação do playwright

Observações:instalação de dramaturgoUsado para instalar os componentes necessários para a automação do navegador.

  1. Configuração de variáveis de ambiente
    A OWL precisa configurar chaves de API para usar serviços externos (por exemplo, modelos OpenAI). As etapas são as seguintes:
  • Copie o arquivo de modelo:
    cp .env_template .env
    
  • compilador.envpreencha a chave da API, por exemplo:
    OPENAI_API_KEY=sua_chave_openai
    
  • Diretrizes para obtenção da chave: consulteowl/.env_templateO URL de registro do serviço listado no
  • Mais suporte ao modelo: disponível na documentação do modelo CAMEL (https://docs.camel-ai.org/key_modules/models.html).
    tomar nota deRecomendamos oficialmente o uso dos modelos da OpenAI para obter o melhor desempenho; outros modelos podem ter um desempenho ruim em tarefas complexas.
  1. Verificar a instalação
    Execute o seguinte comando para testar o ambiente:
python owl/run.py

Se o console emitir uma mensagem normal, a instalação foi bem-sucedida.

Funções principais

1. exemplos de bases operacionais

A OWL fornece um script de exemplo minimalistarun.pyExecute-o diretamente para experimentá-lo:

  • Digite-o no terminal:
python owl/run.py
  • Saída: O console exibirá os resultados da execução da tarefa padrão.

2. personalização de mandatos

Os usuários podem modificar orun.pyScripts para executar tarefas personalizadas:

  • Edição de scripts: Abertorun.pymodifique a descrição da tarefa, por exemplo:
question = "Verifique o preço mais recente das ações da Apple Inc."
society = construct_society(question)
answer, chat_history, token_count = run_society(society)
logger.success(f "Answer: {answer}")
  • Executando scripts::
    python owl/run.py
    
  • Visualização de resultadosPreço da ação: O console exibirá informações sobre o preço da ação.
  • Outros exemplos de tarefas::
    • "Analisando o sentimento dos tweets recentes sobre mudança climática".
    • "Ajude-me a depurar este código Python:[conteúdo do código]"
    • "Resuma os principais pontos deste trabalho de pesquisa:[URL do trabalho]."

3. automação do navegador

A OWL oferece suporte à interação com o navegador por meio do Playwright, como o rastreamento de páginas da Web:

  • Exemplo de scriptCriar um arquivo (por exemploweb_task.py):
    de owl.import BrowserAgent
    agente = BrowserAgent()
    agent.navigate("https://example.com")
    content = agent.get_content()
    print(content)
    
  • Executando scripts::
    python web_task.py
    
  • no finalTexto de saída: Emite o conteúdo de texto de uma página da Web.
  • Operações com suporteAPIs: rolagem, clique, digitação, download etc. Consulte a documentação oficial para obter informações sobre APIs específicas.

4. análise de documentos e processamento multimodal

  • analisar um documentoColocar um arquivo local (por exemploamostra.pdf(computação) colocar (em)corujaexecute o seguinte código:
    from owl.utils import parse_document
    text = parse_document("sample.pdf")
    print(text)
    
  • Processamento de vídeoSuporte para análise de vídeo local ou em rede, por exemplo:
    from owl.multimodal import process_video
    result = process_video("https://example.com/video.mp4")
    print(result)
    

Operação da função em destaque

Recuperação de informações em tempo real

  • procedimentoEspecifique a fonte de informações na descrição da tarefa, por exemplo:
    question = "Obtenha a definição mais recente de inteligência artificial na Wikipedia".
    society = construct_society(question)
    answer, chat_history, token_count = run_society(society)
    print(answer)
    
  • no final: Retorne ao conteúdo mais recente da Wikipédia.

Replicação de benchmark GAIA

  • teste operacionalReproduza os resultados do GAIA usando o script fornecido:
    python run_gaia_roleplaying.py
    
  • Visualização de resultadosOutput: produz as pontuações de cada tarefa para verificar o desempenho do OWL no teste de benchmarking (pontuação média de 58,18).

Precauções de uso

  • O Git e o Python 3.11+ precisam estar instalados no sistema.
  • Ao executar tarefas de grande escala, é recomendável usar equipamentos de alto desempenho e garantir a estabilidade da rede.
  • Se a janela do Chrome estiver em branco, mas houver saída do console, isso é normal e a janela só será ativada se a tarefa exigir interação com o navegador.

CDN1
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " OWL: uma ferramenta automatizada para colaboração com várias inteligências em tarefas realistas

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil