Aprendizagem pessoal com IA
e orientação prática

Open Operator: execução de operações automatizadas em navegadores de nuvem com inteligência de IA

Introdução geral

Aberto Operador O Open Operator é um projeto de código aberto que visa automatizar operações no navegador por meio de inteligências de IA. Desenvolvido pelo Browserbase, o projeto combina as tecnologias do Stagehand e do Browserbase para permitir que os usuários controlem o comportamento de seus navegadores por meio de comandos de linguagem natural. O Open Operator não fornece um serviço direto, mas serve como uma implementação de referência que demonstra como os recursos de navegação na Web podem ser integrados a uma ferramenta de IA. Ele é adequado para desenvolvedores que desejam criar e testar suas próprias ferramentas de automação de navegador ou entender as complexidades da interação da IA com páginas da Web.

Operador aberto: automatizando operações em navegadores de nuvem por meio de inteligência de IA-1


 

Lista de funções

  • Operação do navegador do driver de IAUso de comandos de linguagem natural para permitir que a IA simule a operação manual de um navegador.
  • Conversão de linguagem natural para navegadorConverta a linguagem natural do usuário em ações específicas do navegador com a ferramenta Stagehand.
  • Código aberto e escalabilidadeFornecimento de código-fonte completo, incentivo à participação da comunidade e suporte aos usuários para ampliar a funcionalidade conforme necessário.
  • Integração com o BrowserbaseUtilização da infraestrutura de navegador em nuvem do Browserbase garante operações eficientes e estáveis.
  • recursos educacionaisInclui ampla documentação e código de amostra para ajudar desenvolvedores iniciantes e profissionais a aprender e aplicar.

 

Usando a Ajuda

Processo de instalação

Como o Open Operator é um projeto de código aberto, não há etapas de instalação no sentido tradicional, mas você pode seguir as etapas abaixo para começar ou desenvolver:

1.armazém de clones::

  • Abra um terminal ou prompt de comando.
  • fazer uso declone do gitpara clonar o projeto localmente:
    git clone https://github.com/browserbase/open-operator.git
    
  • Vá para o catálogo de projetos:
    cd operador aberto
    

2.Instalação de dependências::

  • Certifique-se de que você tenha o Node.js e o npm instalados, pois o projeto usa o gerenciador de pacotes pnpm.
  • Instale o pnpm (se ainda não estiver instalado):
    npm install -g pnpm
    
  • Instale as dependências do projeto:
    instalação do pnpm
    

3.Projetos em andamento::

  • Inicie o servidor local:
    desenvolvimento do pnpm
    
  • Abra seu navegador e acessehttp://localhost:3000para ver o Open Operator em ação.

Diretrizes para uso

Compreensão da estrutura do projeto::

  • src/que contém todo o código-fonte.src/agent/O catálogo é de particular interesse, onde a lógica das inteligências de IA é definida.
  • exemplos/O código de amostra está incluído para ajudá-lo a entender rapidamente como usar o projeto.

Escreva sua primeira missão de IA::

  • compiladorexamples/example.tsAqui está um exemplo simples que mostra como usar a IA para manipulação da Web. O exemplo de código está abaixo:
importação { Agent } de '@browserbase/open-operator';
  importação { OpenAI } de 'langchain/llms/openai';

  assíncrono função executar() {
    const agente = novo Agente({
      lm: novo OpenAI({ temperatura: 0 }),
    });

    const tarefa = aguardar agent.run({
      tarefa: "Pesquise por 'Browserbase' no Google e clique no primeiro resultado.",
    });

    console.log(task.result);
  }

  run();
  • Este código mostra como instanciar um agente e, em seguida, executar uma tarefa simples de busca e clique.

Teste e depuração:

  • Use as ferramentas de desenvolvedor do navegador para observar os efeitos em tempo real das operações de IA. Solicitações de rede, logs de console e muito mais podem ser visualizados no Chrome DevTools para monitorar cada etapa de uma operação de IA.
  • Teste diferentes tarefas de IA modificando o arquivo example.ts ou adicionando novos arquivos de script.

Extensão e personalização:

  • Você pode ampliar a funcionalidade do Open Operator modificando a classe Agent ou adicionando uma nova lógica de processamento, conforme necessário.
  • Consulte a documentação do Stagehand para obter um controle mais preciso das operações do navegador.

Com as etapas e os guias acima, você pode começar a explorar o Open Operator e entender sua filosofia de design e, por sua vez, desenvolver aplicativos mais complexos de automação de navegador com IA.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Open Operator: execução de operações automatizadas em navegadores de nuvem com inteligência de IA

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil