Introdução geral
Aberto Operador O Open Operator é um projeto de código aberto que visa automatizar operações no navegador por meio de inteligências de IA. Desenvolvido pelo Browserbase, o projeto combina as tecnologias do Stagehand e do Browserbase para permitir que os usuários controlem o comportamento de seus navegadores por meio de comandos de linguagem natural. O Open Operator não fornece um serviço direto, mas serve como uma implementação de referência que demonstra como os recursos de navegação na Web podem ser integrados a uma ferramenta de IA. Ele é adequado para desenvolvedores que desejam criar e testar suas próprias ferramentas de automação de navegador ou entender as complexidades da interação da IA com páginas da Web.
Lista de funções
- Operação do navegador do driver de IAUso de comandos de linguagem natural para permitir que a IA simule a operação manual de um navegador.
- Conversão de linguagem natural para navegadorConverta a linguagem natural do usuário em ações específicas do navegador com a ferramenta Stagehand.
- Código aberto e escalabilidadeFornecimento de código-fonte completo, incentivo à participação da comunidade e suporte aos usuários para ampliar a funcionalidade conforme necessário.
- Integração com o BrowserbaseUtilização da infraestrutura de navegador em nuvem do Browserbase garante operações eficientes e estáveis.
- recursos educacionaisInclui ampla documentação e código de amostra para ajudar desenvolvedores iniciantes e profissionais a aprender e aplicar.
Usando a Ajuda
Processo de instalação
Como o Open Operator é um projeto de código aberto, não há etapas de instalação no sentido tradicional, mas você pode seguir as etapas abaixo para começar ou desenvolver:
1.armazém de clones::
- Abra um terminal ou prompt de comando.
- fazer uso de
clone do git
para clonar o projeto localmente:git clone https://github.com/browserbase/open-operator.git
- Vá para o catálogo de projetos:
cd operador aberto
2.Instalação de dependências::
- Certifique-se de que você tenha o Node.js e o npm instalados, pois o projeto usa o gerenciador de pacotes pnpm.
- Instale o pnpm (se ainda não estiver instalado):
npm install -g pnpm
- Instale as dependências do projeto:
instalação do pnpm
3.Projetos em andamento::
- Inicie o servidor local:
desenvolvimento do pnpm
- Abra seu navegador e acesse
http://localhost:3000
para ver o Open Operator em ação.
Diretrizes para uso
Compreensão da estrutura do projeto::
src/
que contém todo o código-fonte.src/agent/
O catálogo é de particular interesse, onde a lógica das inteligências de IA é definida.exemplos/
O código de amostra está incluído para ajudá-lo a entender rapidamente como usar o projeto.
Escreva sua primeira missão de IA::
- compilador
examples/example.ts
Aqui está um exemplo simples que mostra como usar a IA para manipulação da Web. O exemplo de código está abaixo:
importação { Agent } de '@browserbase/open-operator';
importação { OpenAI } de 'langchain/llms/openai';
assíncrono função executar() {
const agente = novo Agente({
lm: novo OpenAI({ temperatura: 0 }),
});
const tarefa = aguardar agent.run({
tarefa: "Pesquise por 'Browserbase' no Google e clique no primeiro resultado.",
});
console.log(task.result);
}
run();
- Este código mostra como instanciar um agente e, em seguida, executar uma tarefa simples de busca e clique.
Teste e depuração:
- Use as ferramentas de desenvolvedor do navegador para observar os efeitos em tempo real das operações de IA. Solicitações de rede, logs de console e muito mais podem ser visualizados no Chrome DevTools para monitorar cada etapa de uma operação de IA.
- Teste diferentes tarefas de IA modificando o arquivo example.ts ou adicionando novos arquivos de script.
Extensão e personalização:
- Você pode ampliar a funcionalidade do Open Operator modificando a classe Agent ou adicionando uma nova lógica de processamento, conforme necessário.
- Consulte a documentação do Stagehand para obter um controle mais preciso das operações do navegador.
Com as etapas e os guias acima, você pode começar a explorar o Open Operator e entender sua filosofia de design e, por sua vez, desenvolver aplicativos mais complexos de automação de navegador com IA.