Open Operator : effectuer des opérations automatisées dans les navigateurs en nuage grâce à l'intelligence artificielle

Introduction générale

Ouvrir Opérateur Open Operator est un projet open source qui vise à automatiser les opérations dans le navigateur grâce à l'intelligence artificielle. Développé par Browserbase, le projet combine les technologies de Stagehand et de Browserbase pour permettre aux utilisateurs de contrôler le comportement de leurs navigateurs par des commandes en langage naturel. Open Operator ne fournit pas de service direct, mais sert plutôt d'implémentation de référence qui démontre comment les capacités de navigation sur le web peuvent être intégrées dans un outil d'IA. Il convient aux développeurs qui cherchent à créer et à tester leurs propres outils d'automatisation du navigateur, ou à comprendre les complexités de l'interaction de l'IA avec les pages web.

Open Operator:通过AI智能体在云浏览器中执行自动化操作

 

Liste des fonctions

  • Fonctionnement du navigateur AI DriverLa recherche d'un navigateur : l'utilisation de commandes en langage naturel pour permettre à l'IA de simuler l'utilisation manuelle d'un navigateur.
  • Conversion du langage naturel vers le navigateurLes outils d'aide à la décision : convertissez le langage naturel de l'utilisateur en actions spécifiques dans le navigateur grâce à l'outil Stagehand.
  • Source ouverte et évolutivitéLes utilisateurs sont invités à fournir le code source complet, à encourager la participation de la communauté et à aider les utilisateurs à étendre les fonctionnalités en fonction des besoins.
  • Intégration avec BrowserbaseLes services de Browserbase : L'utilisation de l'infrastructure de navigation en nuage de Browserbase garantit l'efficacité et la stabilité des opérations.
  • ressources éducativesLe logiciel de gestion de l'information est un outil d'aide à l'apprentissage et à la mise en œuvre pour les développeurs débutants et professionnels, grâce à une documentation complète et des exemples de code.

 

Utiliser l'aide

Processus d'installation

Open Operator étant un projet open source, il n'y a pas d'étapes d'installation au sens traditionnel du terme, mais vous pouvez suivre les étapes ci-dessous pour démarrer ou développer :

1.entrepôt de clones: :

  • Ouvrez un terminal ou une invite de commande.
  • utilisergit clonepour cloner le projet localement :
    git clone https://github.com/browserbase/open-operator.git
    
  • Accédez au catalogue de projets :
    cd open-operator
    

2.Installation des dépendances: :

  • Assurez-vous que Node.js et npm sont installés, car le projet utilise le gestionnaire de paquets pnpm.
  • Installer pnpm (si ce n'est pas déjà fait) :
    npm install -g pnpm
    
  • Installer les dépendances du projet :
    pnpm install
    

3.Projets en cours: :

  • Démarrer le serveur local :
    pnpm dev
    
  • Ouvrez votre navigateur et visitezhttp://localhost:3000pour voir Open Operator en action.

Lignes directrices pour l'utilisation

Comprendre la structure du projet: :

  • src/qui contient tout le code source.src/agent/Le catalogue est particulièrement intéressant, car il définit la logique des intelligences de l'IA.
  • examples/Des exemples de code sont inclus pour vous aider à comprendre rapidement comment utiliser le projet.

Rédigez votre première mission d'IA: :

  • compilateurexamples/example.tsVoici un exemple simple montrant comment utiliser l'IA pour la manipulation du web. L'exemple de code se trouve ci-dessous :
import { Agent } from '@browserbase/open-operator';
  import { OpenAI } from 'langchain/llms/openai';

  async function run() {
    const agent = new Agent({
      llm: new OpenAI({ temperature: 0 }),
    });

    const task = await agent.run({
      task: "Search for 'Browserbase' on Google and click on the first result.",
    });

    console.log(task.result);
  }

  run();
  • Ce code montre comment instancier un agent et effectuer une simple tâche de recherche et de clic.

Test et débogage :

  • Utilisez les outils de développement de votre navigateur pour observer les effets en temps réel des opérations d'IA. Les requêtes réseau, les journaux de la console, etc. peuvent être visualisés dans Chrome DevTools pour surveiller chaque étape d'une opération d'IA.
  • Testez différentes tâches d'IA en modifiant le fichier example.ts ou en ajoutant de nouveaux fichiers de script.

Extension et personnalisation :

  • Vous pouvez étendre la fonctionnalité d'Open Operator en modifiant la classe Agent ou en ajoutant une nouvelle logique de traitement si nécessaire.
  • Reportez-vous à la documentation de Stagehand pour un contrôle plus précis des opérations du navigateur.

Grâce aux étapes et aux guides ci-dessus, vous pouvez commencer à explorer Open Operator et à comprendre sa philosophie de conception, pour ensuite développer des applications plus complexes d'automatisation du navigateur basées sur l'IA.

© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...