Open Operator : effectuer des opérations automatisées dans les navigateurs en nuage grâce à l'intelligence artificielle
Introduction générale
Ouvrir Opérateur Open Operator est un projet open source qui vise à automatiser les opérations dans le navigateur grâce à l'intelligence artificielle. Développé par Browserbase, le projet combine les technologies de Stagehand et de Browserbase pour permettre aux utilisateurs de contrôler le comportement de leurs navigateurs par des commandes en langage naturel. Open Operator ne fournit pas de service direct, mais sert plutôt d'implémentation de référence qui démontre comment les capacités de navigation sur le web peuvent être intégrées dans un outil d'IA. Il convient aux développeurs qui cherchent à créer et à tester leurs propres outils d'automatisation du navigateur, ou à comprendre les complexités de l'interaction de l'IA avec les pages web.

Liste des fonctions
- Fonctionnement du navigateur AI DriverLa recherche d'un navigateur : l'utilisation de commandes en langage naturel pour permettre à l'IA de simuler l'utilisation manuelle d'un navigateur.
- Conversion du langage naturel vers le navigateurLes outils d'aide à la décision : convertissez le langage naturel de l'utilisateur en actions spécifiques dans le navigateur grâce à l'outil Stagehand.
- Source ouverte et évolutivitéLes utilisateurs sont invités à fournir le code source complet, à encourager la participation de la communauté et à aider les utilisateurs à étendre les fonctionnalités en fonction des besoins.
- Intégration avec BrowserbaseLes services de Browserbase : L'utilisation de l'infrastructure de navigation en nuage de Browserbase garantit l'efficacité et la stabilité des opérations.
- ressources éducativesLe logiciel de gestion de l'information est un outil d'aide à l'apprentissage et à la mise en œuvre pour les développeurs débutants et professionnels, grâce à une documentation complète et des exemples de code.
Utiliser l'aide
Processus d'installation
Open Operator étant un projet open source, il n'y a pas d'étapes d'installation au sens traditionnel du terme, mais vous pouvez suivre les étapes ci-dessous pour démarrer ou développer :
1.entrepôt de clones: :
- Ouvrez un terminal ou une invite de commande.
- utiliser
git clone
pour cloner le projet localement :git clone https://github.com/browserbase/open-operator.git
- Accédez au catalogue de projets :
cd open-operator
2.Installation des dépendances: :
- Assurez-vous que Node.js et npm sont installés, car le projet utilise le gestionnaire de paquets pnpm.
- Installer pnpm (si ce n'est pas déjà fait) :
npm install -g pnpm
- Installer les dépendances du projet :
pnpm install
3.Projets en cours: :
- Démarrer le serveur local :
pnpm dev
- Ouvrez votre navigateur et visitez
http://localhost:3000
pour voir Open Operator en action.
Lignes directrices pour l'utilisation
Comprendre la structure du projet: :
src/
qui contient tout le code source.src/agent/
Le catalogue est particulièrement intéressant, car il définit la logique des intelligences de l'IA.examples/
Des exemples de code sont inclus pour vous aider à comprendre rapidement comment utiliser le projet.
Rédigez votre première mission d'IA: :
- compilateur
examples/example.ts
Voici un exemple simple montrant comment utiliser l'IA pour la manipulation du web. L'exemple de code se trouve ci-dessous :
import { Agent } from '@browserbase/open-operator';
import { OpenAI } from 'langchain/llms/openai';
async function run() {
const agent = new Agent({
llm: new OpenAI({ temperature: 0 }),
});
const task = await agent.run({
task: "Search for 'Browserbase' on Google and click on the first result.",
});
console.log(task.result);
}
run();
- Ce code montre comment instancier un agent et effectuer une simple tâche de recherche et de clic.
Test et débogage :
- Utilisez les outils de développement de votre navigateur pour observer les effets en temps réel des opérations d'IA. Les requêtes réseau, les journaux de la console, etc. peuvent être visualisés dans Chrome DevTools pour surveiller chaque étape d'une opération d'IA.
- Testez différentes tâches d'IA en modifiant le fichier example.ts ou en ajoutant de nouveaux fichiers de script.
Extension et personnalisation :
- Vous pouvez étendre la fonctionnalité d'Open Operator en modifiant la classe Agent ou en ajoutant une nouvelle logique de traitement si nécessaire.
- Reportez-vous à la documentation de Stagehand pour un contrôle plus précis des opérations du navigateur.
Grâce aux étapes et aux guides ci-dessus, vous pouvez commencer à explorer Open Operator et à comprendre sa philosophie de conception, pour ensuite développer des applications plus complexes d'automatisation du navigateur basées sur l'IA.
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...