일반 소개
열기 연산자 오픈 오퍼레이터는 인공지능을 통해 브라우저의 작동을 자동화하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 브라우저베이스에서 개발한 이 프로젝트는 스테이지핸드와 브라우저베이스의 기술을 결합하여 사용자가 자연어 명령을 통해 브라우저의 동작을 제어할 수 있도록 하며, 오픈 오퍼레이터는 직접적인 서비스를 제공하지는 않지만 웹 브라우징 기능을 AI 도구에 통합하는 방법을 보여주는 참조 구현의 역할을 합니다. 자체 브라우저 자동화 도구를 구축 및 테스트하거나 웹 페이지와 AI의 복잡한 상호 작용을 이해하려는 개발자에게 적합합니다.

기능 목록
- AI 드라이버 브라우저 작동자연어 명령을 사용하여 AI가 브라우저의 수동 조작을 시뮬레이션할 수 있도록 합니다.
- 자연어를 브라우저로 변환스테이지핸드 도구를 사용하여 사용자의 자연어를 특정 브라우저 동작으로 변환합니다.
- 오픈 소스 및 확장성전체 소스 코드를 제공하고, 커뮤니티 참여를 장려하며, 필요에 따라 사용자가 기능을 확장할 수 있도록 지원합니다.
- 브라우저베이스와 통합브라우저베이스의 클라우드 브라우저 인프라를 활용하면 효율적이고 안정적인 운영을 보장합니다.
- 교육 리소스초보자와 전문 개발자가 배우고 적용할 수 있도록 광범위한 문서와 샘플 코드가 포함되어 있습니다.
도움말 사용
설치 프로세스
오픈 오퍼레이터는 오픈 소스 프로젝트이므로 전통적인 의미의 설치 단계는 없지만, 아래 단계에 따라 시작하거나 개발할 수 있습니다:
1.클론 창고::
- 터미널 또는 명령 프롬프트를 엽니다.
- 활용
git clone
명령을 사용하여 프로젝트를 로컬로 복제합니다:git clone https://github.com/browserbase/open-operator.git
- 프로젝트 카탈로그로 이동합니다:
cd open-operator
2.종속성 설치::
- 이 프로젝트는 pnpm 패키지 관리자를 사용하므로 Node.js와 npm이 설치되어 있는지 확인하세요.
- pnpm을 설치합니다(아직 설치하지 않은 경우):
npm install -g pnpm
- 프로젝트 종속성을 설치합니다:
pnpm install
3.프로젝트 실행::
- 로컬 서버를 시작합니다:
pnpm dev
- 브라우저를 열고 다음 사이트를 방문하세요.
http://localhost:3000
를 클릭하여 Open Operator가 실제로 작동하는 모습을 확인하세요.
사용 가이드라인
프로젝트 구조 이해::
src/
모든 소스 코드가 포함된 카탈로그입니다.src/agent/
이 카탈로그는 AI 지능의 로직이 정의되어 있어 특히 흥미롭습니다.examples/
프로젝트 사용 방법을 빠르게 이해할 수 있도록 샘플 코드가 포함되어 있습니다.
첫 번째 AI 미션 작성하기::
- 컴파일러
examples/example.ts
다음은 웹 조작에 AI를 사용하는 방법을 보여주는 간단한 예제입니다. 코드 샘플은 아래와 같습니다:
import { Agent } from '@browserbase/open-operator';
import { OpenAI } from 'langchain/llms/openai';
async function run() {
const agent = new Agent({
llm: new OpenAI({ temperature: 0 }),
});
const task = await agent.run({
task: "Search for 'Browserbase' on Google and click on the first result.",
});
console.log(task.result);
}
run();
- 이 코드는 에이전트를 인스턴스화한 다음 간단한 검색 및 클릭 작업을 수행하는 방법을 보여줍니다.
테스트 및 디버깅:
- 브라우저의 개발자 도구를 사용하여 AI 작업의 실시간 효과를 관찰하세요. 네트워크 요청, 콘솔 로그 등을 Chrome 개발자도구에서 확인하여 AI 작업의 모든 단계를 모니터링할 수 있습니다.
- example.ts를 수정하거나 새 스크립트 파일을 추가하여 다양한 AI 작업을 테스트하세요.
확장 및 사용자 지정:
- 필요에 따라 에이전트 클래스를 수정하거나 새 처리 로직을 추가하여 오픈 오퍼레이터의 기능을 확장할 수 있습니다.
- 브라우저 작동을 보다 정밀하게 제어하려면 스테이지핸드 설명서를 참조하세요.
위의 단계와 가이드를 통해 Open Operator를 살펴보고 설계 철학을 이해한 다음, 보다 복잡한 AI 기반 브라우저 자동화 애플리케이션을 개발할 수 있습니다.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...