오픈 오퍼레이터: AI 인텔리전스를 통해 클라우드 브라우저에서 자동화된 작업 수행하기

최신 AI 리소스12개월 전에 게시됨 AI 공유 서클
41K 00
堆友AI

일반 소개

열기 연산자 오픈 오퍼레이터는 인공지능을 통해 브라우저의 작동을 자동화하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 브라우저베이스에서 개발한 이 프로젝트는 스테이지핸드와 브라우저베이스의 기술을 결합하여 사용자가 자연어 명령을 통해 브라우저의 동작을 제어할 수 있도록 하며, 오픈 오퍼레이터는 직접적인 서비스를 제공하지는 않지만 웹 브라우징 기능을 AI 도구에 통합하는 방법을 보여주는 참조 구현의 역할을 합니다. 자체 브라우저 자동화 도구를 구축 및 테스트하거나 웹 페이지와 AI의 복잡한 상호 작용을 이해하려는 개발자에게 적합합니다.

Open Operator:通过AI智能体在云浏览器中执行自动化操作

 

기능 목록

  • AI 드라이버 브라우저 작동자연어 명령을 사용하여 AI가 브라우저의 수동 조작을 시뮬레이션할 수 있도록 합니다.
  • 자연어를 브라우저로 변환스테이지핸드 도구를 사용하여 사용자의 자연어를 특정 브라우저 동작으로 변환합니다.
  • 오픈 소스 및 확장성전체 소스 코드를 제공하고, 커뮤니티 참여를 장려하며, 필요에 따라 사용자가 기능을 확장할 수 있도록 지원합니다.
  • 브라우저베이스와 통합브라우저베이스의 클라우드 브라우저 인프라를 활용하면 효율적이고 안정적인 운영을 보장합니다.
  • 교육 리소스초보자와 전문 개발자가 배우고 적용할 수 있도록 광범위한 문서와 샘플 코드가 포함되어 있습니다.

 

도움말 사용

설치 프로세스

오픈 오퍼레이터는 오픈 소스 프로젝트이므로 전통적인 의미의 설치 단계는 없지만, 아래 단계에 따라 시작하거나 개발할 수 있습니다:

1.클론 창고::

  • 터미널 또는 명령 프롬프트를 엽니다.
  • 활용git clone명령을 사용하여 프로젝트를 로컬로 복제합니다:
    git clone https://github.com/browserbase/open-operator.git
    
  • 프로젝트 카탈로그로 이동합니다:
    cd open-operator
    

2.종속성 설치::

  • 이 프로젝트는 pnpm 패키지 관리자를 사용하므로 Node.js와 npm이 설치되어 있는지 확인하세요.
  • pnpm을 설치합니다(아직 설치하지 않은 경우):
    npm install -g pnpm
    
  • 프로젝트 종속성을 설치합니다:
    pnpm install
    

3.프로젝트 실행::

  • 로컬 서버를 시작합니다:
    pnpm dev
    
  • 브라우저를 열고 다음 사이트를 방문하세요.http://localhost:3000를 클릭하여 Open Operator가 실제로 작동하는 모습을 확인하세요.

사용 가이드라인

프로젝트 구조 이해::

  • src/모든 소스 코드가 포함된 카탈로그입니다.src/agent/이 카탈로그는 AI 지능의 로직이 정의되어 있어 특히 흥미롭습니다.
  • examples/프로젝트 사용 방법을 빠르게 이해할 수 있도록 샘플 코드가 포함되어 있습니다.

첫 번째 AI 미션 작성하기::

  • 컴파일러examples/example.ts다음은 웹 조작에 AI를 사용하는 방법을 보여주는 간단한 예제입니다. 코드 샘플은 아래와 같습니다:
import { Agent } from '@browserbase/open-operator';
  import { OpenAI } from 'langchain/llms/openai';

  async function run() {
    const agent = new Agent({
      llm: new OpenAI({ temperature: 0 }),
    });

    const task = await agent.run({
      task: "Search for 'Browserbase' on Google and click on the first result.",
    });

    console.log(task.result);
  }

  run();
  • 이 코드는 에이전트를 인스턴스화한 다음 간단한 검색 및 클릭 작업을 수행하는 방법을 보여줍니다.

테스트 및 디버깅:

  • 브라우저의 개발자 도구를 사용하여 AI 작업의 실시간 효과를 관찰하세요. 네트워크 요청, 콘솔 로그 등을 Chrome 개발자도구에서 확인하여 AI 작업의 모든 단계를 모니터링할 수 있습니다.
  • example.ts를 수정하거나 새 스크립트 파일을 추가하여 다양한 AI 작업을 테스트하세요.

확장 및 사용자 지정:

  • 필요에 따라 에이전트 클래스를 수정하거나 새 처리 로직을 추가하여 오픈 오퍼레이터의 기능을 확장할 수 있습니다.
  • 브라우저 작동을 보다 정밀하게 제어하려면 스테이지핸드 설명서를 참조하세요.

위의 단계와 가이드를 통해 Open Operator를 살펴보고 설계 철학을 이해한 다음, 보다 복잡한 AI 기반 브라우저 자동화 애플리케이션을 개발할 수 있습니다.

© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...