오픈 오퍼레이터: AI 인텔리전스를 통해 클라우드 브라우저에서 자동화된 작업 수행하기

최신 AI 리소스7개월 전에 게시 됨 AI 공유 서클
2.5K 00

일반 소개

열기 연산자 오픈 오퍼레이터는 인공지능을 통해 브라우저의 작동을 자동화하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 브라우저베이스에서 개발한 이 프로젝트는 스테이지핸드와 브라우저베이스의 기술을 결합하여 사용자가 자연어 명령을 통해 브라우저의 동작을 제어할 수 있도록 하며, 오픈 오퍼레이터는 직접적인 서비스를 제공하지는 않지만 웹 브라우징 기능을 AI 도구에 통합하는 방법을 보여주는 참조 구현의 역할을 합니다. 자체 브라우저 자동화 도구를 구축 및 테스트하거나 웹 페이지와 AI의 복잡한 상호 작용을 이해하려는 개발자에게 적합합니다.

Open Operator:通过AI智能体在云浏览器中执行自动化操作

 

기능 목록

  • AI 드라이버 브라우저 작동자연어 명령을 사용하여 AI가 브라우저의 수동 조작을 시뮬레이션할 수 있도록 합니다.
  • 자연어를 브라우저로 변환스테이지핸드 도구를 사용하여 사용자의 자연어를 특정 브라우저 동작으로 변환합니다.
  • 오픈 소스 및 확장성전체 소스 코드를 제공하고, 커뮤니티 참여를 장려하며, 필요에 따라 사용자가 기능을 확장할 수 있도록 지원합니다.
  • 브라우저베이스와 통합브라우저베이스의 클라우드 브라우저 인프라를 활용하면 효율적이고 안정적인 운영을 보장합니다.
  • 교육 리소스초보자와 전문 개발자가 배우고 적용할 수 있도록 광범위한 문서와 샘플 코드가 포함되어 있습니다.

 

도움말 사용

설치 프로세스

오픈 오퍼레이터는 오픈 소스 프로젝트이므로 전통적인 의미의 설치 단계는 없지만, 아래 단계에 따라 시작하거나 개발할 수 있습니다:

1.클론 창고::

  • 터미널 또는 명령 프롬프트를 엽니다.
  • 활용git clone명령을 사용하여 프로젝트를 로컬로 복제합니다:
    git clone https://github.com/browserbase/open-operator.git
    
  • 프로젝트 카탈로그로 이동합니다:
    cd open-operator
    

2.종속성 설치::

  • 이 프로젝트는 pnpm 패키지 관리자를 사용하므로 Node.js와 npm이 설치되어 있는지 확인하세요.
  • pnpm을 설치합니다(아직 설치하지 않은 경우):
    npm install -g pnpm
    
  • 프로젝트 종속성을 설치합니다:
    pnpm install
    

3.프로젝트 실행::

  • 로컬 서버를 시작합니다:
    pnpm dev
    
  • 브라우저를 열고 다음 사이트를 방문하세요.http://localhost:3000를 클릭하여 Open Operator가 실제로 작동하는 모습을 확인하세요.

사용 가이드라인

프로젝트 구조 이해::

  • src/모든 소스 코드가 포함된 카탈로그입니다.src/agent/이 카탈로그는 AI 지능의 로직이 정의되어 있어 특히 흥미롭습니다.
  • examples/프로젝트 사용 방법을 빠르게 이해할 수 있도록 샘플 코드가 포함되어 있습니다.

첫 번째 AI 미션 작성하기::

  • 컴파일러examples/example.ts다음은 웹 조작에 AI를 사용하는 방법을 보여주는 간단한 예제입니다. 코드 샘플은 아래와 같습니다:
import { Agent } from '@browserbase/open-operator';
  import { OpenAI } from 'langchain/llms/openai';

  async function run() {
    const agent = new Agent({
      llm: new OpenAI({ temperature: 0 }),
    });

    const task = await agent.run({
      task: "Search for 'Browserbase' on Google and click on the first result.",
    });

    console.log(task.result);
  }

  run();
  • 이 코드는 에이전트를 인스턴스화한 다음 간단한 검색 및 클릭 작업을 수행하는 방법을 보여줍니다.

테스트 및 디버깅:

  • 브라우저의 개발자 도구를 사용하여 AI 작업의 실시간 효과를 관찰하세요. 네트워크 요청, 콘솔 로그 등을 Chrome 개발자도구에서 확인하여 AI 작업의 모든 단계를 모니터링할 수 있습니다.
  • example.ts를 수정하거나 새 스크립트 파일을 추가하여 다양한 AI 작업을 테스트하세요.

확장 및 사용자 지정:

  • 필요에 따라 에이전트 클래스를 수정하거나 새 처리 로직을 추가하여 오픈 오퍼레이터의 기능을 확장할 수 있습니다.
  • 브라우저 작동을 보다 정밀하게 제어하려면 스테이지핸드 설명서를 참조하세요.

위의 단계와 가이드를 통해 Open Operator를 살펴보고 설계 철학을 이해한 다음, 보다 복잡한 AI 기반 브라우저 자동화 애플리케이션을 개발할 수 있습니다.

© 저작권 정책
AiPPT

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...