Fara-7B - Microsoft의 오픈 소스 컴퓨터 운영 에이전트 어시스턴트 모델

최신 AI 리소스3주 전에 게시 됨 AI 공유 서클
14.3K 00
堆友AI

Fara-7B란 무엇인가요?

Fara-7B는 Microsoft에서 오픈 소스로 공개한 70억 개의 매개변수 규모의 컴퓨터 운영 에이전트(CUA) 모델로, Qwen2.5-VL-7B 아키텍처를 기반으로 합니다. 웹 페이지 스크린샷을 시각적으로 파싱하여 추가적인 접근성 트리나 여러 대형 모델의 협업에 의존하지 않고 화면에서 클릭, 입력 및 기타 작업을 수행하며, 지연 시간을 줄이고 개인 정보 보호를 강화하기 위해 NPU 가속을 지원하여 Windows 11 로컬에서 직접 실행할 수 있습니다.Fara-7B는 WebVoyager, Online-Mind2Web 등과 같은 공개 벤치마크에서 다음과 같이 입증된 바 있습니다. 높은 작업 성공률로 뛰어난 성능을 발휘하며 일부 작업에서 동급 모델을 선도합니다. 대량의 작업 궤적과 보조 작업 데이터를 포함하는 훈련을 위한 새로운 합성 데이터 생성 프로세스를 채택하여 감독된 미세 조정에 중점을 둡니다.

Fara-7B - 微软开源的计算机操作Agent助手模型

Fara-7B의 기능적 특징

  • 비전 중심 운영추가 접근성 트리나 여러 대형 모델의 협업에 의존하지 않고 웹 페이지의 스크린샷을 시각적으로 파싱하여 화면에서 직접 클릭, 입력, 스크롤 등을 수행할 수 있습니다.
  • 로컬 운영 및 개인 정보 보호Windows 11에서 기본적으로 실행되며 지연 시간이 짧고 개인 정보 보호를 강화하기 위해 NPU 가속을 지원합니다.
  • 잘 구축된 보안 메커니즘민감한 작업에 대한 사용자 동의를 구하기 위해 '중요한 지점'에서 멈추고, 모든 작업이 기록되며, 샌드박스 환경에서 실행되어야 하고, 부적절한 작업 수행을 거부하는 예시가 교육에 포함되어 있습니다.
  • 고성능웹보야저, 온라인-마인드2웹 등과 같은 공개 벤치마크에서 우수한 성능, 높은 작업 성공률 및 일부 작업은 동급 모델보다 앞서 있습니다.
  • 오픈 소스 및 사용 편의성마이크로소프트 파운드리와 허깅 페이스에서 MIT 라이선스에 따라 출시 및 오픈소스화되었으며, 사용과 개발이 용이하도록 정량화되고 최적화된 버전을 Magentic-UI 연구 프로토타입에 통합하여 제공합니다.

Fara-7B의 핵심 강점

  • 비전 기반의 직접 조작Fara-7B는 웹 페이지의 스크린샷을 시각적으로 파싱하여 화면에서 직접 작업을 수행하므로 복잡한 접근성 트리나 여러 모델의 협업에 의존할 필요가 없어 보다 직관적이고 효율적으로 작업할 수 있습니다.
  • 로컬 운영 및 개인 정보 보호Windows 11에서 기본적으로 실행을 지원하며, 사용자 데이터 프라이버시를 보장하면서 지연 시간이 짧은 응답을 위해 NPU 가속과 결합됩니다.
  • 강력한 보안 메커니즘민감한 작업에 대해서는 사용자의 동의를 구하며, 부적절한 작업을 방지하기 위해 샌드박스 환경에서 기록 및 실행됩니다.
  • 높은 성능과 성공률여러 공개 벤치마크에서 높은 작업 성공률과 일부 작업은 동종 모델보다 앞서며 뛰어난 성능을 입증했습니다.

Fara-7B의 공식 웹사이트는 무엇인가요?

  • 프로젝트 웹사이트:: https://www.microsoft.com/en-us/research/blog/fara-7b-an-efficient-agentic-model-for-computer-use/
  • GitHub 리포지토리:: https://github.com/microsoft/fara
  • 허깅페이스 모델 라이브러리:: https://huggingface.co/microsoft/Fara-7B
  • 기술 문서:: https://www.microsoft.com/en-us/research/wp-content/uploads/2025/11/Fara-7B-An-Efficient-Agentic-Model-for-Computer-Use.pdf

Fara-7B의 대상 사용자

  • 개발자 및 연구원Fara-7B의 오픈 소스 특성은 개발자와 연구자가 2차 개발, 모델 최적화 및 알고리즘 연구에 강력한 기능을 사용할 수 있는 이상적인 도구가 됩니다.
  • 자동화된 작업 관리자데이터 입력 및 웹 페이지 자동화 작업과 같이 컴퓨터에서 복잡한 자동화 작업을 수행해야 하는 사용자의 경우 Fara-7B를 사용하면 비주얼 드라이브로 효율적인 작업을 수행할 수 있습니다.
  • 개인정보 보호 및 보안 요구 사항데이터 프라이버시 및 보안에 중점을 두는 사용자는 민감한 정보의 보안을 보장하도록 설계된 Fara-7B의 로컬 실행 및 샌드박스 환경의 이점을 누릴 수 있습니다.
  • 높은 성능 요구 사항을 가진 사용자실시간 웹 상호 작용 및 자동화된 테스트와 같이 빠른 응답과 짧은 지연 시간이 필요한 시나리오에서 Fara-7B의 고성능 성능은 이러한 요구를 충족할 수 있습니다.
  • 신기술 탐험가용최신 AI 기술에 관심이 있는 사용자는 Fara-7B를 통해 컴퓨터 비전과 자연어 처리의 조합과 실제 적용 가능성을 살펴볼 수 있습니다.
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...