Fara-7B - модель компьютерного ассистента Agent с открытым исходным кодом от Microsoft

堆友AI

Что такое Fara-7B?

Fara-7B - это модель компьютерного операционного агента (CUA) с 7 миллиардами параметров, выпущенная Microsoft с открытым исходным кодом и основанная на архитектуре Qwen2.5-VL-7B. Визуально разбирая скриншоты веб-страниц, она выполняет нажатия, вводы и другие операции на экране, не полагаясь на дополнительные деревья доступности или совместную работу нескольких больших моделей, и может быть запущена непосредственно на Windows 11 локально с поддержкой ускорения NPU для снижения задержек и лучшей защиты конфиденциальности.Fara-7B была продемонстрирована в публичных бенчмарках, таких как WebVoyager, Online-Mind2Web и других. Отличная производительность с высоким процентом успешного выполнения задач и некоторыми задачами, опережающими аналогичные модели. Применяется новый процесс генерации синтетических данных для обучения, который содержит большое количество траекторий задач и вспомогательных данных о задачах, с акцентом на контролируемую тонкую настройку.

Fara-7B - 微软开源的计算机操作Agent助手模型

Функциональные особенности Fara-7B

  • работа, основанная на видении: Выполняйте щелчки, ввод, прокрутку и т. д. непосредственно на экране, визуально анализируя скриншоты веб-страниц, не прибегая к дополнительным деревьям доступности или совместной работе с несколькими большими моделями.
  • Локальное управление и защита конфиденциальности: Работает на базе Windows 11 и поддерживает ускорение NPU для низкой задержки и лучшей защиты конфиденциальности.
  • Хорошо отлаженные механизмы безопасности:: Остановка в "критических точках" для запроса согласия пользователя на выполнение чувствительных операций, все операции протоколируются, должны выполняться в среде "песочницы", а в обучение включены примеры отказа от выполнения неприемлемых задач.
  • Высокая производительность: Отличная производительность в публичных бенчмарках, таких как WebVoyager, Online-Mind2Web и т.д., с высоким процентом успешного выполнения задач и некоторыми задачами, опережающими аналогичные модели.
  • Открытый исходный код и простота использования: Выпущен и открыт под лицензией MIT в Microsoft Foundry и Hugging Face, а также интегрирован в исследовательский прототип Magentic-UI, предоставляя количественные и оптимизированные версии для удобства использования и разработки.

Основные достоинства Fara-7B

  • Ориентированные на перспективу и прямые манипуляции: Fara-7B выполняет операции непосредственно на экране, визуально анализируя скриншоты веб-страниц, устраняя необходимость в сложных деревьях доступности или совместной работе нескольких моделей, что делает операции более интуитивными и эффективными.
  • Локальное управление и защита конфиденциальности: Поддержка нативной работы в Windows 11 в сочетании с ускорением NPU для обеспечения низкой задержки отклика при сохранении конфиденциальности данных пользователя.
  • Надежные механизмы безопасностиДля выполнения конфиденциальных операций запрашивается согласие пользователя, которые записываются и выполняются в "песочнице" для предотвращения неуместных действий.
  • Высокая производительность и процент успеха: Отличные результаты в ряде публичных бенчмарков, высокий процент успешного выполнения заданий и опережение некоторых задач по сравнению с аналогичными моделями, что свидетельствует о выдающейся производительности.

Какой официальный сайт Fara-7B

  • Веб-сайт проекта:: https://www.microsoft.com/en-us/research/blog/fara-7b-an-efficient-agentic-model-for-computer-use/
  • Репозиторий GitHub:: https://github.com/microsoft/fara
  • Библиотека моделей HuggingFace:: https://huggingface.co/microsoft/Fara-7B
  • Технические документы:: https://www.microsoft.com/en-us/research/wp-content/uploads/2025/11/Fara-7B-An-Efficient-Agentic-Model-for-Computer-Use.pdf

Люди, для которых предназначена Fara-7B

  • Разработчики и исследователи: Открытый исходный код Fara-7B является идеальным инструментом для разработчиков и исследователей, позволяющим использовать его мощные возможности для вторичной разработки, оптимизации моделей и алгоритмических исследований.
  • автоматизированный менеджер задач: Для пользователей, которым необходимо выполнять сложные автоматизированные задачи на компьютере, такие как ввод данных и автоматизация веб-страниц, Fara-7B обеспечивает эффективную работу с визуальным приводом.
  • Потребности в конфиденциальности и безопасности: Пользователям, которые беспокоятся о конфиденциальности и безопасности данных, будет полезно использовать локально управляемую среду Fara-7B, предназначенную для обеспечения безопасности конфиденциальной информации.
  • Пользователи с высокими требованиями к производительности: В сценариях, где требуется быстрый отклик и низкая задержка, таких как веб-взаимодействие в реальном времени и автоматизированное тестирование, высокопроизводительная производительность Fara-7B способна удовлетворить спрос.
  • Для исследователей новых технологий: Пользователи, заинтересованные в новейших технологиях искусственного интеллекта, могут изучить сочетание компьютерного зрения и обработки естественного языка и его потенциал для применения в реальном мире с помощью Fara-7B.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...