Fara-7B - Modelo de asistente informático de código abierto de Microsoft
Últimos recursos sobre IAPublicado hace 3 semanas Círculo de intercambio de inteligencia artificial 14.4K 00
¿Qué es el Fara-7B?
Fara-7B es un modelo de Agente Operativo Computacional (CUA) a escala de 7.000 millones de parámetros publicado en código abierto por Microsoft, basado en la arquitectura Qwen2.5-VL-7B. Al analizar visualmente capturas de pantalla de páginas web, realiza clics, entradas y otras operaciones en la pantalla sin depender de árboles de accesibilidad adicionales ni de la colaboración de múltiples modelos de gran tamaño, y puede ejecutarse directamente en Windows 11 de forma local con soporte para aceleración NPU para una menor latencia y una mejor protección de la privacidad.Fara-7B ha demostrado en pruebas de referencia públicas como WebVoyager, Online-Mind2Web y otras Excelente rendimiento con una alta tasa de éxito en las tareas y aventajando a los modelos pares en algunas tareas. Adopta un nuevo proceso de generación de datos sintéticos para el entrenamiento, que contiene una gran cantidad de trayectorias de tareas y datos de tareas auxiliares, centrándose en el ajuste fino supervisado.

Características funcionales de Fara-7B
- funcionamiento basado en la visión: Realiza clics, tecleos, desplazamientos, etc. directamente en la pantalla mediante el análisis visual de capturas de pantalla de páginas web, sin depender de árboles de accesibilidad adicionales ni de la colaboración de múltiples modelos de gran tamaño.
- Funcionamiento local y protección de la intimidadFunciona de forma nativa en Windows 11 y admite aceleración NPU para una baja latencia y una mejor protección de la privacidad.
- Mecanismos de seguridad bien establecidos:: Se detiene en los "puntos críticos" para pedir el consentimiento del usuario para operaciones sensibles, todas las operaciones se registran, deben ejecutarse en un entorno sandbox y en la formación se incluyen ejemplos de rechazo a realizar tareas inadecuadas.
- Alto rendimiento: Excelente rendimiento en pruebas de referencia públicas como WebVoyager, Online-Mind2Web, etc., con un alto índice de éxito en las tareas y algunas tareas por delante de modelos similares.
- Código abierto y facilidad de usoPublicado y de código abierto bajo la licencia MIT en Microsoft Foundry y Hugging Face, e integrado en el prototipo de investigación Magentic-UI, proporcionando versiones cuantificadas y optimizadas para facilitar su uso y desarrollo.
Puntos fuertes de Fara-7B
- Manipulación directa y basada en la visión: Fara-7B realiza operaciones directamente en la pantalla mediante el análisis visual de capturas de pantalla de páginas web, eliminando la necesidad de recurrir a complejos árboles de accesibilidad o a la colaboración de varios modelos, lo que hace que las operaciones sean más intuitivas y eficaces.
- Funcionamiento local y protección de la intimidad: Admite la ejecución nativa en Windows 11, combinada con la aceleración NPU para una respuesta de baja latencia al tiempo que se garantiza la privacidad de los datos del usuario.
- Mecanismos de seguridad sólidosSe solicita el consentimiento del usuario para las operaciones sensibles, que se registran y ejecutan en un entorno aislado para evitar operaciones inadecuadas.
- Alto rendimiento y tasa de éxitoExcelente rendimiento en una serie de evaluaciones comparativas públicas, con elevados índices de éxito en las tareas y algunas tareas por delante de modelos similares, lo que demuestra un rendimiento sobresaliente.
Cuál es la página web oficial del Fara-7B
- Página web del proyecto:: https://www.microsoft.com/en-us/research/blog/fara-7b-an-efficient-agentic-model-for-computer-use/
- Repositorio GitHub:: https://github.com/microsoft/fara
- Biblioteca de modelos HuggingFace:: https://huggingface.co/microsoft/Fara-7B
- Documentos técnicos:: https://www.microsoft.com/en-us/research/wp-content/uploads/2025/11/Fara-7B-An-Efficient-Agentic-Model-for-Computer-Use.pdf
Personas a las que se destina Fara-7B
- Desarrolladores e investigadores: La naturaleza de código abierto de Fara-7B se convierte en una herramienta ideal para que desarrolladores e investigadores utilicen sus potentes características para el desarrollo secundario, la optimización de modelos y la investigación algorítmica.
- gestor automático de tareasFara-7B: Para los usuarios que necesitan realizar tareas de automatización complejas en un ordenador, como la introducción de datos y las operaciones de automatización de páginas web, Fara-7B permite realizar operaciones eficaces con accionamiento visual.
- Necesidades de privacidad y seguridadLos usuarios preocupados por la privacidad y la seguridad de los datos se beneficiarán del entorno local y aislado de Fara-7B, diseñado para garantizar la seguridad de la información confidencial.
- Usuarios con altos requisitos de rendimientoEn escenarios que requieren una respuesta rápida y baja latencia, como las interacciones web en tiempo real y las pruebas automatizadas, el alto rendimiento de Fara-7B es capaz de satisfacer la demanda.
- Para exploradores de nuevas tecnologíasEl Fara-7B permite a los usuarios interesados en las últimas tecnologías de IA explorar la combinación de la visión por ordenador y el procesamiento del lenguaje natural y su potencial para aplicaciones en el mundo real.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...




