Inteligencia en automatización de escritorios

Total 44 artículos
Suna:集成浏览器操作与数据分析的智能代理

Suna: agentes inteligentes que integran operaciones de navegación y análisis de datos

Introducción general Suna es un agente de IA de propósito general de código abierto desarrollado por Kortix AI, alojado en GitHub, basado en la licencia Apache 2.0, que permite a los usuarios descargarlo, modificarlo y autoalojarlo gratuitamente. Utiliza el diálogo en lenguaje natural para ayudar a los usuarios con...
hace 4 meses
01.5K
Strawberry:自动化任务的AI智能浏览器

Strawberry: un navegador inteligente con inteligencia artificial para tareas automatizadas

Descripción general Strawberry es un navegador inteligente con un asistente de IA integrado diseñado para ayudar a los usuarios a automatizar sus tareas diarias y mejorar la eficiencia. Se diferencia de los navegadores tradicionales por integrar tecnología de IA que entiende el contenido web en tiempo real y realiza tareas complejas como la investigación rápida, la redacción de contenidos...
hace 4 meses
01K
Fellou:自动化执行任务的原生AI浏览器

Fellou: un navegador nativo de IA para automatizar tareas

Fellou es el primer navegador del mundo orientado a la acción con IA de Fellou AI. Fellou es el primer navegador web habilitado para IA del mundo, que no solo ofrece la funcionalidad de navegación web de un navegador tradicional, sino que también automatiza tareas y permite la búsqueda profunda de información a través de la tecnología de IA.....
hace 4 meses
01.1K
DroidRun:AI自动操作安卓手机的开源工具

DroidRun: una herramienta de código abierto para que la IA automatice los teléfonos Android

Introducción general DroidRun es una herramienta de código abierto que permite a la IA manejar un teléfono Android como un humano. Ayuda a la IA a automatizar tareas como abrir aplicaciones, enviar mensajes o navegar por Internet extrayendo elementos interactivos como botones en pantalla, cuadros de entrada, etc. DroidRun combina...
hace 4 meses
01.1K
Agent S:像人类一样操作电脑的开源智能体框架

Agente S: un marco de código abierto para que los cuerpos inteligentes manejen los ordenadores como humanos

Introducción general Agent S es un marco de código abierto desarrollado por Simular AI que permite a las inteligencias manejar ordenadores como si fueran humanos a través de una interfaz gráfica de usuario (GUI). Utiliza un gran modelo de lenguaje multimodal y técnicas de aprendizaje empírico para realizar tareas como navegar por la web, editar documentos, utilizar software...
hace 4 meses
01.1K
Libra:用对话生成本地AI智能体的客户端(内测)

Libra: un cliente para generar inteligencias IA locales con diálogo (prueba interna)

Introducción general Libra es una innovadora herramienta de Greenbit.ai cuya función principal es generar inteligencias IA que se ejecutan localmente a través del diálogo en lenguaje natural. Denominada "Vibe Agent", permite a los usuarios describir sus necesidades en términos sencillos y crear rápidamente...
hace 4 meses
01K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: un proyecto de código abierto para entrenar a la IA a realizar acciones web con demostraciones humanas

Introducción general Optexity es un proyecto de código abierto en GitHub, desarrollado por el equipo de Optexity. Su núcleo es utilizar datos de demostración humana para entrenar a la IA a completar tareas informáticas, especialmente operaciones de páginas web. El proyecto contiene tres bibliotecas de código: Compute...
hace 4 meses
01.3K
RunRabbit:使用语音和文字操作智能体完成电脑操作

RunRabbit: uso de voz y texto para realizar operaciones informáticas inteligentes

Introducción general RunRabbit es una herramienta basada en inteligencia artificial que permite a los usuarios controlar su navegador para realizar diversas tareas mediante sencillos comandos de voz o texto. Su mejor característica es que entiende las necesidades del usuario y luego manipula automáticamente las páginas web, como buscar información, rellenar formularios o realizar tareas repetitivas....
hace 4 meses
0996
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA: Inteligencia Artificial basada en LangGraph para controlar operaciones informáticas

LangGraph CUA es un proyecto de código abierto desarrollado por el equipo de LangChain. Se basa en el marco LangGraph, lo que permite a los desarrolladores utilizar Python para construir inteligencias AI que pueden operar directamente el ordenador. El núcleo de esta herramienta ...
hace 5 meses
01.4K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Agente TARS: una inteligencia de código abierto que utiliza la visión y los comandos para manejar ordenadores

El agente de introducción integral TARS es una inteligencia artificial multimodal de código abierto de ByteDance, con características básicas que ayudan a los usuarios a completar tareas informáticas complejas mediante la comprensión visual del contenido web y la combinación de operaciones de línea de comandos y del sistema de archivos. En lugar de requerir operaciones manuales como las herramientas tradicionales, puede auto...
hace 5 meses
01.3K
Airtop:使用自然语言控制的浏览器自动化工具

Airtop: una herramienta de automatización del navegador mediante controles de lenguaje natural

Introducción general Airtop es una herramienta de automatización de navegadores basada en IA. Permite a los usuarios controlar navegadores en la nube para realizar operaciones web complejas como iniciar sesión en un sitio web, rastrear datos o realizar tareas de automatización mediante sencillos comandos de lenguaje natural. Resuelve el problema de escribir scripts tradicionales que son complejos y capacit...
hace 5 meses
01.2K
BrowserAgent:在浏览器中创建和运行AI工作流的工具

BrowserAgent: una herramienta para crear y ejecutar flujos de trabajo de IA en el navegador.

Introducción general BrowserAgent es una herramienta que crea y ejecuta flujos de trabajo de IA directamente en el navegador. Es fácil de usar y no requiere escribir código, el usuario simplemente describe el flujo de trabajo deseado y la IA se genera automáticamente. Su característica principal es completamente privada, todos los datos están en el navegador...
hace 5 meses
01.2K
Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手

Highlight AI: un asistente de inteligencia artificial que utiliza la voz y el análisis de pantalla para realizar tareas de escritorio.

Introducción general Highlight AI es un asistente de IA de escritorio para Windows y macOS (versión móvil en desarrollo) que ayuda a los usuarios a completar rápidamente tareas en cualquier aplicación a través de comandos de voz y análisis de contenido de pantalla. Captura el contenido de la pantalla, genera...
hace 2 meses
01.2K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate: una herramienta nativa que combina IA y RPA para automatizar tareas informáticas

Introducción completa autoMate es una herramienta de automatización local desarrollada por yuruotong1 de código abierto en GitHub, con AI + RPA (Inteligencia Artificial + Automatización Robótica de Procesos) como su característica principal. Combina la comprensión inteligente de modelos lingüísticos a gran escala con RPA....
hace 5 meses
01.4K
Convergence:在代理浏览器中自动完成重复任务的AI助手

Convergencia: un asistente de IA que automatiza tareas repetitivas en un navegador de agentes

Introducción general Convergence es una empresa dedicada a ayudar a las personas a recuperar el control de su tiempo utilizando tecnologías de aprendizaje automático. Mediante el desarrollo de modelos de metaaprendizaje a gran escala (LMLM), los agentes de IA de Convergence (agentes navegadores) son capaces de adquirir nuevas habilidades en tiempo real utilizando...
hace 2 meses
01.7K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: la inteligencia artificial que automatiza las acciones del escritorio en dispositivos macOS

Introducción general mac assistant es un proyecto de cuerpo de inteligencia AI diseñado para macOS, con el objetivo de simplificar las operaciones del usuario mediante la combinación de software nativo y funciones web. Actualmente, el proyecto es compatible con las API OpenAI y GEMINI, y tiene previsto ...
hace 6 meses
01.6K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboración multiagente para el asistente de explotación de dispositivos móviles

Introducción general MobileAgent es un potente asistente de operación de dispositivos móviles diseñado para mejorar la eficiencia y la automatización de la operación de dispositivos móviles a través de la colaboración multi-agente y módulos de percepción visual mejorada. Está desarrollado por el equipo de X-PLUG y es compatible con Android y ...
hace 7 meses
02K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: un cuerpo inteligente que maneja ordenadores mediante voz y texto y proporciona información de voz en tiempo real.

Introducción general TankWork es un marco de agentes de escritorio de código abierto diseñado para permitir que la IA perciba y controle su ordenador a través de la visión por ordenador y la interacción a nivel de sistema. El marco permite a los agentes controlar directamente los ordenadores mediante comandos de voz y texto, procesar el contenido de la pantalla en tiempo real y proporcionar...
hace 7 meses
01.4K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicación de escritorio de Intelligentsia para controlar ordenadores mediante lenguaje natural

Introducción general UI-TARS Desktop es una aplicación de agente de interfaz gráfica basada en UI-TARS (Visual Language Model) desarrollada por ByteDance. La aplicación permite a los usuarios controlar los ordenadores a través del lenguaje natural para una interacción humano-ordenador más intuitiva y eficiente.UI-TAR...
hace 7 meses
02.1K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: una herramienta de pruebas automatizadas con IA que utiliza el lenguaje natural para realizar pruebas de principio a fin

Introducción general Shortest es un marco de pruebas de extremo a extremo en lenguaje natural basado en IA desarrollado por el equipo Anti-Work. Se basa en Playwright y admite la integración con GitHub y la autenticación de dos factores (2FA)....
hace 7 meses
01.9K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: un complemento de código abierto que impulsa las pruebas de automatización del navegador con IA

Introducción general Midscene.js es una herramienta de automatización del navegador impulsada por IA que controla páginas web, realiza aserciones y extrae datos a través de comandos de lenguaje natural. Es compatible con extensiones de Chrome, SDK de JavaScript y scripts YAML, lo que simplifica la medición de la IU....
hace 7 meses
01.9K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: flujos de trabajo corporales inteligentes basados en lenguaje natural para la automatización de escritorios y navegadores

Introducción general Eko es un marco JavaScript de nivel de producción diseñado para construir flujos de trabajo de agentes inteligentes eficientes mediante descripciones en lenguaje natural. Está diseñado para permitir a los desarrolladores automatizar tareas cotidianas utilizando tecnologías de IA sin necesidad de programac...
hace 5 meses
01.8K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: Generación de código de automatización del navegador para convertir acciones del ratón en scripts Selenium Python mediante IA

Introducción general AutoMouser es una extensión de Chrome que rastrea de forma inteligente las interacciones del usuario y genera automáticamente código de prueba Selenium utilizando los modelos GPT de OpenAI. Para ello, registra las acciones del navegador del usuario y las convierte...
hace 7 meses
01.4K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: un marco de código abierto para ejecutar inteligencias IA para navegar por la web, permitiendo a la IA manipular automáticamente las páginas web.

Introducción general Browser Use Web UI es un innovador proyecto de código abierto centrado en proporcionar a los agentes de IA capacidades de interacción con el navegador como herramienta de interfaz gráfica. El proyecto está construido sobre el núcleo del framework browser-use, construido con Gradio ...
hace 2 meses
02.7K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

Uso de ordenadores abiertos E2B: ejecución segura de un sistema operativo de inteligencia artificial en el espacio aislado E2B

Introducción general E2B Open Computer Use es un proyecto de código abierto cuyo objetivo es proporcionar una experiencia segura de uso de ordenadores Linux basada en la nube a través de E2B Desktop Sandbox.E2B Sandbox proporciona un entorno gráfico de escritorio que los usuarios...
hace 7 meses
01.4K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: proyecto de código abierto que permite a la IA manejar ordenadores a distancia y controlarlos mediante lenguaje natural

Introducción general NeoAI es una innovadora herramienta de código abierto AI asistente que permite a los usuarios controlar y gestionar fácilmente sus ordenadores a través del diálogo en lenguaje natural. Sin escribir ningún código, los usuarios pueden hacer la búsqueda de archivos, automatización de tareas, gestión de dispositivos y mucho más con sólo el diálogo diario.NeoAI...
hace 7 meses
02.5K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: modelo de lenguaje visual inteligente de código abierto de Smart Spectrum para la automatización de interfaces gráficas

Introducción CogAgent es un modelo de lenguaje visual de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), cuyo objetivo es automatizar el funcionamiento de la interfaz gráfica de usuario (GUI) en todas las plataformas. El modelo se basa en CogVLM (GLM-4V-9B) y es compatible con el chino y el inglés bilingües....
hace 8 meses
01.8K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: Habilita cualquier LLM para automatizar operaciones en Android y PC.

Introducción general ClickClickClick es un framework desarrollado por BandarLabs que pretende automatizar operaciones en Android y PC utilizando cualquier Large Language Model (LLM) local o remoto. El proyecto se encuentra actualmente en una fase altamente experimental y soporta una variedad de modelos como...
hace 8 meses
01.6K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use: creación de herramientas inteligentes de automatización web para que las inteligencias artificiales manejen fácilmente los navegadores

Introducción exhaustiva Browser-Use es una innovadora herramienta de automatización web de código abierto diseñada específicamente para permitir que los modelos lingüísticos (LLM) interactúen de forma natural con los sitios web. Proporciona un marco potente y flexible que admite una amplia gama de modelos lingüísticos convencionales, como GPT-4, Claud...
hace 8 meses
02.7K
Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)

Proyecto Mariner: automatización del navegador, un prototipo de investigación que explora el futuro de la interacción persona-ordenador (inédito)

Introducción general El proyecto Mariner es un prototipo de investigación puesto en marcha por Google DeepMind para explorar el futuro de la interacción persona-ordenador. El proyecto aprovecha las potentes capacidades de comprensión y razonamiento multimodal de Gemini 2.0 a través de un navegador auto...
hace 7 meses
01.6K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)

Navegador Dia: ofrece una experiencia de navegación inteligente con herramientas de inteligencia artificial integradas para automatizar tareas en el navegador (aún no está disponible).

Descripción general Dia Browser es un nuevo navegador inteligente desarrollado por The Browser Company que tiene como objetivo proporcionar a los usuarios una experiencia de navegación más eficiente mediante la integración de herramientas avanzadas de IA. Se espera que el navegador se lance oficialmente a principios de 2025, con características clave...
hace 8 meses
01.9K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: Automatización de la inteligencia de manipulación del escritorio con la biblioteca PyAutoGUI

Introducción General Clevrr Computer es un proyecto de código abierto que tiene como objetivo automatizar las operaciones del sistema mediante el uso de la biblioteca PyAutoGUI. El proyecto se inspiró en Anthropic para diseñar un agente de automatización que pueda realizar operaciones de forma precisa y eficiente utilizando ...
hace 8 meses
01.5K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI

GLM-PC (Smart Spectrum Bull) se lanza oficialmente para descarga interna, la IA que realmente puede controlar el ordenador

GLM-PC (Bull) Introducción GLM-PC es una aplicación de escritorio basada en el modelo CogAgent, capaz de realizar rápidamente tareas complejas mediante comandos de lenguaje natural. Tiene capacidad de planificación de tareas y comprensión de interfaces, y puede completar de forma autónoma diversas operaciones informáticas siguiendo las instrucciones del usuario. Notas de uso...
hace 8 meses
02.3K
Runner H:通过自然语言命令实现网页自动化执行任务(申请内测)

Runner H: automatización de tareas de ejecución de páginas web mediante comandos de lenguaje natural (aplicación para pruebas internas)

Introducción general Runner H es una empresa dedicada al desarrollo de modelos de acción de vanguardia diseñados para mejorar la productividad de los trabajadores mediante capacidades avanzadas de IA. Su producto estrella, Runner H, es un agente de IA avanzado diseñado para ayudar a los usuarios a automatizar tareas complejas de varios pasos y reducir re...
hace 8 meses
01.7K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: manejo automatizado de smartphones mediante inteligencias multimodales

Introducción AppAgent es un marco de agente multimodal basado en un modelo de lenguaje amplio (LLM) diseñado para manipular aplicaciones de teléfonos inteligentes. El marco imita interacciones humanas como toques y deslizamientos a través de un espacio de manipulación simplificado, eliminando así la necesidad de acceso al back-end del sistema y extendiendo su uso a través de diferentes aplicaciones....
hace 8 meses
02K
Skyvern:使用LLM和计算机视觉自动化基于浏览器工作流

Skyvern: automatización de flujos de trabajo basados en navegador con LLM y visión por ordenador

Introducción general Skyvern es una herramienta para automatizar los flujos de trabajo del navegador utilizando técnicas de Large Language Modelling (LLM) y visión por ordenador. Automatiza eficientemente un gran número de sitios web proporcionando un punto final de API simple que puede reemplazar soluciones de automatización que son frágiles o poco fiables....
hace 5 meses
02.3K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: Permite que la IA controle directamente tu ordenador, una implementación de código abierto del ordenador de control de Claude.

Introducción general Agent.exe es una aplicación Electron de código abierto que utiliza la API Sonnet Claude 3.5 de Anthropic para permitir a los usuarios controlar su ordenador local directamente a través de la IA. El proyecto fue desarrollado por K...
hace 8 meses
02.1K