Inteligência de automação de desktop

Total de 44 artigos
Suna:集成浏览器操作与数据分析的智能代理

Suna: agentes inteligentes que integram operações de navegador e análise de dados

Introdução geral O Suna é um agente de IA de uso geral de código aberto desenvolvido pela Kortix AI, hospedado no GitHub, com base na licença Apache 2.0, permitindo que os usuários façam download, modifiquem e hospedem o agente gratuitamente. Ele usa o diálogo em linguagem natural para ajudar os usuários com...
4 meses atrás
01.5K
Strawberry:自动化任务的AI智能浏览器

Strawberry: um navegador inteligente com IA para tarefas automatizadas

Descrição geral O Strawberry é um navegador inteligente com um assistente de IA integrado, projetado para ajudar os usuários a automatizar suas tarefas diárias e aumentar a eficiência. Ele se diferencia dos navegadores tradicionais por integrar a tecnologia de IA que entende o conteúdo da Web em tempo real e executa tarefas complexas, como pesquisa rápida, redação de conteúdo...
4 meses atrás
01K
Fellou:自动化执行任务的原生AI浏览器

Fellou: um navegador de IA nativo para automatizar tarefas

O Fellou é o primeiro navegador orientado à ação habilitado para IA do mundo, da Fellou AI. O Fellou é o primeiro navegador da Web habilitado para IA do mundo, que não apenas fornece a funcionalidade de navegação na Web de um navegador tradicional, mas também automatiza tarefas e permite a pesquisa profunda de informações por meio da tecnologia de IA....
4 meses atrás
01.1K
DroidRun:AI自动操作安卓手机的开源工具

DroidRun: uma ferramenta de código aberto para IA para automatizar telefones Android

Introdução geral O DroidRun é uma ferramenta de código aberto que permite que a IA opere um telefone Android como um ser humano. Ele ajuda a IA a automatizar tarefas como abrir aplicativos, enviar mensagens ou navegar na Web extraindo elementos interativos, como botões na tela, caixas de entrada etc. O DroidRun combina...
4 meses atrás
01.1K
Agent S:像人类一样操作电脑的开源智能体框架

Agente S: uma estrutura de código aberto para que corpos inteligentes operem computadores como seres humanos

Introdução geral O Agent S é uma estrutura de código aberto desenvolvida pela Simular AI que permite que inteligências operem computadores como seres humanos por meio de uma interface gráfica do usuário (GUI). Ele usa um modelo multimodal de linguagem ampla e técnicas de aprendizado empírico para executar tarefas como navegar na Web, editar documentos, usar software...
4 meses atrás
01.1K
Libra:用对话生成本地AI智能体的客户端(内测)

Libra: um cliente para gerar inteligências de IA locais com diálogo (teste interno)

Introdução geral O Libra é uma ferramenta inovadora da Greenbit.ai cuja função principal é gerar inteligências de IA que são executadas localmente por meio do diálogo em linguagem natural. Chamado de "Vibe Agent", ele permite que os usuários descrevam suas necessidades em termos simples e criem rapidamente...
4 meses atrás
01K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: um projeto de código aberto para treinar a IA para realizar ações na Web com demonstrações humanas

Introdução geral O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto contém três bibliotecas de código: Compute...
4 meses atrás
01.3K
RunRabbit:使用语音和文字操作智能体完成电脑操作

RunRabbit: usando voz e texto para operar a Intelligentsia para concluir operações de computador

Introdução geral O RunRabbit é uma ferramenta baseada em inteligência artificial que permite que os usuários controlem seu navegador para executar várias tarefas por meio de comandos simples de voz ou texto. Sua melhor característica é que ele entende as necessidades do usuário e, em seguida, manipula automaticamente as páginas da Web, como a busca de informações, o preenchimento de formulários ou a execução de tarefas repetitivas...
4 meses atrás
0996
Agent TARS:使用视觉和命令操作电脑的开源智能体

Agente TARS: uma inteligência de código aberto que usa visão e comandos para operar computadores

Introdução abrangente O agente TARS é uma inteligência de IA multimodal de código aberto da ByteDance, com recursos principais que ajudam os usuários a realizar tarefas complexas no computador, compreendendo visualmente o conteúdo da Web e combinando operações de linha de comando e sistema de arquivos. Em vez de exigir operações manuais como as ferramentas tradicionais, ele pode se...
5 meses atrás
01.3K
Playwright MCP:微软推出的浏览器自动化MCP服务

Playwright MCP: Serviço MCP de automação do navegador da Microsoft

Introdução geral O Playwright MCP é uma ferramenta de código aberto desenvolvida pela Microsoft e hospedada no GitHub. Ela permite que os modelos de inteligência artificial controlem diretamente os navegadores por meio do protocolo MCP (Model Context Protocol), completo com abertura...
5 meses atrás
01.7K
Airtop:使用自然语言控制的浏览器自动化工具

Airtop: uma ferramenta de automação de navegador que usa controles de linguagem natural

Introdução geral O Airtop é uma ferramenta de automação de navegador baseada em IA. Ele permite que os usuários controlem os navegadores em nuvem para realizar operações complexas na Web, como fazer login em um site, rastrear dados ou executar tarefas de automação por meio de comandos simples de linguagem natural. Ele resolve o problema de escrever scripts tradicionais que são complexos e capacit...
5 meses atrás
01.2K
BrowserAgent:在浏览器中创建和运行AI工作流的工具

BrowserAgent: uma ferramenta para criar e executar fluxos de trabalho de IA no navegador

Introdução geral O BrowserAgent é uma ferramenta que cria e executa fluxos de trabalho de IA diretamente no navegador. É fácil de usar e não requer a criação de código; o usuário simplesmente descreve o fluxo de trabalho desejado e a IA é gerada automaticamente. Seu principal recurso é totalmente privado, todos os dados estão em seu navegador...
5 meses atrás
01.2K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate: uma ferramenta nativa que combina IA e RPA para automatizar tarefas de computador

Introdução abrangente O autoMate é uma ferramenta de automação local desenvolvida por yuruotong1 de código aberto no GitHub, com AI+RPA (Artificial Intelligence+Robotic Process Automation) como seu principal recurso. Ele combina a compreensão inteligente de modelos de linguagem em grande escala com a RPA...
5 meses atrás
01.4K
Convergence:在代理浏览器中自动完成重复任务的AI助手

Convergência: um assistente de IA que automatiza tarefas repetitivas em um navegador de agentes

Introdução geral A Convergence é uma empresa dedicada a ajudar as pessoas a recuperar o controle de seu tempo usando tecnologias de aprendizado de máquina. Ao desenvolver modelos de meta-aprendizagem em larga escala (LMLMs), os agentes de IA da Convergence (agentes de navegação) são capazes de adquirir novas habilidades em tempo real usando...
2 meses atrás
01.7K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: a inteligência de IA que automatiza as ações do desktop em dispositivos macOS

Introdução geral O mac assistant é um projeto de corpo de inteligência de IA desenvolvido para o macOS, com o objetivo de simplificar as operações do usuário combinando software nativo e recursos da Web. Atualmente, o projeto oferece suporte às APIs OpenAI e GEMINI, e planeja oferecer suporte a futuras ...
6 meses atrás
01.6K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboração multiagente para assistente de operação de dispositivos móveis

Introdução geral O MobileAgent é um poderoso assistente de operação de dispositivos móveis projetado para melhorar a eficiência e a automação da operação de dispositivos móveis por meio da colaboração de vários agentes e de módulos de percepção visual aprimorados. Ele foi desenvolvido pela equipe do X-PLUG e é compatível com Android e ...
7 meses atrás
02K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela em tempo real e forneçam...
7 meses atrás
01.4K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicativo da Intelligentsia para controle de computadores usando linguagem natural

Introdução geral O UI-TARS Desktop é um aplicativo de agente de interface gráfica baseado no UI-TARS (Visual Language Model) desenvolvido pela ByteDance. O aplicativo permite que os usuários controlem computadores por meio de linguagem natural para uma interação homem-computador mais intuitiva e eficiente.
7 meses atrás
02.1K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: uma ferramenta de teste automatizado de IA que usa linguagem natural para testes de ponta a ponta

Introdução geral O Shortest é uma estrutura de teste de ponta a ponta em linguagem natural alimentada por IA, desenvolvida pela equipe do Anti-Work. Ele foi desenvolvido com base no Playwright e oferece suporte à integração com o GitHub e à autenticação de dois fatores (2FA).
7 meses atrás
01.9K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: um plug-in de código aberto que impulsiona os testes de automação do navegador com IA

Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA que controla páginas da Web, executa asserções e extrai dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando a medição da IU...
7 meses atrás
01.9K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: Fluxos de trabalho corporais inteligentes de criação de linguagem natural para automação de desktops e navegadores

Introdução geral A Eko é uma estrutura JavaScript de nível de produção projetada para criar fluxos de trabalho eficientes de agentes inteligentes por meio de descrições de linguagem natural. Ele foi projetado para permitir que os desenvolvedores automatizem tarefas cotidianas usando tecnologias de IA sem programação profunda.
5 meses atrás
01.8K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: geração de código de automação do navegador para transformar ações do mouse em scripts Selenium Python via IA

Introdução geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as...
7 meses atrás
01.4K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: uma estrutura de código aberto para executar inteligências de IA para navegar na Web, permitindo que a IA manipule automaticamente as páginas da Web

Introdução geral A interface do usuário da Web do Browser Use é um projeto inovador de código aberto que se concentra em fornecer aos agentes de IA recursos de interação com o navegador como uma ferramenta de interface gráfica. O projeto foi desenvolvido com base na estrutura principal do Browser Use, desenvolvida com o Gradio ...
2 meses atrás
02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: Projeto de código aberto que permite que a IA assuma a operação remota de computadores e os controle usando linguagem natural

Introdução geral O NeoAI é uma ferramenta inovadora de assistente de IA de código aberto que permite aos usuários controlar e gerenciar facilmente seus computadores por meio de diálogo em linguagem natural. Sem escrever nenhum código, os usuários podem encontrar arquivos, automatizar tarefas, gerenciar dispositivos e muito mais com apenas um diálogo diário.
7 meses atrás
02.5K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: modelo de linguagem visual inteligente de código aberto da Smart Spectrum para automação de interfaces gráficas

Introdução abrangente O CogAgent é um modelo de linguagem visual de código aberto desenvolvido pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM), com o objetivo de automatizar a operação da Interface Gráfica do Usuário (GUI) em várias plataformas. O modelo é baseado no CogVLM (GLM-4V-9B) e oferece suporte a idiomas bilíngues chinês e inglês...
8 meses atrás
01.8K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: habilite qualquer LLM para automatizar as operações do Android e do PC

Introdução geral O ClickClickClick é uma estrutura desenvolvida pelo BandarLabs que visa automatizar as operações do Android e do PC usando qualquer modelo de linguagem grande (LLM) local ou remoto. Atualmente, o projeto está em uma fase altamente experimental e oferece suporte a uma variedade de modelos, como...
8 meses atrás
01.6K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use: criação de ferramentas inteligentes de automação da Web para que os inteligentes de IA operem facilmente os navegadores

Introdução abrangente O Browser-Use é uma ferramenta inovadora de automação da Web de código aberto, projetada especificamente para permitir que os modelos de linguagem (LLMs) interajam naturalmente com os sites. Ele oferece uma estrutura avançada e flexível que suporta uma ampla variedade de modelos de linguagem convencionais, incluindo GPT-4, Claud...
8 meses atrás
02.7K
Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)

Projeto Mariner: automação do navegador, um protótipo de pesquisa que explora o futuro da interação humano-computador (não publicado)

Introdução geral O Projeto Mariner é um protótipo de pesquisa lançado pelo Google DeepMind para explorar o futuro da interação humano-computador. O projeto aproveita os poderosos recursos multimodais de compreensão e raciocínio do Gemini 2.0 por meio de um navegador autônomo...
7 meses atrás
01.6K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)

Dia Browser: fornece uma experiência de navegação inteligente com ferramentas de IA integradas para automatizar tarefas no navegador (ainda não está disponível)

Descrição geral O Dia Browser é um novo navegador inteligente desenvolvido pela The Browser Company com o objetivo de proporcionar aos usuários uma experiência de navegação mais eficiente por meio da integração de ferramentas avançadas de IA. Espera-se que o navegador seja lançado oficialmente no início de 2025, com os principais recursos...
8 meses atrás
01.9K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: automatizando a inteligência de manipulação da área de trabalho com a biblioteca PyAutoGUI

Introdução geral O Clevrr Computer é um projeto de código aberto que visa automatizar as operações do sistema por meio do uso da biblioteca PyAutoGUI. O projeto foi inspirado pelo Anthropic para projetar um agente de automação que possa executar operações com precisão e eficiência usando ...
8 meses atrás
01.5K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI

O GLM-PC (Smart Spectrum Bull) foi oficialmente lançado para download interno, a IA que pode realmente controlar o computador

GLM-PC (Bull) Introdução O GLM-PC é um aplicativo de desktop baseado no modelo CogAgent, capaz de executar tarefas complexas rapidamente por meio de comandos de linguagem natural. Ele tem a capacidade de planejar tarefas e entender a interface, e pode concluir de forma autônoma várias operações do computador de acordo com as instruções do usuário. Atenção ao uso...
8 meses atrás
02.3K
Runner H:通过自然语言命令实现网页自动化执行任务(申请内测)

Runner H: automatização de tarefas de execução de páginas da Web por meio de comandos de linguagem natural (aplicativo para testes internos)

Introdução geral A Runner H é uma empresa dedicada ao desenvolvimento de modelos de ação de ponta, projetados para aumentar a produtividade do trabalhador por meio de recursos avançados de IA. Seu principal produto, o Runner H, é um agente avançado de IA projetado para ajudar os usuários a automatizar tarefas complexas de várias etapas e reduzir a re...
8 meses atrás
01.7K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: operação automatizada de smartphones usando inteligências multimodais

Introdução abrangente O AppAgent é uma estrutura de agente multimodal baseada no Large Language Model (LLM), projetada para manipular aplicativos de smartphones. A estrutura imita as interações humanas, como toques e deslizes, por meio de um espaço de manipulação simplificado, eliminando, assim, a necessidade de acesso ao back-end do sistema, ampliando seu alcance em diferentes aplicativos...
8 meses atrás
02K
Skyvern:使用LLM和计算机视觉自动化基于浏览器工作流

Skyvern: automatizando fluxos de trabalho baseados em navegador com LLM e visão computacional

Introdução geral O Skyvern é uma ferramenta para automatizar fluxos de trabalho do navegador usando LLM (Large Language Modelling) e técnicas de visão computacional. Ele automatiza com eficiência um grande número de sites, fornecendo um ponto de extremidade de API simples que pode substituir soluções de automação que são frágeis ou não confiáveis...
5 meses atrás
02.3K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: permite que a IA controle seu computador diretamente, uma implementação de código aberto do computador de controle do Claude

Descrição geral O Agent.exe é um aplicativo Electron de código aberto que utiliza a API Sonnet Claude 3.5 da Anthropic para permitir que os usuários controlem seus computadores locais diretamente por meio de IA. O projeto foi desenvolvido por K...
8 meses atrás
02.1K