Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1
Total de 39 artigos

Tags: inteligências de automação de desktop

Agent S:像人类一样操作电脑的开源智能体框架-首席AI分享圈

Agente S: uma estrutura de código aberto para que corpos inteligentes operem computadores como seres humanos

Introdução geral O Agent S é uma estrutura de código aberto desenvolvida pela Simular AI que permite que as inteligências operem computadores como seres humanos por meio de uma interface gráfica do usuário (GUI). Ele usa um modelo de macrolinguagem multimodal e técnicas de aprendizado empírico para executar tarefas como navegar na Web, editar documentos e usar software. O projeto está no GitHub...

Libra:用对话生成本地AI智能体的客户端(内测)-首席AI分享圈

Libra: um cliente para gerar inteligências de IA locais com diálogo (teste interno)

Libra é uma ferramenta inovadora da Greenbit.ai cuja função principal é gerar inteligências de IA que podem ser executadas localmente por meio do diálogo em linguagem natural. Chamado de "Vibe Agent", ele permite que os usuários descrevam suas necessidades em termos simples, criem rapidamente sua própria inteligência, realizem pesquisas na Web, dados...

Optexity:用人类演示训练AI执行网页操作的开源项目-首席AI分享圈

Optexity: um projeto de código aberto para treinar a IA para realizar ações na Web com demonstrações humanas

Introdução geral O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto contém três bibliotecas de código: ComputerGYM, AgentAI e Playwright, e os usuários podem ...

RunRabbit:使用语音和文字操作智能体完成电脑操作-首席AI分享圈

RunRabbit: usando voz e texto para operar a Intelligentsia para concluir operações de computador

Introdução geral O RunRabbit é uma ferramenta baseada em IA que permite aos usuários controlar seus navegadores para executar várias tarefas por meio de comandos simples de voz ou texto. Sua melhor característica é que ele entende as necessidades do usuário e, em seguida, manipula automaticamente as páginas da Web, como a busca de informações, o preenchimento de formulários ou a execução de tarefas repetitivas. O site ...

LangGraph CUA: inteligência de IA baseada em LangGraph para controle de operações de computador

O LangGraph CUA é um projeto de código aberto desenvolvido pela equipe do LangChain. Ele se baseia na estrutura LangGraph, permitindo que os desenvolvedores usem Python para criar inteligências de IA que possam operar computadores diretamente. O núcleo dessa ferramenta é o "Computer Use Agent" (CUA), que pode simular a inteligência humana ...

Agent TARS:使用视觉和命令操作电脑的开源智能体-首席AI分享圈

Agente TARS: uma inteligência de código aberto que usa visão e comandos para operar computadores

Introdução abrangente O agente TARS é uma inteligência de IA multimodal de código aberto da ByteDance, com recursos principais que ajudam os usuários a realizar tarefas complexas no computador, compreendendo visualmente o conteúdo da Web e combinando operações de linha de comando e de sistema de arquivos. Em vez de exigir operações manuais como as ferramentas tradicionais, ele executa automaticamente...

Playwright MCP:微软推出的浏览器自动化MCP服务-首席AI分享圈

Playwright MCP: Serviço MCP de automação do navegador da Microsoft

Introdução geral O Playwright MCP é uma ferramenta de código aberto desenvolvida pela Microsoft e hospedada no GitHub. Ela permite que modelos de inteligência artificial controlem diretamente os navegadores por meio do protocolo MCP (Model Context Protocol), executando ações como abrir páginas da Web, clicar em elementos e inserir texto. A ferramenta é baseada no Pl...

Airtop:使用自然语言控制的浏览器自动化工具-首席AI分享圈

Airtop: uma ferramenta de automação de navegador que usa controles de linguagem natural

Introdução geral O Airtop é uma ferramenta de automação de navegador baseada em IA. Ele permite que os usuários controlem navegadores em nuvem para realizar operações complexas na Web, como fazer login em sites, rastrear dados ou executar tarefas de automação por meio de comandos simples de linguagem natural. Ele resolve a complexidade de escrever scripts tradicionais e propensos a...

BrowserAgent:在浏览器中创建和运行AI工作流的工具-首席AI分享圈

BrowserAgent: uma ferramenta para criar e executar fluxos de trabalho de IA no navegador

Introdução geral O BrowserAgent é uma ferramenta que cria e executa fluxos de trabalho de IA diretamente no navegador. É fácil de usar e não requer a criação de código, tudo o que o usuário precisa fazer é descrever o fluxo de trabalho desejado e a IA é gerada automaticamente. Seu principal recurso é que ele é totalmente privado, todos os dados são processados em seu navegador, sem...

Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手-首席AI分享圈

Highlight AI: um assistente de IA que usa análise de voz e tela para concluir tarefas de desktop

Introdução geral O Highlight AI é um assistente de IA para desktop para Windows e macOS (versão móvel em desenvolvimento) que ajuda os usuários a concluir rapidamente tarefas em qualquer aplicativo por meio de comandos de voz e análise de conteúdo de tela. Ele captura o conteúdo da tela, gera código, responde a perguntas e trabalha com o GitHub...

autoMate:结合AI与RPA实现电脑任务自动化的本地工具-首席AI分享圈

autoMate: uma ferramenta nativa que combina IA e RPA para automatizar tarefas de computador

Introdução abrangente O autoMate é uma ferramenta de automação local de código aberto e desenvolvida por yuruotong1 no GitHub, com AI+RPA (Inteligência Artificial + Automação de Processos Robóticos) como seu principal recurso. Ele combina a compreensão inteligente de modelos de linguagem em larga escala com os recursos de execução de processos da RPA, os usuários só precisam usar a linguagem natural...

Nanobrowser:浏览器中实现任务自动化的多智能插件-首席AI分享圈

Nanobrowser: plug-in de inteligência múltipla para automação de tarefas em navegadores

Introdução geral O Nanobrowser é uma extensão de código aberto do Chrome projetada para automatizar tarefas da Web por meio de um sistema multiagente orientado por IA. É uma alternativa gratuita ao OpenAI Operator, que os usuários podem usar simplesmente fornecendo sua chave de API LLM (Large Language Model), com suporte a...

Proxy Lite:3B参数视觉模型驱动的网页自动化工具-首席AI分享圈

Proxy Lite: Ferramenta de automação da Web orientada por modelo visual da 3B Parametric

Introdução geral O Proxy Lite é uma ferramenta de automação da Web leve e de código aberto, desenvolvida pela Convergence AI como uma versão mini do Proxy com um design de peso aberto. Ele se baseia em um Modelo de Linguagem Visual (VLM) de 3B parâmetros e é capaz de navegação autônoma na Web e execução de tarefas, como encontrar informações ...

Convergence:在代理浏览器中自动完成重复任务的AI助手-首席AI分享圈

Convergência: um assistente de IA que automatiza tarefas repetitivas em um navegador de agentes

Introdução geral A Convergence é uma empresa dedicada a ajudar as pessoas a recuperar o controle de seu tempo usando tecnologias de aprendizado de máquina. Ao desenvolver modelos de meta-aprendizagem em larga escala (LMLMs), os agentes de IA da Convergence (agentes de navegação) são capazes de adquirir novas habilidades, agir e melhorar continuamente em tempo real. Seu núcleo ...

mac assistant:macOS设备自动执行桌面操作的AI智能体-首席AI分享圈

mac assistant: a inteligência de IA que automatiza as ações do desktop em dispositivos macOS

Introdução geral O mac assistant é um projeto de inteligência de IA desenvolvido especificamente para o macOS, com o objetivo de simplificar as operações do usuário combinando software nativo e recursos da Web. Atualmente, o projeto oferece suporte às APIs OpenAI e GEMINI e planeja oferecer suporte a um modelo nativo de linguagem grande executado pelo Ollama no futuro. mac_assista...

Open Operator:通过AI智能体在云浏览器中执行自动化操作-首席AI分享圈

Open Operator: execução de operações automatizadas em navegadores de nuvem com inteligência de IA

Introdução geral O Open Operator é um projeto de código aberto que visa automatizar operações no navegador por meio de inteligências de IA. Desenvolvido pela Browserbase, o projeto combina as tecnologias do Stagehand e da Browserbase para permitir que os usuários controlem o comportamento do navegador por meio de comandos de linguagem natural.

MobileAgent:多代理协作的移动设备操作助手-首席AI分享圈

MobileAgent: colaboração multiagente para assistente de operação de dispositivos móveis

Introdução geral O MobileAgent é um poderoso assistente de operação de dispositivos móveis projetado para melhorar a eficiência e a automação da operação de dispositivos móveis por meio da colaboração de vários agentes e de módulos de percepção visual aprimorados. Desenvolvido pela equipe do X-PLUG, ele é compatível com os sistemas Android e Harmony OS e é capaz de trabalhar em sistemas complexos...

TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体-首席AI分享圈

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela ao vivo e forneçam feedback audiovisual contínuo e manipulação...

pt_BRPortuguês do Brasil