Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 44 artigos

Tags: inteligências de automação de desktop Página 2

Convergence:在代理浏览器中自动完成重复任务的AI助手-首席AI分享圈

Convergência: um assistente de IA que automatiza tarefas repetitivas em um navegador de agentes

Introdução geral A Convergence é uma empresa dedicada a ajudar as pessoas a recuperar o controle de seu tempo usando tecnologias de aprendizado de máquina. Ao desenvolver modelos de meta-aprendizagem em larga escala (LMLMs), os agentes de IA da Convergence (agentes de navegação) são capazes de adquirir novas habilidades, agir e melhorar continuamente em tempo real. Seu núcleo ...

mac assistant:macOS设备自动执行桌面操作的AI智能体-首席AI分享圈

mac assistant: a inteligência de IA que automatiza as ações do desktop em dispositivos macOS

Introdução geral O mac assistant é um projeto de inteligência de IA desenvolvido especificamente para o macOS, com o objetivo de simplificar as operações do usuário combinando software nativo e recursos da Web. Atualmente, o projeto oferece suporte às APIs OpenAI e GEMINI e planeja oferecer suporte a um modelo nativo de linguagem grande executado pelo Ollama no futuro. mac_assista...

Open Operator:通过AI智能体在云浏览器中执行自动化操作-首席AI分享圈

Open Operator: execução de operações automatizadas em navegadores de nuvem com inteligência de IA

Introdução geral O Open Operator é um projeto de código aberto que visa automatizar operações no navegador por meio de inteligências de IA. Desenvolvido pela Browserbase, o projeto combina as tecnologias do Stagehand e da Browserbase para permitir que os usuários controlem o comportamento do navegador por meio de comandos de linguagem natural.

MobileAgent:多代理协作的移动设备操作助手-首席AI分享圈

MobileAgent: colaboração multiagente para assistente de operação de dispositivos móveis

Introdução geral O MobileAgent é um poderoso assistente de operação de dispositivos móveis projetado para melhorar a eficiência e a automação da operação de dispositivos móveis por meio da colaboração de vários agentes e de módulos de percepção visual aprimorados. Desenvolvido pela equipe do X-PLUG, ele é compatível com os sistemas Android e Harmony OS e é capaz de trabalhar em sistemas complexos...

TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体-首席AI分享圈

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela ao vivo e forneçam feedback audiovisual contínuo e manipulação...

UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用-首席AI分享圈

UI-TARS Desktop: aplicativo da Intelligentsia para controle de computadores usando linguagem natural

Introdução geral O UI-TARS Desktop é um aplicativo de agente de interface gráfica baseado no UI-TARS (Visual Language Model) desenvolvido pela ByteDance. O aplicativo permite que os usuários controlem computadores por meio de linguagem natural para uma interação homem-computador mais intuitiva e eficiente.

Shortest:AI自动化测试工具,使用自然语言进行端到端测试-首席AI分享圈

Shortest: uma ferramenta de teste automatizado de IA que usa linguagem natural para testes de ponta a ponta

Introdução geral O Shortest é uma estrutura de teste de ponta a ponta em linguagem natural alimentada por IA, desenvolvida pela equipe do Anti-Work. Ele foi desenvolvido com base no Playwright e oferece suporte à integração com o GitHub e à autenticação de dois fatores (2FA). O principal recurso do Shortest é escrever casos de teste por meio de linguagem natural e utilizar o Anthropic Cl...

Midscene.js:用AI驱动浏览器自动化测试的开源插件-首席AI分享圈

Midscene.js: um plug-in de código aberto que impulsiona os testes de automação do navegador com IA

Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA capaz de controlar páginas da Web, executar asserções e extrair dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando o processo de criação e manutenção de testes de interface do usuário. Aproveitando a grande variedade multimodal ...

Stagehand:自然语言实现浏览器自动化操作框架-首席AI分享圈

Stagehand: uma estrutura para implementação de linguagem natural de operações de automação do navegador

Introdução geral O Stagehand é uma estrutura de navegação na Web de IA focada na simplicidade e na extensibilidade. É totalmente compatível com o Playwright, fornecendo três APIs de IA simples (act, extract e observe) que são construídas sobre as classes de página do Playwright subjacentes para a Web por meio de linguagem natural...

Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化-首席AI分享圈

Eko: Fluxos de trabalho corporais inteligentes de criação de linguagem natural para automação de desktops e navegadores

Introdução geral A Eko é uma estrutura JavaScript de nível de produção projetada para criar fluxos de trabalho eficientes de agentes inteligentes por meio de descrições de linguagem natural. Ele foi projetado para permitir que os desenvolvedores automatizem tarefas cotidianas usando tecnologias de IA sem programação profunda.

AutoMouser: geração de código de automação do navegador para transformar ações do mouse em scripts Selenium Python via IA

Descrição geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as em scripts Python Selenium robustos e fáceis de manter,...

Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架-首席AI分享圈

Browser Use Web UI: uma estrutura de código aberto para executar inteligências de IA para navegar na Web, permitindo que a IA manipule automaticamente as páginas da Web

Introdução geral O Browser Use Web UI é um projeto inovador de código aberto focado em fornecer aos agentes de IA uma ferramenta de interface gráfica para recursos de interação com o navegador. O projeto foi desenvolvido com base na estrutura principal do Browser Use, por meio do Gradio, para criar uma interface da Web fácil de usar, facilitando a interação dos agentes de IA...

E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统-首席AI分享圈

E2B Open Computer Use: Executando um sistema operacional de IA com segurança na área restrita da E2B

Introdução geral O E2B Open Computer Use é um projeto de código aberto que tem como objetivo fornecer uma experiência segura de uso de computador Linux baseado em nuvem por meio do E2B Desktop Sandbox. O E2B Sandbox fornece um ambiente gráfico de desktop que os usuários podem conectar a qualquer Modelo de Linguagem Grande (LLM) para controlar computadores, suportando...

NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目-首席AI分享圈

NeoAI: Projeto de código aberto que permite que a IA assuma a operação remota de computadores e os controle usando linguagem natural

Introdução geral O NeoAI é uma ferramenta inovadora de assistente de IA de código aberto que permite aos usuários controlar e gerenciar facilmente seus computadores por meio de diálogo em linguagem natural. Sem escrever nenhum código, os usuários podem simplesmente usar o diálogo diário para localizar arquivos, automatizar tarefas, gerenciar dispositivos etc. O NeoAI é compatível com o Windows...

CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作-首席AI分享圈

CogAgent: modelo de linguagem visual inteligente de código aberto da Smart Spectrum para automação de interfaces gráficas

Introdução abrangente O CogAgent é um modelo de linguagem visual de código aberto desenvolvido pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM), com o objetivo de automatizar a operação de interfaces gráficas de usuário (GUIs) entre plataformas. O modelo é baseado no CogVLM (GLM-4V-9B), oferece suporte a interações bilíngues em inglês e chinês e é capaz de ...

ClickClickClick:启用任何LLM实现自动化安卓和电脑操作-首席AI分享圈

ClickClickClickClick: habilite qualquer LLM para automatizar as operações do Android e do PC

Introdução geral O ClickClickClick é uma estrutura desenvolvida pelo BandarLabs que visa automatizar as operações do Android e do PC usando qualquer modelo de linguagem grande (LLM) local ou remoto. No momento, o projeto está em uma fase altamente experimental e oferece suporte a vários modelos, como Ollama, Gemini e GPT 4o. usando...

Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器-首席AI分享圈

Browser-Use: criação de ferramentas inteligentes de automação da Web para que os inteligentes de IA operem facilmente os navegadores

Introdução abrangente O Browser-Use é uma ferramenta inovadora de automação da Web de código aberto, projetada especificamente para permitir que os modelos de linguagem (LLMs) interajam naturalmente com os sites. Ele oferece uma estrutura avançada e flexível que suporta uma ampla variedade de modelos de linguagem convencionais, incluindo GPT-4, Claude e outros. O recurso mais notável da ferramenta...

Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)-首席AI分享圈

Projeto Mariner: automação do navegador, um protótipo de pesquisa que explora o futuro da interação humano-computador (não publicado)

Introdução geral O Project Mariner é um protótipo de pesquisa lançado pelo Google DeepMind para explorar o futuro da interação humano-computador. O projeto aproveita os poderosos recursos multimodais de compreensão e raciocínio do Gemini 2.0 para executar uma variedade de tarefas por meio da automação do navegador.

Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)-首席AI分享圈

Dia Browser: fornece uma experiência de navegação inteligente com ferramentas de IA integradas para automatizar tarefas no navegador (ainda não está disponível)

Descrição geral O Dia Browser é um novo navegador inteligente desenvolvido pela The Browser Company com o objetivo de proporcionar aos usuários uma experiência de navegação mais eficiente por meio da integração de ferramentas avançadas de IA. Espera-se que o navegador seja lançado oficialmente no início de 2025, com os principais recursos incluindo assistência inteligente à escrita, processamento automatizado de tarefas e...

pt_BRPortuguês do Brasil