Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1
Total de 26 artigos

Tags: inteligências de automação de desktop

Proxy Lite: ferramenta de automação da Web orientada por modelo visual paramétrico 3B - Chief AI Sharing Circle

Proxy Lite: Ferramenta de automação da Web orientada por modelo visual da 3B Parametric

Introdução geral O Proxy Lite é uma ferramenta de automação da Web leve e de código aberto, desenvolvida pela Convergence AI como uma versão mini do Proxy com um design de peso aberto. Ele se baseia em um Modelo de Linguagem Visual (VLM) de 3B parâmetros e é capaz de navegação autônoma na Web e execução de tarefas, como encontrar informações ...

Convergência: um assistente de IA que automatiza tarefas repetitivas em um navegador de agentes - Chief AI Sharing Circle

Convergência: um assistente de IA que automatiza tarefas repetitivas em um navegador de agentes

Introdução geral A Convergence é uma empresa dedicada a ajudar as pessoas a recuperar o controle de seu tempo usando tecnologias de aprendizado de máquina. Ao desenvolver modelos de meta-aprendizagem em larga escala (LMLMs), os agentes de IA da Convergence (agentes de navegação) são capazes de adquirir novas habilidades, agir e melhorar continuamente em tempo real. Seu núcleo ...

mac assistant: inteligência de IA para dispositivos macOS para automatizar operações de desktop - Chief AI Sharing Circle

mac assistant: a inteligência de IA que automatiza as ações do desktop em dispositivos macOS

Introdução geral O mac assistant é um projeto de inteligência de IA desenvolvido especificamente para o macOS, com o objetivo de simplificar as operações do usuário combinando software nativo e recursos da Web. Atualmente, o projeto oferece suporte às APIs OpenAI e GEMINI e planeja oferecer suporte a um modelo nativo de linguagem grande executado pelo Ollama no futuro. mac_assista...

Operador aberto: executando operações automatizadas em navegadores de nuvem por meio da AI Intelligentsia - Círculo de compartilhamento de IA principal

Open Operator: execução de operações automatizadas em navegadores de nuvem com inteligência de IA

Introdução geral O Open Operator é um projeto de código aberto que visa automatizar operações no navegador por meio de inteligências de IA. Desenvolvido pela Browserbase, o projeto combina as tecnologias do Stagehand e da Browserbase para permitir que os usuários controlem o comportamento do navegador por meio de comandos de linguagem natural.

MobileAgent: um assistente de operação de dispositivo móvel colaborativo multiagente - Chief AI Sharing Circle

MobileAgent: colaboração multiagente para assistente de operação de dispositivos móveis

Introdução geral O MobileAgent é um poderoso assistente de operação de dispositivos móveis projetado para melhorar a eficiência e a automação da operação de dispositivos móveis por meio da colaboração de vários agentes e de módulos de percepção visual aprimorados. Desenvolvido pela equipe do X-PLUG, ele é compatível com os sistemas Android e Harmony OS e é capaz de trabalhar em sistemas complexos...

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real - Chief AI Sharing Circle

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela ao vivo e forneçam feedback audiovisual contínuo e manipulação...

UI-TARS Desktop: aplicativo de corpo inteligente para desktop para controlar computadores usando linguagem natural - Círculo de compartilhamento de IA principal

UI-TARS Desktop: aplicativo da Intelligentsia para controle de computadores usando linguagem natural

Introdução geral O UI-TARS Desktop é um aplicativo de agente de interface gráfica baseado no UI-TARS (Visual Language Model) desenvolvido pela ByteDance. O aplicativo permite que os usuários controlem computadores por meio de linguagem natural para uma interação homem-computador mais intuitiva e eficiente.

Shortest: uma ferramenta de teste automatizado de IA que usa linguagem natural para testes de ponta a ponta - Chief AI Sharing Circle

Shortest: uma ferramenta de teste automatizado de IA que usa linguagem natural para testes de ponta a ponta

Introdução geral O Shortest é uma estrutura de teste de ponta a ponta em linguagem natural alimentada por IA, desenvolvida pela equipe do Anti-Work. Ele foi desenvolvido com base no Playwright e oferece suporte à integração com o GitHub e à autenticação de dois fatores (2FA). O principal recurso do Shortest é escrever casos de teste por meio de linguagem natural e utilizar o Anthropic Cl...

Midscene.js: um plug-in de código aberto para impulsionar os testes de automação do navegador com IA - Chief AI Sharing Circle

Midscene.js: um plug-in de código aberto que impulsiona os testes de automação do navegador com IA

Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA capaz de controlar páginas da Web, executar asserções e extrair dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando o processo de criação e manutenção de testes de interface do usuário. Aproveitando a grande variedade multimodal ...

Stagehand: uma estrutura para implementação de linguagem natural da automação do navegador - Chief AI Sharing Circle

Stagehand: uma estrutura para implementação de linguagem natural de operações de automação do navegador

Introdução geral O Stagehand é uma estrutura de navegação na Web de IA focada na simplicidade e na extensibilidade. É totalmente compatível com o Playwright, fornecendo três APIs de IA simples (act, extract e observe) que são construídas sobre as classes de página do Playwright subjacentes para a Web por meio de linguagem natural...

Eko: a linguagem natural cria fluxos de trabalho corporais inteligentes para automação de desktops e navegadores - Chief AI Sharing Circle

Eko: Fluxos de trabalho corporais inteligentes de criação de linguagem natural para automação de desktops e navegadores

Introdução geral A Eko é uma estrutura JavaScript de nível de produção projetada para criar fluxos de trabalho eficientes de agentes inteligentes por meio de descrições de linguagem natural. Ele foi projetado para permitir que os desenvolvedores automatizem tarefas cotidianas usando tecnologias de IA sem programação profunda.

AutoMouser: geração de código de automação do navegador para transformar ações do mouse em scripts Selenium Python via IA

Descrição geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as em scripts Python Selenium robustos e fáceis de manter,...

Browser Use Web UI: uma estrutura de código aberto para executar inteligências de IA para navegar na Web, permitindo que a IA manipule automaticamente as páginas da Web - Chief AI Sharing Circle

Browser Use Web UI: uma estrutura de código aberto para executar inteligências de IA para navegar na Web, permitindo que a IA manipule automaticamente as páginas da Web

Introdução geral O Browser Use Web UI é um projeto inovador de código aberto focado em fornecer aos agentes de IA uma ferramenta de interface gráfica para recursos de interação com o navegador. O projeto foi desenvolvido com base na estrutura principal do Browser Use, por meio do Gradio, para criar uma interface da Web fácil de usar, facilitando a interação dos agentes de IA...

Uso do computador aberto da E2B: executando um sistema operacional de IA com segurança no Sandbox da E2B - Círculo de compartilhamento de IA principal

E2B Open Computer Use: Executando um sistema operacional de IA com segurança na área restrita da E2B

Introdução geral O E2B Open Computer Use é um projeto de código aberto que tem como objetivo fornecer uma experiência segura de uso de computador Linux baseado em nuvem por meio do E2B Desktop Sandbox. O E2B Sandbox fornece um ambiente gráfico de desktop que os usuários podem conectar a qualquer Modelo de Linguagem Grande (LLM) para controlar computadores, suportando...

NeoAI: projeto de código aberto que permite que a IA assuma a operação remota de computadores e os controle usando linguagem natural - Chief AI Sharing Circle

NeoAI: Projeto de código aberto que permite que a IA assuma a operação remota de computadores e os controle usando linguagem natural

Introdução geral O NeoAI é uma ferramenta inovadora de assistente de IA de código aberto que permite aos usuários controlar e gerenciar facilmente seus computadores por meio de diálogo em linguagem natural. Sem escrever nenhum código, os usuários podem simplesmente usar o diálogo diário para localizar arquivos, automatizar tarefas, gerenciar dispositivos etc. O NeoAI é compatível com o Windows...

CogAgent: modelo de linguagem visual inteligente de código aberto da Smart Spectrum para operações automatizadas de interface gráfica - Chief AI Sharing Circle

CogAgent: modelo de linguagem visual inteligente de código aberto da Smart Spectrum para automação de interfaces gráficas

Introdução abrangente O CogAgent é um modelo de linguagem visual de código aberto desenvolvido pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM), com o objetivo de automatizar a operação de interfaces gráficas de usuário (GUIs) entre plataformas. O modelo é baseado no CogVLM (GLM-4V-9B), oferece suporte a interações bilíngues em inglês e chinês e é capaz de ...

ClickClickClickClick: habilite qualquer LLM para automatizar as operações do Android e do PC - Chief AI Sharing Circle

ClickClickClickClick: habilite qualquer LLM para automatizar as operações do Android e do PC

Introdução geral O ClickClickClick é uma estrutura desenvolvida pelo BandarLabs que visa automatizar as operações do Android e do PC usando qualquer modelo de linguagem grande (LLM) local ou remoto. No momento, o projeto está em uma fase altamente experimental e oferece suporte a vários modelos, como Ollama, Gemini e GPT 4o. usando...

Browser-Use: criação de ferramentas inteligentes de automação da Web para que os inteligentes de IA operem facilmente os navegadores - Chief AI Sharing Circle

Browser-Use: criação de ferramentas inteligentes de automação da Web para que os inteligentes de IA operem facilmente os navegadores

Introdução abrangente O Browser-Use é uma ferramenta inovadora de automação da Web de código aberto, projetada especificamente para permitir que os modelos de linguagem (LLMs) interajam naturalmente com os sites. Ele oferece uma estrutura avançada e flexível que suporta uma ampla variedade de modelos de linguagem convencionais, incluindo GPT-4, Claude e outros. O recurso mais notável da ferramenta...

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil