Introdução geral O Proxy Lite é uma ferramenta de automação da Web leve e de código aberto, desenvolvida pela Convergence AI como uma versão mini do Proxy com um design de peso aberto. Ele se baseia em um Modelo de Linguagem Visual (VLM) de 3B parâmetros e é capaz de navegação autônoma na Web e execução de tarefas, como encontrar informações ...
Introdução geral O Rabbit Android Agent é uma inteligência de IA inovadora desenvolvida pela Rabbit, projetada para ajudar os usuários a concluir tarefas de uma ou várias etapas em seus dispositivos Android por meio de comandos de voz e texto. A tecnologia é baseada no LAM (Large Action Model) do Rabbit...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral A Convergence é uma empresa dedicada a ajudar as pessoas a recuperar o controle de seu tempo usando tecnologias de aprendizado de máquina. Ao desenvolver modelos de meta-aprendizagem em larga escala (LMLMs), os agentes de IA da Convergence (agentes de navegação) são capazes de adquirir novas habilidades, agir e melhorar continuamente em tempo real. Seu núcleo ...
Introdução geral O mac assistant é um projeto de inteligência de IA desenvolvido especificamente para o macOS, com o objetivo de simplificar as operações do usuário combinando software nativo e recursos da Web. Atualmente, o projeto oferece suporte às APIs OpenAI e GEMINI e planeja oferecer suporte a um modelo nativo de linguagem grande executado pelo Ollama no futuro. mac_assista...
Introdução geral O Open Operator é um projeto de código aberto que visa automatizar operações no navegador por meio de inteligências de IA. Desenvolvido pela Browserbase, o projeto combina as tecnologias do Stagehand e da Browserbase para permitir que os usuários controlem o comportamento do navegador por meio de comandos de linguagem natural.
Introdução geral O MobileAgent é um poderoso assistente de operação de dispositivos móveis projetado para melhorar a eficiência e a automação da operação de dispositivos móveis por meio da colaboração de vários agentes e de módulos de percepção visual aprimorados. Desenvolvido pela equipe do X-PLUG, ele é compatível com os sistemas Android e Harmony OS e é capaz de trabalhar em sistemas complexos...
Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela ao vivo e forneçam feedback audiovisual contínuo e manipulação...
Introdução geral O UI-TARS Desktop é um aplicativo de agente de interface gráfica baseado no UI-TARS (Visual Language Model) desenvolvido pela ByteDance. O aplicativo permite que os usuários controlem computadores por meio de linguagem natural para uma interação homem-computador mais intuitiva e eficiente.
Introdução geral O Shortest é uma estrutura de teste de ponta a ponta em linguagem natural alimentada por IA, desenvolvida pela equipe do Anti-Work. Ele foi desenvolvido com base no Playwright e oferece suporte à integração com o GitHub e à autenticação de dois fatores (2FA). O principal recurso do Shortest é escrever casos de teste por meio de linguagem natural e utilizar o Anthropic Cl...
Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA capaz de controlar páginas da Web, executar asserções e extrair dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando o processo de criação e manutenção de testes de interface do usuário. Aproveitando a grande variedade multimodal ...
Introdução geral O Stagehand é uma estrutura de navegação na Web de IA focada na simplicidade e na extensibilidade. É totalmente compatível com o Playwright, fornecendo três APIs de IA simples (act, extract e observe) que são construídas sobre as classes de página do Playwright subjacentes para a Web por meio de linguagem natural...
Introdução geral A Eko é uma estrutura JavaScript de nível de produção projetada para criar fluxos de trabalho eficientes de agentes inteligentes por meio de descrições de linguagem natural. Ele foi projetado para permitir que os desenvolvedores automatizem tarefas cotidianas usando tecnologias de IA sem programação profunda.
Descrição geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as em scripts Python Selenium robustos e fáceis de manter,...
Introdução geral O Browser Use Web UI é um projeto inovador de código aberto focado em fornecer aos agentes de IA uma ferramenta de interface gráfica para recursos de interação com o navegador. O projeto foi desenvolvido com base na estrutura principal do Browser Use, por meio do Gradio, para criar uma interface da Web fácil de usar, facilitando a interação dos agentes de IA...
Introdução geral O E2B Open Computer Use é um projeto de código aberto que tem como objetivo fornecer uma experiência segura de uso de computador Linux baseado em nuvem por meio do E2B Desktop Sandbox. O E2B Sandbox fornece um ambiente gráfico de desktop que os usuários podem conectar a qualquer Modelo de Linguagem Grande (LLM) para controlar computadores, suportando...
Introdução geral O NeoAI é uma ferramenta inovadora de assistente de IA de código aberto que permite aos usuários controlar e gerenciar facilmente seus computadores por meio de diálogo em linguagem natural. Sem escrever nenhum código, os usuários podem simplesmente usar o diálogo diário para localizar arquivos, automatizar tarefas, gerenciar dispositivos etc. O NeoAI é compatível com o Windows...
Introdução abrangente O CogAgent é um modelo de linguagem visual de código aberto desenvolvido pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM), com o objetivo de automatizar a operação de interfaces gráficas de usuário (GUIs) entre plataformas. O modelo é baseado no CogVLM (GLM-4V-9B), oferece suporte a interações bilíngues em inglês e chinês e é capaz de ...
Introdução geral O ClickClickClick é uma estrutura desenvolvida pelo BandarLabs que visa automatizar as operações do Android e do PC usando qualquer modelo de linguagem grande (LLM) local ou remoto. No momento, o projeto está em uma fase altamente experimental e oferece suporte a vários modelos, como Ollama, Gemini e GPT 4o. usando...
Introdução abrangente O Browser-Use é uma ferramenta inovadora de automação da Web de código aberto, projetada especificamente para permitir que os modelos de linguagem (LLMs) interajam naturalmente com os sites. Ele oferece uma estrutura avançada e flexível que suporta uma ampla variedade de modelos de linguagem convencionais, incluindo GPT-4, Claude e outros. O recurso mais notável da ferramenta...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.
O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.