Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o OpenAI TTS, o AWS Polly e o MiniMax três...
Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a maneira como os humanos entendem o vídeo, dividindo as tarefas em planejamento,...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral O SuperCoder é uma ferramenta inteligente que é executada no terminal e foi projetada para programadores. Ele usa a tecnologia de IA para ajudar os usuários a pesquisar código, visualizar a estrutura do projeto, editar arquivos e corrigir bugs. O projeto tem código aberto por huytd no GitHub e é compatível com Linux, MacOS e Windows...
Introdução geral O Emigo é um assistente de programação de IA de código aberto para o Emacs, desenvolvido por MatthewZMD no GitHub. O Emigo é um assistente de programação de IA de código aberto para o Emacs, desenvolvido por MatthewZMD no GitHub, que ajuda os programadores a concluir a análise, a geração, a modificação e outras tarefas de código no Emacs, integrando um modelo de linguagem em grande escala (LLM).
Introdução geral O SegAnyMo é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da UC Berkeley e da Universidade de Pequim, incluindo membros como Nan Huang. Essa ferramenta se concentra no processamento de vídeo e pode identificar e segmentar automaticamente objetos móveis arbitrários em um vídeo, como pessoas, animais ou veículos. Ela combina o TAP...
Introdução geral O GenXD é um projeto de código aberto desenvolvido pela Universidade Nacional de Cingapura (NUS) e pela equipe da Microsoft. Ele se concentra na geração de cenas arbitrárias em 3D e 4D, resolvendo a geração de 3D e 4D no mundo real devido à insuficiência de dados e à complexidade do design do modelo causada pelo problema. O projeto analisa o movimento da câmera e do objeto,...
Introdução geral O ChatAnyone é um projeto inovador desenvolvido pela equipe do HumanAIGC. Ele usa técnicas de inteligência artificial para gerar vídeos digitais de retratos humanos com movimentos da parte superior do corpo a partir de uma única foto e entrada de áudio. O projeto baseia-se em um modelo de difusão de movimento hierárquico que gera movimentos da cabeça, gestos e expressões para...
Introdução geral O Search-R1 é um projeto de código aberto desenvolvido por PeterGriffinJin no GitHub e baseado na estrutura veRL. Ele usa técnicas de aprendizagem por reforço (RL) para treinar grandes modelos de linguagem (LLMs), permitindo que os modelos aprendam de forma autônoma a raciocinar e invocar mecanismos de pesquisa para resolver problemas. O projeto é compatível com o Qwen2.5...
Introdução geral O DeepGemini é um projeto de código aberto, criado pelo desenvolvedor Thomas Sligter. É uma ferramenta de gerenciamento de IA que oferece suporte à orquestração de vários modelos. O principal recurso é a capacidade de combinar com flexibilidade uma variedade de modelos de IA e é chamado por meio da interface de API compatível com OpenAI. O projeto é baseado em Python 3.11 e ...
Introdução geral O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto contém três bibliotecas de código: ComputerGYM, AgentAI e Playwright, e os usuários podem ...
Introdução geral O II-Researcher é uma ferramenta de pesquisa de inteligência artificial de código aberto desenvolvida pela equipe do Intelligent-Internet e hospedada no GitHub. Ele foi projetado para pesquisa profunda e raciocínio complexo, e é capaz de responder a perguntas complexas por meio de pesquisas inteligentes na Web e análise em várias etapas. O projeto foi lançado em 27 de março de 2025...
Introdução geral O Cua é um projeto de código aberto chamado Computer-Use Agent (pronuncia-se "koo-ah"), projetado para dispositivos Apple Silicon para criar e executar máquinas virtuais macOS e Linux de alto desempenho em velocidades próximas a 90% nativamente. Ele foi projetado para dispositivos Apple Silicon, pode criar e executar máquinas virtuais macOS e Linux de alto desempenho, com velocidades próximas às do dispositivo nativo 90%. O Cua usa o Ap...
Introdução geral O Paper to Podcast é uma ferramenta de código aberto especializada em transformar trabalhos de pesquisa acadêmica em podcasts animados e divertidos. Ela facilita a compreensão de conteúdos acadêmicos complexos usando tecnologia de inteligência artificial para transformar um artigo em formato PDF em um diálogo entre três personagens: o apresentador, o aluno e o especialista. Isso ...
Introdução geral O Anubis é uma ferramenta de código aberto desenvolvida pela equipe do TecharoHQ para proteger sites de rastreadores de IA. Ela adiciona um desafio de prova de trabalho SHA256 às solicitações HTTP, exigindo que os visitantes concluam tarefas computacionais como uma forma de bloquear sites não compatíveis...
Introdução geral O OmniSQL é um projeto de código aberto desenvolvido pela equipe do RUCKBReasoning e hospedado no GitHub. Sua principal função é transformar as perguntas de linguagem natural inseridas pelo usuário em instruções de consulta SQL de alta qualidade para ajudar os usuários a interagir facilmente com os bancos de dados. O projeto se baseia em um texto automatizado...
Introdução geral O LatentSync é uma ferramenta de código aberto desenvolvida pela ByteDance e hospedada no GitHub. Ela aciona os movimentos labiais dos personagens em um vídeo diretamente por meio do áudio, permitindo que o formato da boca corresponda à voz com precisão. O projeto é baseado no modelo de difusão latente do Stable Diffusion, conhecido como LatentSync.
Introdução geral O Morphik Core é um projeto de código aberto desenvolvido pela equipe morphik-org e hospedado no GitHub. Essa ferramenta é um banco de dados projetado para aplicativos de IA que podem lidar com texto, imagens, PDFs, vídeos e outros tipos de...
Introdução geral O serverless-markdown-convertor é uma ferramenta de código aberto gratuita, baseada no desenvolvimento do Cloudflare Worker e do Workers AI, que pode converter uma variedade de arquivos para o formato Markdown. Ele é compatível com PDF, imagens, documentos do Office, HTML e outros tipos de arquivos comuns, sem a necessidade de ...
Introdução geral O EditorJumper é um plug-in projetado para o JetBrains IDE, desenvolvido pelo usuário do GitHub wanniwa. Ele permite que os desenvolvedores alternem rapidamente entre o JetBrains IDE (por exemplo, IntelliJ IDEA, PyCharm) e editores como VS Code, Cursor, Trae, Windsurf, etc. ...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.