Introdução geral O RTranslator é um aplicativo de tradução off-line em tempo real, quase gratuito e de código aberto, desenvolvido para dispositivos Android. Os usuários podem manter o telefone no bolso conectando um fone de ouvido Bluetooth e conversar com outras pessoas como se estivessem falando seu próprio idioma.
Introdução geral O Gemini Next Chat é um projeto de código aberto desenvolvido para ajudar os usuários a implementar facilmente aplicativos Gemini privados. O projeto é compatível com o modelo multimodal Gemini 1.5 e Gemini 2.0, e os usuários podem implementá-lo gratuitamente com um clique no Vercel. O Gemini Next Chat oferece um cliente multiplataforma ...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Descrição geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as em scripts Python Selenium robustos e fáceis de manter,...
Introdução geral O Vanna é uma estrutura Python de código aberto licenciada pelo MIT que se concentra na geração de consultas SQL por meio de técnicas RAG (Retrieval Augmented Generation). Os usuários podem treinar modelos RAG, aplicá-los a seus próprios dados e, em seguida, fazer perguntas, e o Vanna retornará as consultas SQL apropriadas. Essas consultas podem ser automaticamente...
Introdução abrangente O SVFR (Stable Video Face Restoration) é uma estrutura unificada para restauração de faces em vídeo que suporta as tarefas de restauração básica de faces (BFR), coloração, reparo e suas combinações. A estrutura utiliza a priori geradores e de movimento para integrar informações específicas da tarefa por meio de uma estrutura unificada de restauração facial, propondo...
Introdução abrangente O LiveTalking é um sistema humano digital interativo em tempo real de código aberto, comprometido com a criação de soluções humanas digitais ao vivo de alta qualidade. O projeto usa o protocolo de código aberto Apache 2.0 e integra várias tecnologias de ponta, incluindo renderização ER-NeRF, processamento de fluxo de áudio e vídeo em tempo real, sincronização labial e assim por diante. O sistema oferece suporte a ...
Introdução geral O Aider é uma poderosa ferramenta de assistente de programação de IA de código aberto que ajuda os desenvolvedores a escrever, editar e refatorar códigos por meio de diálogo em linguagem natural. Como uma ferramenta interativa de programação de pares de IA, o Aider é compatível com muitas das principais linguagens de programação, integra-se perfeitamente aos fluxos de trabalho do Git e pode...
Introdução abrangente O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, ele usa técnicas avançadas de reconstrução em 3D e métodos de extração de recursos de áudio para capturar com precisão os recursos de identidade e os coeficientes de expressão do locutor...
Introdução abrangente O Video Subtitle Remover (Video-subtitle-remover, ou VSR) é um software de processamento de vídeo baseado na tecnologia de IA, especialmente projetado para remover legendas e marcas d'água de texto de vídeos. A ferramenta usa uma variedade de modelos de algoritmos de IA (STTN, LAMA, PROPAINTER) para identificar de forma inteligente...
Introdução abrangente O TimesFM 2.0 - 500M PyTorch é um modelo de base de série temporal pré-treinado desenvolvido pela Google Research e projetado para previsão de série temporal. O modelo é capaz de lidar com comprimentos de contexto de até 2048 pontos de tempo e suporta intervalos de previsão arbitrários.
Introdução abrangente O WeChat Video No. Downloader é um projeto de código aberto criado para ajudar os usuários a baixar rapidamente o conteúdo de vídeo dos números de vídeo do WeChat. A ferramenta é compatível com vários formatos e plataformas de vídeo, e os usuários podem usá-la facilmente nos sistemas Windows e macOS. O projeto foi desenvolvido pela ltaoo e hospedado no GitHub, os usuários...
Introdução geral O Riona-AI-Agent é uma ferramenta inovadora de automação baseada em IA, projetada especificamente para gerenciar e otimizar as operações das principais plataformas de mídia social. Ela utiliza modelos avançados de IA para fornecer geração inteligente de conteúdo e recursos de gerenciamento de contas para plataformas como Instagram, Twitter e GitHub. O sistema...
Introdução abrangente O NV Ingest (NVIDIA Ingest) é um conjunto de microsserviços de acesso antecipado projetado para analisar centenas de milhares de PDFs não estruturados complexos e confusos e outros documentos corporativos. Ele pode converter esses documentos em metadados e texto para incorporação em sistemas de recuperação.
Introdução abrangente O Always-On AI Assistant é um projeto inovador de assistente de IA que cria um sistema de assistente de IA avançado e permanentemente on-line por meio da integração de tecnologias avançadas, como Deepseek-V3, RealtimeSTT e Typer. O projeto é especialmente otimizado para cenários de desenvolvimento de engenharia, fornecendo um...
Introdução abrangente O STAR (Spatial-Temporal Augmentation with Text-to-Video Models) é uma estrutura inovadora de super-resolução de vídeo desenvolvida em conjunto pela Nanjing University, ByteDance e Southwest University. O projeto se dedica a resolver os principais problemas no processamento de super-resolução de vídeo do mundo real...
Introdução geral O ImBD (Imitate Before Detect) é um projeto pioneiro de detecção de texto gerado por máquina que foi apresentado na conferência AAAI 2025. Com o uso generalizado de modelos de linguagem grandes (LLMs), como o ChatGPT, o reconhecimento de conteúdo de texto gerado por IA está se tornando cada vez mais desafiador.
Introdução geral O Browser Use Web UI é um projeto inovador de código aberto focado em fornecer aos agentes de IA uma ferramenta de interface gráfica para recursos de interação com o navegador. O projeto foi desenvolvido com base na estrutura principal do Browser Use, por meio do Gradio, para criar uma interface da Web fácil de usar, facilitando a interação dos agentes de IA...
Introdução geral Este é um projeto de blueprint de geração de relatórios estruturados co-desenvolvido pela LangChain e pela NVIDIA, apresentado em um tutorial de notebook Jupyter no GitHub. O projeto aproveita tecnologias avançadas de IA, especificamente o modelo Llama-3.3-70b, para automatizar a geração de relatórios técnicos profissionais. Os principais recursos do projeto ...
Introdução geral O BrownChat é um aplicativo de bate-papo com áudio em tempo real baseado na tecnologia LLM (Large Language Modelling). Desenvolvido pelo usuário do GitHub sugarforever, o projeto tem como objetivo aprimorar a experiência de comunicação do usuário por meio de tecnologia avançada de processamento de linguagem natural.
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.
O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.