Introdução abrangente O zChunk é uma nova estratégia de fragmentação desenvolvida pela ZeroEntropy para fornecer uma solução para a fragmentação semântica genérica. A estratégia se baseia no modelo Llama-70B e otimiza o processo de fragmentação de um documento, solicitando a geração de fragmentações e garantindo a manutenção de uma alta relação sinal-ruído durante a recuperação de informações. zChunk é especialmente adequado para...
Introdução geral O Hibiki é um modelo de tradução de fala em tempo real de alta fidelidade desenvolvido pela Kyutai Labs. Diferentemente da tradução off-line tradicional, o Hibiki é capaz de gerar tradução de fala natural no idioma de destino e fornecer tradução de texto em tempo real enquanto o usuário fala. O modelo usa uma arquitetura de vários fluxos e é capaz de...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral O Qwen4Mac é um projeto de código aberto criado para integrar o Qwen Large Language Model (LLM) à barra de menus do Mac, facilitando aos usuários chamá-lo e usá-lo a qualquer momento. O projeto é desenvolvido e mantido por andreaturchet e fornece uma maneira fácil para os usuários acessarem e usarem diretamente o Qw...
Introdução geral O Pocket AI (PocketPal AI versão chinesa) é um poderoso assistente de IA off-line projetado para permitir que os usuários conversem com a IA a qualquer hora e em qualquer lugar. Ele se baseia em modelos de idiomas pequenos (SLMs) e pode ser executado em telefones celulares sem conexão com a Internet, especialmente adaptado à experiência do usuário chinês. O Pocket AI é compatível com vários modelos de idiomas pequenos...
Introdução geral O Kokoro WebGPU é a versão WebGPU do modelo de conversão de texto em fala (TTS) do Kokoro, fornecido pela WebML Community na plataforma Hugging Face. O projeto utiliza a tecnologia WebGPU para permitir que os usuários executem conversões eficientes de texto para fala localmente em seus navegadores.
Introdução geral O OpenHealthForAll é um projeto de código aberto criado para ajudar os usuários a gerenciar e entender seus dados pessoais de saúde. Ao aproveitar a tecnologia de inteligência artificial, o OpenHealthForAll fornece um assistente de saúde administrado localmente para ajudar os usuários a gerenciar e analisar melhor suas informações de saúde. O projeto oferece suporte...
Introdução geral O OpenPilot é um sistema de direção autônoma de código aberto desenvolvido pela comma.ai para aprimorar a experiência de direção e a segurança dos veículos existentes com recursos avançados de assistência ao motorista. Desde o seu primeiro lançamento em 2016, o OpenPilot é compatível com mais de 275 modelos de veículos e está constantemente atualizando e otimizando sua funcionalidade...
Introdução geral O Agentic Security é uma ferramenta de código aberto de varredura de vulnerabilidades do LLM (Large Language Model) projetada para fornecer aos desenvolvedores e profissionais de segurança técnicas abrangentes de teste e ataque de fuzz. A ferramenta é compatível com conjuntos de regras personalizados ou ataques baseados em agentes, é capaz de integrar APIs LLM para testes de estresse e oferece...
Introdução geral O CogVLM2 é um modelo multimodal de código aberto desenvolvido pelo Grupo de Pesquisa em Mineração de Dados da Universidade de Tsinghua (THUDM), baseado na arquitetura Llama3-8B e projetado para oferecer desempenho comparável ou até melhor que o GPT-4V. O modelo oferece suporte à compreensão de imagens, ao diálogo em várias rodadas e à compreensão de vídeos, e é capaz de lidar com conteúdo de até 8K de comprimento...
Introdução geral O VisoMaster é uma ferramenta de edição e troca de faces de vídeo poderosa e fácil de usar que utiliza tecnologia de inteligência artificial para obter efeitos naturais e realistas de troca de faces. Seja uma imagem ou um vídeo, o VisoMaster gera resultados de troca de rosto de alta qualidade com operações simples, adequadas tanto para usuários gerais quanto para profissionais....
Introdução abrangente O LLM-RAG-Longevity-Coach é um chatbot baseado nas tecnologias Large Language Modelling (LLM) e Retrieval Augmented Generation (RAG), projetado para fornecer conselhos personalizados sobre saúde e longevidade aos usuários. Desenvolvido por Tyler Burleigh, o projeto utiliza o Streamlit para criar a interface do usuário,...
Introdução abrangente O Maestro é uma ferramenta desenvolvida pela Roboflow para simplificar e acelerar o processo de ajuste fino de modelos multimodais, para que todos possam treinar seus próprios macromodelos visuais. Ele fornece receitas prontas para o ajuste fino de modelos populares de linguagem visual (VLMs), como Florence-2, PaliGemma ...
Introdução abrangente One-Prompt-One-Story (1Prompt1Story) é uma ferramenta inovadora de geração de texto para imagem projetada para permitir a geração consistente de imagens a partir de um único prompt. O projeto, apresentado por Tao Liu et al. no ICLR 2025, emprega uma abordagem sem treinamento que é capaz de manter a identidade do personagem enquanto...
Introdução abrangente O componente de bate-papo Upstash RAG é um componente React projetado para aplicativos Next.js para fornecer uma interface de bate-papo com IA baseada na tecnologia RAG (Retrieval Augmented Generation). O componente combina o Upstash Vector para pesquisa de similaridade, o Together AI para modelos de linguagem grandes (LL...
O AudioNotes é um sistema de notas estruturadas de áudio/vídeo baseado no FunASR e no Qwen2. Ele pode extrair rapidamente o conteúdo de áudio e vídeo e chamar o grande modelo de organização para gerar notas estruturadas em Markdown, o que é conveniente para os usuários lerem e encontrarem informações rapidamente. O sistema é compatível com vários ...
Introdução abrangente O Bilingual Book Maker é um projeto de código aberto criado para ajudar os usuários a criar versões multilíngues de eBooks usando a tecnologia de IA. A ferramenta usa principalmente o ChatGPT para tradução e oferece suporte a vários formatos de arquivo, incluindo epub, txt e srt. O Bilingual Book Maker foi projetado para traduzir livros eletrônicos que...
Introdução abrangente O Rowfill é uma plataforma de processamento de documentos de código aberto projetada para profissionais do conhecimento. Ele usa tecnologias avançadas de IA para extrair, analisar e processar dados de documentos, imagens e PDFs complexos. O Rowfill oferece suporte a modelos nativos de linguagem grande (LLMs) e modelos visuais OpenAI para garantir que os dados sejam ocultos...
Introdução abrangente O PRAG (Parametric Retrieval-Augmented Generation) é uma ferramenta inovadora de geração aumentada por recuperação que visa aprimorar a geração incorporando conhecimento externo diretamente no espaço de parâmetros de um Modelo de Linguagem Grande (LLM). A ferramenta supera o método tradicional de geração aumentada por recuperação contextual de...
Introdução geral O GPT Researcher é uma ferramenta de agente autônomo baseada no Large Language Model (LLM), projetada para realizar pesquisas locais e na Web e gerar relatórios de pesquisa detalhados. A ferramenta oferece desempenho estável e velocidade mais rápida ao paralelizar o trabalho do agente, garantindo informações precisas e imparciais.GPT...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.