Introdução abrangente O Moondream é um modelo de linguagem visual leve e de código aberto projetado para permitir recursos de descrição de imagens por meio de técnicas de aprendizagem profunda e visão computacional. O modelo é capaz de ser executado com eficiência em uma variedade de plataformas e é particularmente adequado para dispositivos de borda.
Introdução geral O Flux Gym é uma interface de usuário da Web fácil de usar para treinar o FLUX LoRA com suporte para baixa memória gráfica (12 GB/16 GB/20 GB). O front-end é baseado na interface de usuário Gradio do AI-Toolkit e o back-end é alimentado pelo Kohya Scripts. O Flux Gym combina a simplicidade da WebUI do AI-Toolkit com o Kohya Scripts.
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução abrangente O PicMenu é uma ferramenta inovadora de IA que transforma os cardápios tradicionais de papel em cardápios com imagens vívidas e intuitivas por meio de uma simples operação fotográfica. A ferramenta não apenas gera automaticamente imagens de alta qualidade de cada prato, mas também fornece informações valiosas sobre os pratos, proporcionando uma nova transformação digital para o setor de bufê...
Introdução geral O Gemini OpenAI API Agent é um endpoint compatível com OpenAI gratuito e sem manutenção de servidor. Os usuários podem implementá-lo facilmente em plataformas como Vercel, Netlify e Cloudflare para uso pessoal. O projeto é destinado àqueles que precisam da API OpenAI, mas não querem assumir a manutenção do servidor...
Introdução geral O Sana é uma estrutura eficiente de geração de imagens de alta resolução desenvolvida pelo NVIDIA Labs, capaz de gerar imagens com resolução de até 4096 × 4096 em questão de segundos. O Sana emprega um transformador de difusão linear e uma tecnologia de autocodificador de compactação profunda para melhorar drasticamente a velocidade e a qualidade da geração de imagens,...
Introdução geral O SP-MangaEditer é uma plataforma independente de edição de mangás projetada para criadores de mangás. A plataforma suporta geração de imagens, edição de camadas, ajuste de imagens, aplicação de filtros e muitas outras funções para ajudar os usuários a criar facilmente ilustrações de mangá de alta qualidade. Os usuários podem gerar rapidamente com simples...
Introdução geral O SQLite-Utils-Ask é uma ferramenta avançada projetada para ajudar os usuários a realizar consultas de dados com perguntas e respostas em bancos de dados SQLite e arquivos CSV/JSON com o auxílio do LLM (Large Language Model). A ferramenta é capaz de gerar automaticamente consultas SQL apropriadas com base nas perguntas do usuário e executar as consultas para retornar...
Introdução abrangente O GraphRAG-Dify é um projeto de código aberto desenvolvido para combinar as tecnologias GraphRAG e Dify para criar e implantar rapidamente um agente de IA. O projeto usa FastAPI e Uvicorn para a criação de serviços e oferece suporte à importação de DSL, o que facilita a integração e o uso em aplicativos reais pelos usuários. Lista de funções Criar ...
Introdução geral O askrepo é uma ferramenta de leitura de código-fonte baseada no LLM (Large Language Model). Ela é capaz de ler o conteúdo de um arquivo de texto gerenciado pelo Git em um diretório especificado e enviá-lo à API do Google Gemini para fornecer respostas a perguntas com base em prompts especificados. A ferramenta foi projetada para ajudar os desenvolvedores a...
Introdução abrangente O PDFMathTranslate é uma ferramenta de código aberto voltada para a tradução de artigos científicos, capaz de traduzir o texto completo de documentos PDF e gerar uma versão bilíngue. Ele usa a tecnologia de IA para manter completamente o layout do documento original, incluindo fórmulas, diagramas, índices e anotações, com suporte para Google, DeepL, Ollama...
Introdução geral O Voice-Pro é uma ferramenta versátil baseada na Gradio WebUI que oferece suporte a conversão de fala em texto, conversão de texto em fala, tradução em tempo real, downloads de vídeos do YouTube e separação de voz humana. Ele integra as tecnologias Whisper, Faster-Whisper e Whisper-Timestamped para oferecer...
Introdução abrangente O Linly-Dubbing é uma ferramenta inteligente de tradução e dublagem multilíngue de IA projetada para oferecer aos usuários serviços de tradução de legendas e dublagem de vídeo multilíngue de alta qualidade por meio da integração de tecnologia avançada de IA. A ferramenta é especialmente adequada para educação internacional, localização de conteúdo global e outros cenários, ajudando as equipes a trazer conteúdo de alta qualidade...
Introdução geral O FlipSketch é um projeto de código aberto criado para converter desenhos estáticos em animações guiadas por texto. Hospedado no GitHub, o projeto oferece uma ferramenta inovadora que permite aos usuários gerar efeitos de animação a partir de descrições de texto. O FlipSketch combina técnicas de processamento de imagens e de processamento de linguagem natural...
Introdução geral O AutoFlow é uma ferramenta de código aberto desenvolvida pela PingCAP para criar bases de conhecimento baseadas em gráficos com armazenamento vetorial sem servidor TiDB. Ele integra o LlamaIndex e a estrutura DSPy para oferecer suporte à pesquisa de diálogos complexos e à edição de gráficos de conhecimento. Os usuários podem usar um substituto JavaScript simples...
Introdução abrangente O Maxun é uma plataforma de extração de dados da Web sem código aberto que permite aos usuários treinar robôs em minutos para rastrear automaticamente os dados da Web e convertê-los em APIs ou planilhas. A plataforma suporta paginação e rolagem, pode se adaptar a alterações no layout do site, oferece recursos avançados de rastreamento de dados para...
Introdução geral O OpenPromptStudio (OPS) é um editor visual de código aberto para palavras de alerta do AIGC, desenvolvido pela equipe Moonvy. Seu objetivo é simplificar o processo de criação e gerenciamento de palavras de prompt com suporte para modelos de IA, como o Midjourney. O OPS oferece recursos avançados de gerenciamento de palavras de prompt por meio da integração do Notion, que permite aos usuários...
Introdução geral A UI da Web de geração de texto é uma UI da Web baseada no Gradio, projetada para o Modelo de linguagem grande (LLM). Ela é compatível com uma variedade de back-ends de geração de texto, incluindo Transformers, llama.cpp e ExLlamaV2. Os usuários podem instalá-lo rapidamente com etapas simples...
Introdução geral O Morphic é um mecanismo de busca baseado na tecnologia de IA com uma interface de usuário generativa projetada para fornecer perguntas e respostas inteligentes e uma experiência de busca eficiente. Os usuários podem realizar várias pesquisas, inclusive de texto, vídeo etc., com o Morphic, além de salvar o histórico de pesquisa e compartilhar os resultados da pesquisa.
Introdução geral O Swarm é uma estrutura educacional experimental desenvolvida pela OpenAI para explorar interfaces leves, controladas e fáceis de testar para sistemas multiagentes. A estrutura é usada principalmente para demonstrar transferências e padrões de rotina entre agentes para ajudar os desenvolvedores a entender e implementar a coordenação e a execução de sistemas com vários agentes.
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.