Introdução abrangente O RolmOCR é uma ferramenta de reconhecimento óptico de caracteres (OCR) de código aberto desenvolvida pela equipe da Reducto AI, com base no modelo de linguagem visual Qwen2.5-VL-7B. Ela pode extrair texto de imagens e arquivos PDF mais rapidamente do que ferramentas semelhantes, como o olmOCR, com menor consumo de memória.
Introdução abrangente O KrillinAI é uma ferramenta de processamento de vídeo de código aberto que se concentra no uso da inteligência artificial para ajudar os usuários a traduzir vídeos e dublá-los automaticamente. Ela pode começar desde o download do vídeo até a geração do produto final adaptado a diferentes plataformas, e todo o processo é feito com apenas alguns cliques. Os desenvolvedores fornecem código gratuito no GitHub, e os usuários podem...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução abrangente O AiryLark é uma ferramenta de processamento e tradução de documentos de código aberto, hospedada no GitHub, criada pelo desenvolvedor wizd com base na estrutura Next.js. Ele é compatível com vários formatos de arquivo (como PDF, Word, TXT, Markdown) para entrada e processamento, além de oferecer recursos de tradução inteligente. Os usuários podem ...
Introdução geral O Zola é um aplicativo de bate-papo com IA gratuito e de código aberto desenvolvido pelo desenvolvedor Julien Thibeaut (nome de usuário ibelick do GitHub) e hospedado no GitHub. Seu melhor recurso é que ele suporta vários modelos de IA, como OpenAI e Mistral, dando aos usuários a liberdade de escolher entre diferentes modelos...
Introdução abrangente O DeepResearcher é um projeto de código aberto desenvolvido pela equipe GAIR-NLP da Shanghai Jiao Tong University. É uma ferramenta de pesquisa inteligente baseada em modelos de linguagem grande (LLMs) com treinamento de ponta a ponta em ambientes de rede reais por meio da aprendizagem por reforço (RL). O projeto tem como objetivo ajudar os usuários a concluir com eficiência pesquisas complexas ...
O AnimeGamer é uma ferramenta de código aberto do ARC Lab da Tencent. Os usuários podem gerar vídeos de anime com comandos verbais simples, como "Sousuke dirige em um carro roxo", e também permitir que diferentes personagens de anime interajam, como Kiki, de Magical Girl's House, e Pazuzu, de Castle in the Sky Meeting. Ele...
Introdução geral O Lumina-mGPT-2.0 é um projeto de código aberto desenvolvido em conjunto pelo Laboratório de IA de Xangai (Shanghai AI Laboratory), pela Universidade Chinesa de Hong Kong (CUHK) e por outras organizações, hospedado no GitHub e mantido pela equipe do Alpha-VLLM. É um modelo autorregressivo autônomo do zero...
Introdução geral O Agent S é uma estrutura de código aberto desenvolvida pela Simular AI que permite que as inteligências operem computadores como seres humanos por meio de uma interface gráfica do usuário (GUI). Ele usa um modelo de macrolinguagem multimodal e técnicas de aprendizado empírico para executar tarefas como navegar na Web, editar documentos e usar software. O projeto está no GitHub...
Introdução geral O BabelDOC é uma ferramenta de código aberto projetada para traduzir documentos PDF em um formato bilíngue. Ele foi desenvolvido pela equipe funstory-ai, hospedado no GitHub, principalmente para usuários que precisam lidar com documentos em idiomas estrangeiros, como pesquisadores, estudantes e técnicos.
Introdução geral O Text2Voice é uma ferramenta de código aberto que fornece funcionalidade de conversão de texto em fala com base em uma API de mobilidade baseada em silício, com uma interface gráfica do usuário (GUI) limpa como seu melhor recurso. Ele foi criado pelo desenvolvedor Sheldon Lee no GitHub para permitir que os usuários transformem facilmente texto em fala por meio de uma interface. O item...
Introdução geral O FreeAI é uma plataforma de aplicativos de IA de código aberto baseada na API Pollinations.AI, que fornece assistentes de bate-papo de IA gratuitos e ilimitados, geração de imagens e serviços de síntese de fala. Criado pelo desenvolvedor Azad-sl no GitHub, o recurso principal do projeto é o uso de arquivos HTML puros para desenvolver...
Introdução geral O Open WebUI Artifacts Overhaul é um projeto de bifurcação baseado no Open WebUI, desenvolvido pelo desenvolvedor Nick Tonjum. É uma ferramenta de código aberto voltada para o aprimoramento da funcionalidade da IA para geração e apresentação de código. Ela permite que os usuários façam com que a IA gere código e interface diretamente...
Introdução geral O OpenAvatarChat é um projeto de código aberto desenvolvido pela equipe HumanAIGC-Engineering e hospedado no GitHub. É uma ferramenta modular de diálogo humano digital que permite aos usuários executar todas as funcionalidades em um único PC. O projeto combina vídeo em tempo real, reconhecimento de fala e tecnologia humana digital...
Introdução geral O uniOCR é uma ferramenta de reconhecimento de texto de código aberto desenvolvida pela equipe mediar-ai. Ela é baseada na linguagem Rust e é compatível com os sistemas macOS, Windows e Linux. Ele é compatível com os sistemas macOS, Windows e Linux. Os usuários podem usá-lo para extrair texto de imagens, a operação é simples e gratuita. O principal recurso do uniOCR é o suporte a várias plataformas...
Introdução geral O Serena é uma ferramenta de programação gratuita e de código aberto desenvolvida pela equipe Oraios AI e hospedada no GitHub. É um assistente de código avançado que funciona diretamente em sua base de código para ajudar os desenvolvedores a analisar, editar e executar o código. O Serena é implementado por meio do Language Server Protocol (LSP)...
Introdução geral O AudioX é um projeto de código aberto de Zeyue Tian et al. no GitHub, com um artigo oficial publicado no arXiv (nº 2503.10522). Ele se baseia na tecnologia de transformador de difusão (Diffusion Transformer), a partir de texto, vídeo, imagens, áudio e outras entradas para gerar alta qualidade ...
Introdução geral O EasyControl é um projeto de código aberto que oferece controle de geração de imagens eficiente e flexível com base na arquitetura Diffusion Transformer (DiT). Entre eles, o Ghibli Control LoRA é um de seus recursos especiais, usando apenas 100 rostos asiáticos e suas imagens no estilo Ghibli geradas pelo GPT-4o...
O YOLOE é um projeto de código-fonte aberto desenvolvido pelo Grupo de Inteligência Multimídia (THU-MIG) da Escola de Software da Universidade de Tsinghua, com o nome completo "You Only Look Once Eye". Ele se baseia na estrutura PyTorch e é uma extensão da série YOLO, que pode detectar e segmentar qualquer objeto em tempo real. O projeto está hospedado no GitHub, ...
Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o OpenAI TTS, o AWS Polly e o MiniMax três...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.