Projeto de código aberto de IA

Total de 1020 artigos
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: geração de imagens em tempo real digitando palavras de alerta (acesso gratuito ao modelo Flux Schnell)

Descrição geral O BlinkShot é um gerador de imagens de IA em tempo real e de código aberto que utiliza a tecnologia Together AI e Flux Schnell para permitir que os usuários gerem imagens de alta qualidade à medida que inserem avisos. A plataforma é totalmente gratuita e oferece suporte à personalização do usuário e à...
10 meses atrás
03.2K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler: conteúdo de plataformas de mídia social múltipla, ferramenta de rastreamento de comentários em vídeo

Introdução geral O MediaCrawler é uma ferramenta de rastreamento de conteúdo de mídia social criada para desenvolvedores. Ao fornecer uma função de rastreamento avançada, ele pode obter rapidamente vídeos, imagens, comentários, curtidas, retweets e outros dados de plataformas sociais como Xiaohongshu, Shake, Shutter, B, Weibo e outras...
12 meses atrás
03.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus: ferramenta de IA para gerar vídeos curtos com um clique, mixagem em lote gratuita

Introdução abrangente O MoneyPrinterPlus é um projeto de código aberto que visa gerar e misturar todos os tipos de vídeos curtos com um clique por meio da tecnologia de IA e publicá-los automaticamente em várias plataformas de vídeo, como Jieyin, Shutterbugs, Xiaohongshu e Video Number. A ferramenta oferece suporte a modelos de voz locais e baseados em nuvem, incluindo bate-papo...
11 meses atrás
03.2K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Introdução geral O Audiblez é um projeto de código aberto criado para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e várias vozes. Os usuários podem simplesmente...
7 meses atrás
03.2K
Novel:模仿Notion AI的开源写作编辑器

Novel: um editor de redação de código aberto que imita o Notion AI

Introdução abrangente Este é um projeto de código aberto desenvolvido por Steven Tey chamado Novel, é um editor de texto WYSIWYG no estilo Notion, com recurso integrado de autocompletar AI que pode ajudar os usuários a aumentar a eficiência da entrada de texto. O projeto fornece documentação detalhada e instruções de instalação ...
1 ano atrás
03.2K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: ferramenta de clonagem de voz sem amostras em vários idiomas baseada em xtts_v2 para Windows com instalador de um clique.

Descrição geral O Clone Voice é uma ferramenta de clonagem de som de código aberto que fornece uma interface baseada na Web que permite aos usuários clonar vozes usando qualquer som ou gravação de voz pessoal. A ferramenta é fácil de usar, mesmo sem uma GPU NVIDIA, e pode ser usada com um aplicativo pré-compilado...
10 meses atrás
03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: retratos orientados por áudio para gerar vídeos falados (instalador acelerado do EchoMimicV2)

Introdução geral O EchoMimic é um projeto de código-fonte aberto criado para gerar animações de retratos realistas acionadas por áudio. Desenvolvido pela divisão Terminal Technologies do Ant Group, o projeto utiliza condições de pontos de marcação editáveis para gerar vídeos de retratos dinâmicos usando uma combinação de áudio e pontos de marcação facial.
7 meses atrás
03.2K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: uma ferramenta de código aberto para geração automática de gráficos de conhecimento a partir de texto simples

Introdução geral O KGGen é uma ferramenta de código aberto desenvolvida pelo Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), hospedada no GitHub, projetada para gerar automaticamente gráficos de conhecimento a partir de texto arbitrário. Ele usa algoritmos avançados de modelagem e agrupamento de linguagem para obter texto não estruturado...
6 meses atrás
03.2K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: uma estrutura de colaboração com várias inteligências para criar equipes de desenvolvimento de software de IA para programação de linguagem natural

Introdução abrangente O MetaGPT é uma estrutura inovadora de corpo de inteligência múltipla projetada para simular a operação de uma empresa de software de IA completa. Criado por geekan (Alexander Wu), o objetivo do projeto é combinar modelos GPT com diferentes funções em uma entidade colaborativa...
5 meses atrás
03.2K
留痕(WeChatMsg):微信聊天记录导出与分析工具

Leave a trace (WeChatMsg): ferramentas de exportação e análise de registros de bate-papo do WeChat

Introdução geral O WeChatMsg é um projeto de código aberto localizado na plataforma GitHub. O objetivo da ferramenta é fornecer aos usuários do WeChat uma maneira de extrair e exportar bate-papos do WeChat para uma variedade de documentos (HTML, Word, CSV) e oferecer suporte à geração de relatórios anuais de visualização de dados de bate-papo...
1 ano atrás
03.2K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

Introdução abrangente O MiniRAG é uma estrutura extremamente simples do Retrieval Augmented Generation (RAG) que visa a permitir um bom desempenho do RAG mesmo para modelos pequenos por meio de indexação de gráficos heterogêneos e recuperação leve com aprimoramento de topologia. Ele foi desenvolvido pelo Laboratório de Ciência de Dados da Universidade de Hong Kong (HKUDS) para abordar ...
7 meses atrás
03.2K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: downloader de quadrinhos gratuito e de código aberto, com suporte para download de quadrinhos nos formatos PDF, EPUB, CBR e CBZ

Introdução geral O Comics Downloader é uma ferramenta de código aberto criada para ajudar os usuários a baixar quadrinhos e revistas em quadrinhos de vários sites. A ferramenta é compatível com vários formatos de arquivo, incluindo PDF, EPUB, CBR e CBZ, permitindo que os usuários escolham de acordo com suas necessidades...
8 meses atrás
03.2K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboração multiagente para assistente de operação de dispositivos móveis

Introdução geral O MobileAgent é um poderoso assistente de operação de dispositivos móveis projetado para melhorar a eficiência e a automação da operação de dispositivos móveis por meio da colaboração de vários agentes e de módulos de percepção visual aprimorados. Ele foi desenvolvido pela equipe do X-PLUG e é compatível com Android e ...
7 meses atrás
03.2K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: Faça as fotos falarem | Áudio de sincronização de boca | Vídeo de sincronização de boca sintetizado | Pessoas digitais gratuitas

Introdução geral O SadTalker é uma ferramenta de código aberto que combina uma única foto de retrato com um arquivo de áudio para criar vídeos realistas de avatares falantes para uma ampla variedade de cenários, como mensagens personalizadas, conteúdo educacional e muito mais. Uso revolucionário de tecnologias de modelagem 3D, como ExpNet e PoseVA...
6 meses atrás
03.2K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: um cliente de diálogo inteligente para desktop baseado na API Dify, que oferece recursos de diálogo de IA de nível empresarial

Introdução abrangente O Dify-WebUI é um aplicativo moderno de diálogo inteligente para desktop baseado na API do Dify, projetado para fornecer às empresas recursos avançados de diálogo com IA. O aplicativo oferece suporte a uma variedade de cores de temas predefinidos para atender às necessidades individuais das empresas e tem uma função de gerenciamento de base de conhecimento para...
7 meses atrás
03.2K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: Ferramenta inteligente de código aberto para registro e resumo de reuniões que se baseia no OpenAI Whisper

Introdução geral O MeetingMind é um aplicativo avançado de IA projetado para melhorar a eficiência da captura e do resumo de reuniões de negócios. O aplicativo integra a tecnologia Whisper da OpenAI para uma conversão precisa de voz em texto e usa o IBM Watso...
10 meses atrás
03.2K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Remoção de marca d'água: ferramenta de remoção de marca d'água de imagem de código aberto, recuperação de marca d'água de imagem original

Introdução geral O Watermark Removal é um projeto de código aberto que usa técnicas de aprendizado de máquina e aprendizado profundo para restauração de imagens, especificamente para remover marcas d'água de imagens. O projeto foi desenvolvido por Chimzuruoke Okafor e é inspirado no Con...
6 meses atrás
03.2K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: uma estrutura de inteligência colaborativa para vários papéis para simplificar tarefas complexas

Introdução abrangente O CrewAI é uma estrutura avançada projetada para orquestrar a colaboração entre agentes de IA autônomos e de interpretação de papéis. Ao facilitar a inteligência colaborativa, o CrewAI permite que os agentes trabalhem juntos sem problemas para resolver tarefas complexas. Não importa se você está criando uma plataforma de assistente inteligente, automatizando equipes de atendimento ao cliente ou...
8 meses atrás
03.2K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT Acadêmico: Melhor tradução de artigos acadêmicos do Arxiv, correção de erros e interpretação de códigos

Introdução geral O GPT Academic é uma plataforma interativa para modelos de idiomas grandes otimizados para pesquisa acadêmica, fornecendo ferramentas para interfaces interativas pragmáticas para modelos de idiomas grandes, como o GPT/GLM, otimizados especificamente para a tradução, leitura, polimento e experiência de escrita em papel. Ele usa um design modular...
9 meses atrás
03.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

Introdução abrangente O Easy-Voice-Toolkit é um kit de ferramentas multifuncional baseado no Open Source Speech Project, que oferece uma ampla variedade de ferramentas de áudio automatizadas para reconhecimento de fala, transcrição de fala, conversão de fala, criação de conjuntos de dados e treinamento de modelos. Os usuários podem usar essas ferramentas de forma seletiva, conforme necessário...
11 meses atrás
03.1K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: um assistente de diálogo de voz de código aberto de baixa latência para conversação e comunicação naturais

Introdução abrangente O Bailing (Bailing) é um assistente de diálogo de voz de código aberto projetado para estabelecer um diálogo natural com os usuários por meio da fala. O projeto combina as tecnologias de reconhecimento de fala (ASR), detecção de atividade de voz (VAD), modelagem de linguagem ampla (LLM) e síntese de fala (TTS) para...
7 meses atrás
03.1K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem...
7 meses atrás
03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: clone de código aberto do sistema de integração digital man, implantação com um clique do cliente digital man gratuito

Introdução abrangente O AigcPanel é um sistema completo de produção humana digital de IA para todos os usuários, desenvolvido com a pilha de tecnologia electron+vue3+typescript, com suporte à implementação com um clique no Windows. O sistema foi projetado para ser fácil de usar como o núcleo, mesmo...
7 meses atrás
03.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: uma plataforma integrada para conectar diferentes estruturas de inteligências de IA para colaborar em tempo real

Introdução geral O Mahilo é uma plataforma de integração de várias inteligências de código aberto, lançada no GitHub pelo desenvolvedor Jayesh Sharma, projetada para ajudar os usuários a conectar inteligências de IA de diferentes estruturas para oferecer suporte à comunicação em tempo real, à interação humano-computador e à colaboração inteligente. O ...
5 meses atrás
03.1K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: um modelo de conversão de texto em fala de código aberto para geração e clonagem de fala de alta qualidade

Introdução geral O Llasa-3B é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong (HKUST Audio). O modelo se baseia na arquitetura Llama 3.2B, que foi cuidadosamente ajustada para oferecer geração de fala de alta qualidade que não só oferece suporte a várias...
6 meses atrás
03.1K
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

Kit de ferramentas de IA da Ostris: Difusão estável com o kit de ferramentas de treinamento de modelos FLUX.1

Introdução geral O AI Toolkit da Ostris é um conjunto de ferramentas de IA de código aberto voltado para o suporte aos modelos Stable Diffusion e FLUX.1 para tarefas de treinamento e geração de imagens. O conjunto de ferramentas foi criado e é mantido pelo desenvolvedor Ostris, tor...
5 meses atrás
03.1K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: gerador de logotipos de código aberto, que usa inteligência artificial para gerar logotipos de marcas profissionais

Introdução geral O LogoCreator é um gerador de logotipos de código aberto baseado no modelo Together AI e Flux, com foco no fornecimento de serviços rápidos e profissionais de design de logotipos para empresas e indivíduos. O projeto foi desenvolvido e tem código aberto pelo desenvolvedor Nutlope no Git...
8 meses atrás
03.1K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: renderização de luz natural de imagens de retrato (não publicado)

Descrição geral O SynthLight é uma ferramenta de reiluminação de retratos baseada em um modelo de difusão. Ela aprende a renderizar novamente imagens sintéticas de rostos para obter ajustes de efeitos de iluminação em fotos de retratos reais. A ferramenta usa um mecanismo de renderização física para gerar conjuntos de dados que simulam transformações de iluminação sob diferentes condições de iluminação...
7 meses atrás
03.1K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: Extraia a estrutura complexa do conteúdo do PDF da ferramenta de código aberto

Introdução abrangente O PDF-Extract-Kit é um projeto de código aberto desenvolvido pela equipe do OpenDataLab, com foco na extração eficiente de conteúdo de alta qualidade de documentos PDF complexos e diversos. Ele integra tecnologia avançada de análise de documentos para oferecer suporte à detecção de layout, reconhecimento de fórmulas ...
6 meses atrás
03.1K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: PPT gerado por IA, geração de apresentações

Introdução abrangente O AiPPT é uma ferramenta de geração de PPT baseada em tecnologia de inteligência artificial, projetada para ajudar os usuários a criar rapidamente apresentações profissionais. Ele gera automaticamente slides ricos em conteúdo e com design bonito, inserindo temas, carregando arquivos ou fornecendo URLs etc. Ele oferece suporte a gráficos nativos, animações e recursos especiais em 3D...
6 meses atrás
03.1K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI: ferramenta de edição automatizada e narração de filmes e TV gerada por texto

Introdução geral O NarratoAI é uma ferramenta totalmente automatizada que integra narração de filmes e vídeos, edição automatizada, dublagem e geração de legendas. Ele se baseia na tecnologia de modelagem de linguagem em larga escala (LLM) para gerar automaticamente cópias e editar automaticamente vídeos com dublagens e legendas correspondentes, fornecendo aos usuários um...
11 meses atrás
03.1K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix: empacotamento da base de código em um arquivo de texto para recuperação de modelos grandes

Introdução geral O Repomix (anteriormente conhecido como Repopack) é uma ferramenta de código aberto projetada para empacotar toda uma base de código em um único arquivo compatível com IA. Essa ferramenta permite que os desenvolvedores disponibilizem facilmente sua base de código para grandes modelos de linguagem (como Claude, Chat...
7 meses atrás
03.1K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: Transforma as letras em um modelo básico de uma música completa, suportando uma ampla variedade de estilos musicais

Introdução geral O YuE é um modelo básico de geração de músicas completas de código aberto que se concentra na transformação de letras em músicas completas. Diferentemente de outros modelos que geram apenas trechos curtos de músicas sem vocais, o YuE é capaz de gerar músicas completas com vocais principais e de apoio de até vários minutos de duração. O modelo aborda a geração de música em...
6 meses atrás
03.1K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking: sincronização labial acionada por áudio e sistema de edição de vídeo

Introdução geral O VideoReTalking é um sistema inovador que permite ao usuário gerar vídeos faciais sincronizados com os lábios com base no áudio de entrada, produzindo vídeos de saída de alta qualidade e sincronizados com os lábios, mesmo com emoções diferentes. O sistema divide esse objetivo em três tarefas consecutivas: com expressões típicas...
8 meses atrás
03.1K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: uma estrutura de código aberto para otimizar projetos de prompt para melhorar o desempenho da tarefa

Introdução abrangente O PromptWizard é uma estrutura de código-fonte aberto desenvolvida pela Microsoft que usa um mecanismo autoevolutivo que permite que o modelo gere, avalie e aprimore palavras de alerta e gere exemplos por conta própria, melhorando a qualidade do resultado por meio de feedback contínuo. Ele pode otimizar de forma autônoma as palavras de alerta, gerar e selecionar exemplos apropriados e...
8 meses atrás
03.1K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: uma ferramenta de conversão de texto em fala para gerar fala natural em chinês

Introdução geral O Orpheus-TTS é um sistema de conversão de texto em fala (TTS) de código aberto desenvolvido na arquitetura Llama-3b com o objetivo de gerar áudio próximo à fala humana natural. Ele foi lançado pela equipe da Canopy AI e é compatível com inglês, espanhol, francês...
4 meses atrás
03.1K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: criação de tabelas inteligentes em vários bancos de dados, alternativa de código aberto ao Airtable

Introdução geral O NocoDB é uma alternativa de código aberto ao Airtable projetada para fornecer uma ferramenta de gerenciamento de banco de dados on-line avançada e fácil de usar. Com o NocoDB, os usuários podem facilmente criar, ler, atualizar e excluir dados de bancos de dados sem escrever código. A plataforma é compatível com ...
10 meses atrás
03.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: uma versão de código aberto do modelo OpenAI o1 baseado no Qwen2-7B-Instrua o ajuste fino para explorar modelos de inferência abertos para resolver problemas complexos

Introdução abrangente O Marco-o1 é um modelo de raciocínio aberto desenvolvido pelo Alibaba International Digital Commerce Group (AIDC-AI) para resolver problemas complexos do mundo real. O modelo combina o ajuste fino do Chain of Thought (CoT), o Monte Carlo Tree Search (MCTS) e estratégias de raciocínio inovadoras...
8 meses atrás
03.1K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI: um assistente de codificação de IA de linha de comando de terminal lançado pela OpenAI

Introdução geral O OpenAI Codex CLI é uma ferramenta de codificação de terminal de código aberto, desenvolvida pela OpenAI, projetada para desenvolvedores acostumados com terminais. Ele gera código, edita arquivos, executa comandos e integra o controle de versão do Git por meio de comandos de linguagem natural.
4 meses atrás
03.1K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: plataforma de produção de curso humano digital de código aberto, vídeo de palestra humana digital de clonagem de geração de PPT com um clique

Introdução abrangente O Easegen é uma plataforma de criação de cursos digitais humanos de código aberto que visa melhorar a eficiência da produção e do gerenciamento de conteúdo de ensino por meio da tecnologia de IA. A plataforma oferece uma solução completa, desde a produção do curso, o gerenciamento de vídeo até o questionamento inteligente, que permite aos usuários criar cursos digitais em vídeo com explicação humana...
10 meses atrás
03.1K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: interface de usuário nativa de aplicativo de bate-papo em tempo real baseada em Nuxt 3 e Ollama

Introdução abrangente O ChatOllama é um projeto de aplicativo de bate-papo on-line de código aberto baseado em um modelo de linguagem em grande escala (LLM), com suporte a vários modelos de linguagem e gerenciamento de base de conhecimento. Os usuários podem usar a plataforma para gerenciamento de modelos (exibição de lista, download, exclusão), bate-papo com modelos e outras funções. O projeto usa ...
10 meses atrás
03.1K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: ferramenta de IA para adicionar rabiscos artísticos a fotos com comandos de texto

Introdução geral O PhotoDoodle é uma ferramenta de edição de imagens de código aberto, desenvolvida pela ShowLab, com foco na edição artística de fotos por meio da tecnologia de inteligência artificial. Os usuários podem adicionar estilo de desenho animado, efeito 3D, luz a fotos reais apenas digitando instruções de texto simples...
5 meses atrás
03.1K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: um assistente de IA off-line executado em seu telefone, adaptado para o DeepSeek-R1 (5,37 GB)

Introdução geral O Pocket AI (PocketPal AI versão chinesa) é um poderoso assistente de IA off-line projetado para permitir que os usuários conversem com a IA a qualquer hora e em qualquer lugar. Ele se baseia em modelos de linguagem pequenos (SLMs) e é executado em telefones celulares sem conexão com a Internet, especialmente adaptado à experiência do usuário chinês. Boca...
6 meses atrás
03.1K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab: modelo de IA de reconhecimento de OCR dedicado, PDF para Markdown (código aberto/API)

Introdução abrangente O Datalab oferece uma variedade de modelos avançados de IA com foco em OCR, análise de layout, PDF para Markdown e muito mais. Esses modelos não são apenas de alto desempenho, mas também fáceis de usar e de código aberto. Os modelos Marker da plataforma podem ser usados com rapidez e precisão...
9 meses atrás
03.1K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式

CoAI.Dev (Chat Nio): solução completa de B/C para aplicativos de agregação de IA com faturamento flexível e suporte ao modelo de plano de assinatura

Introdução geral O CoAI.Dev (antigo Chat Nio) é uma plataforma de bate-papo que integra vários modelos de IA e oferece suporte a streaming distribuído, geração de imagens, sincronização e compartilhamento de conversas entre dispositivos. Ele implementa um sistema de faturamento de assinatura e token, serviço de trânsito de chaves e vários...
9 meses atrás
03.1K
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: ferramenta gratuita de código aberto para edição de síntese de músicas

Introdução geral O OpenUtau é uma plataforma gratuita e de código aberto de síntese e edição de músicas criada para oferecer à comunidade UTAU uma experiência de edição moderna. É o sucessor do software UTAU e resolve os problemas de compatibilidade e complexidade do software original.O OpenUtau é compatível com o Wind...
4 meses atrás
03.1K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: cliente de diálogo de IA que suporta sessões simultâneas com vários bate-papos

Introdução geral O DeepChat é um projeto de assistente inteligente de código aberto desenvolvido pela equipe ThinkInAIXYZ no GitHub. Seu objetivo é conectar os usuários ao mundo digital por meio de uma poderosa tecnologia de IA para proporcionar uma experiência de bate-papo eficiente e natural. Ele é compatível com o Win...
5 meses atrás
03.1K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.: assistente de código inteligente com reconhecimento de contexto, geração e modificação de código, suporte a vários IDEs

Introdução geral O J.A.R.V.I.S. (Just A Rather Very Intelligent System) é um assistente de código inteligente projetado para ajudar os desenvolvedores na geração de código, modificação e discussões técnicas usando vários modelos de linguagem de última geração...
7 meses atrás
03.1K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): projeto de código aberto que imita o Perplexity, integrando diálogo de IA, pesquisa na Web, consulta meteorológica etc.

Introdução geral O MiniPerplx (renomeado como Scira) é um mecanismo de busca orientado por IA com design minimalista que integra uma variedade de recursos úteis para fornecer aos usuários uma gama completa de serviços de recuperação de informações. O projeto usa uma pilha de tecnologia moderna, incluindo Next.js, Tailwi...
7 meses atrás
03.1K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML: Crie facilmente e-mails responsivos e gere rapidamente e-mails de marketing com o ChatGPT

Introdução geral O MJML (Mail Junction Markup Language) é uma estrutura de código aberto desenvolvida pela equipe do Mailjet para simplificar a criação de modelos de e-mail responsivos. Por meio da linguagem de marcação semântica e de uma rica biblioteca de componentes, os desenvolvedores podem usar menos código para criar com eficiência e-mails bonitos e eficientes...
12 meses atrás
03.1K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: um kit de ferramentas para criar rapidamente interfaces de bate-papo de IA com suporte para integração de modelos e gerenciamento de fluxo de dados.

Introdução abrangente O Ant Design X é um kit de ferramentas de código aberto do Ant Group, projetado para ajudar os desenvolvedores a criar rapidamente interfaces de diálogo orientadas por IA. Ele oferece um rico conjunto de componentes e modelos, suporta a integração de modelos compatível com os padrões OpenAI e é adequado para uma variedade de aplicativos, como atendimento inteligente ao cliente, assistentes de IA e outros...
9 meses atrás
03.1K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicativo da Intelligentsia para controle de computadores usando linguagem natural

Introdução geral O UI-TARS Desktop é um aplicativo de agente de interface gráfica baseado no UI-TARS (Visual Language Model) desenvolvido pela ByteDance. O aplicativo permite que os usuários controlem computadores por meio de linguagem natural para uma interação homem-computador mais intuitiva e eficiente.
7 meses atrás
03.1K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: uma GUI da Web para interagir com todos os modelos e APIs do OpenAI

Introdução geral O Ortlin é uma interface gráfica de usuário baseada na Web, projetada para ajudar qualquer pessoa, tanto usuários técnicos quanto não técnicos, a interagir facilmente com as APIs e os modelos subjacentes da OpenAI. Ele é totalmente gratuito e de código aberto, permitindo que os usuários aproveitem o OpenAI de forma descomplicada...
10 meses atrás
03.1K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

WebUI de conversão de voz com base em recuperação: uma estrutura para conversão de voz com base em recuperação e simulação de vozes cantadas na vida real

O Comprehensive Introduction Retrieval based Voice Conversion WebUI é uma estrutura de conversão de voz baseada em VITS fácil de usar que permite a conversão de voz entre quaisquer alto-falantes, inclusive covers de músicas e alterações de voz em tempo real. Ele tem baixo ...
10 meses atrás
03.1K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: Conversão sem perdas de PDF para HTML, mantendo a formatação do texto, adequada para trabalhos acadêmicos e composição de revistas

Introdução abrangente pdf2htmlEX é uma ferramenta de código aberto projetada para converter arquivos PDF para o formato HTML, analisando o conteúdo do arquivo PDF e usando HTML + CSS para restaurar com precisão seu efeito visual, o documento PDF será convertido em um navegador ...
9 meses atrás
03.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: gera vídeos detalhados e consistentes, ideais para a criação de comerciais com personagens e objetos detalhados.

Introdução abrangente O Goku é um modelo de geração de imagem e vídeo federado baseado em técnicas de transformação de fluxo projetadas para obter desempenho de nível industrial. Ele integra técnicas avançadas de geração visual de alta qualidade, incluindo agrupamento de dados de granularidade fina, design de modelo e formulação de transformação de fluxo.
6 meses atrás
03.1K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: uma estrutura para colaboração em clusters de inteligência múltipla

O Quantum Swarm é uma estrutura de inteligência artificial de código aberto voltada para o desenvolvimento e a pesquisa de inteligência populacional de IA. O projeto é mantido pela equipe da Quarm AI no GitHub e tem como objetivo fornecer uma plataforma flexível e eficiente para criar e testar sistemas de inteligência múltipla.
7 meses atrás
03.1K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: monitore as atividades do usuário do OpenWebUI, gerencie os limites de uso e ofereça suporte à implantação com um clique.

Introdução geral O OpenWebUI-Monitor é um painel de controle para monitorar as atividades dos usuários do OpenWebUI e gerenciar as cotas de uso. Ele permite definir cotas de usuários de forma eficiente, exibir dados de usuários e informações visuais em tempo real, além de oferecer suporte à implantação com um clique para facilitar o gerenciamento e o monitoramento de...
9 meses atrás
03.1K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk: Gere vídeos de conversação expressivos com uma única imagem de avatar!

DreamTalk Introdução abrangente O DreamTalk é uma estrutura de geração de cabeças falantes de expressão orientada por modelos de difusão desenvolvida em conjunto pela Universidade de Tsinghua, pelo Grupo Alibaba e pela Universidade de Ciência e Tecnologia de Huazhong. Ele consiste principalmente de três partes: uma rede de redução de ruído, um especialista em lábios com reconhecimento de estilo e um preditor de estilo, que pode ser baseado em...
8 meses atrás
03.1K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, conversão de imagem para Markdown, OCR de alta precisão de modelo visual

Introdução geral O Zerox é um projeto de código aberto desenvolvido para converter PDF, DOCX, imagens e outros documentos para o formato Markdown por meio de modelos visuais. O projeto foi desenvolvido pela equipe getomni-ai e oferece uma solução simples e eficiente de OCR (reconhecimento óptico de caracteres).
7 meses atrás
03K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: geração rápida de imagens de alta resolução, modelo de tamanho ultrapequeno de 0,6 B, operação de GPU de laptop de baixo perfil

Introdução geral O Sana é uma estrutura eficiente de geração de imagens de alta resolução desenvolvida pelo NVIDIA Labs, capaz de gerar imagens com resolução de até 4096 × 4096 em questão de segundos. O Sana emprega um transformador de difusão linear e uma tecnologia de autocodificador de compactação profunda para...
9 meses atrás
03K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API de extração de texto (text-extract-api): extração visual de informações de texto, ferramenta de extração de PDF anônimo

Introdução abrangente A API de extração de texto (text-extract-api) é uma ferramenta avançada projetada para extrair e analisar o conteúdo de vários formatos de documentos (por exemplo, PDF, Word, PPTX etc.). A API utiliza tecnologia de ponta de reconhecimento óptico de caracteres (OCR) e Ol...
7 meses atrás
03K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: uma plataforma de bate-papo de código aberto para interagir com personagens de IA personalizados

Introdução geral O Agnai Chat é uma plataforma de bate-papo de IA de código aberto que permite aos usuários criar personagens de IA personalizados para interação com um ou vários jogadores. Ele é compatível com uma ampla gama de serviços de IA, incluindo OpenAI, Claude, Kobold, etc., e é adequado para entretenimento, interpretação de papéis, educação ou...
4 meses atrás
03K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: Capture automaticamente notícias para gerar podcasts de áudio

Introdução geral O AI Podcast Generator é uma ferramenta inteligente de geração de podcast que usa tecnologia avançada de IA para criar automaticamente conteúdo de áudio envolvente a partir de fontes da Web. O sistema gera narrativas de fluxo natural capturando conteúdo de notícias e convertendo-o em podcasts de áudio. O projeto é baseado no Next...
9 meses atrás
03K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2: um modelo de linguagem visual especializado para compreensão multimodal avançada

Introdução abrangente O DeepSeek-VL2 é uma série de modelos avançados de linguagem visual Mixture-of-Experts (MoE) que melhoram significativamente o desempenho de seu antecessor, o DeepSeek-VL. Os modelos são úteis em perguntas e respostas visuais, reconhecimento óptico de caracteres,...
6 meses atrás
03K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: gerador de amostras zero de texto para vídeo lançado pela equipe de pesquisa de IA da Picsart

Introdução geral O Text2Video-Zero é uma implementação oficial de um gerador de texto para vídeo com amostra zero para o GitHub, desenvolvido pela equipe de pesquisa de IA da Picsart. O projeto oferece uma maneira de usar dicas de texto para gerar texto com consistência temporal e...
10 meses atrás
03K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): estrutura de geração de gestos de corpo inteiro, estrutura de animação 3D para gerar gestos de corpo inteiro a partir de áudio

Introdução abrangente O PantoMatrix é uma estrutura avançada de geração de gestos de corpo inteiro capaz de gerar movimentos humanos completos a partir de gestos parciais e de áudio, incluindo movimentos de rosto, corpo parcial, mão e corpo inteiro. A estrutura utiliza os mais recentes conjuntos de dados multimodais e técnicas de aprendizagem profunda para fornecer...
9 meses atrás
03K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: uma estrutura para criação e implementação rápidas de inteligências de IA por meio de linguagem natural

Introdução geral O AutoAgent é uma estrutura de inteligências de IA de código aberto desenvolvida pelo Laboratório de Inteligência de Dados da Universidade de Hong Kong (HKUDS) e hospedada no GitHub. Ele permite que os usuários criem e implementem rapidamente inteligências de IA personalizadas, descrevendo seus requisitos em linguagem puramente natural, sem qualquer base de programação...
2 meses atrás
03K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: ferramenta de animação para gerar retratos dinâmicos a partir de imagens estáticas e vídeos

Introdução geral O LivePortrait é uma ferramenta avançada de animação de retratos dinâmicos com IA desenvolvida pela Racer Technology. Ela utiliza a inovadora tecnologia de IA para transformar imagens estáticas em animações de vídeo vívidas. Independentemente de você usar fotos reais, estilos de animação ou retratos artísticos, o LivePo...
9 meses atrás
03K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: assistente de IA de análise de dados de conversação com acesso direto a respostas, consultas SQL e relatórios de análise

Introdução geral O WrenAI é um assistente de IA SQL de código aberto projetado especificamente para ajudar equipes de dados, equipes de produtos e equipes de negócios a obter insights de dados por meio de conversas em linguagem natural. Ele é capaz de converter a linguagem natural em consultas SQL, gerar gráficos, planilhas e relatórios, oferecer suporte a...
7 meses atrás
03K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: ferramenta de conversão de texto em fala multilíngue rápida e controlável (com suporte para mais de 7.000 idiomas)

Introdução geral O IMS Toucan é um kit de ferramentas de conversão de texto em fala (TTS) de última geração desenvolvido pelo Instituto de Processamento de Linguagem Natural (IMS) da Universidade de Stuttgart, Alemanha. O kit de ferramentas é compatível com mais de 7.000 idiomas e é rápido, controlável e tem baixos requisitos de recursos computacionais.
6 meses atrás
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: ferramenta inteligente de dublagem/tradução de vídeo multilíngue com IA

Introdução abrangente O Linly-Dubbing é uma ferramenta inteligente de tradução e dublagem multilíngue de IA projetada para oferecer aos usuários serviços de tradução de legendas e dublagem de vídeo multilíngue de alta qualidade por meio da integração de tecnologia avançada de IA. A ferramenta é especialmente adequada para educação internacional, localização de conteúdo global e outros cenários, ajudando...
7 meses atrás
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic: extração de informações estruturadas para tabelas complexas

O objetivo do reconhecimento de tabelas é analisar tabelas em imagens, identificar com precisão as estruturas das tabelas e os locais das células e reduzi-las a formatos de tabelas estruturadas (por exemplo, HTML). Na atual era da informação, uma grande quantidade de dados tabulares importantes ainda existe em um estado não estruturado (por exemplo, documentos digitalizados com imagens de tabelas estatísticas...).
5 meses atrás
03K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: um aplicativo de tradução de voz em tempo real para Android, gratuito e off-line!

Introdução geral O RTranslator é um aplicativo de tradução em tempo real off-line, gratuito e de código aberto, desenvolvido para dispositivos Android. Os usuários podem manter o telefone no bolso, conectando um fone de ouvido Bluetooth, e conversar com outras pessoas como se estivessem falando seu próprio idioma.
7 meses atrás
03K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

Paper Reviewer: gera automaticamente análises abrangentes de artigos do arXiv e as converte em postagens de blog

Introdução geral O Paper Reviewer é um projeto de código aberto desenvolvido para gerar revisões abrangentes de artigos do arXiv e transformá-las em publicações de blog. O projeto alimenta o site Hugging Face's Daily Papers, que automaticamente...
9 meses atrás
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine: Previsão da probabilidade de eventos futuros com base no conhecimento de pesquisa

Introdução geral O Forecast AI é uma excelente plataforma de previsão baseada em tecnologia avançada de inteligência artificial. Ela usa análises de dados poderosas e algoritmos de aprendizado de máquina para fornecer aos usuários previsões altamente precisas de eventos futuros. Quer se trate de eleições políticas, tendências econômicas ou eventos sociais, o Forecast ...
11 meses atrás
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: criando inteligências de IA com memória, conhecimento e ferramentas

Introdução abrangente O PhiData é uma estrutura projetada para desenvolver assistentes de IA inteligentes. Ele permite que os assistentes de IA se envolvam em conversas de longo prazo, forneçam contexto comercial preciso e realizem várias operações por meio de memória aprimorada, integração de conhecimento e recursos de invocação de ferramentas.
5 meses atrás
03K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

Microagente: inteligência de programação de IA que gera código automaticamente e o testa e corrige.

Introdução geral O Micro-Agent é um assistente de codificação de IA de código aberto desenvolvido pela Builder.io, projetado para fornecer aos desenvolvedores a capacidade de gerar e testar códigos automaticamente. Ele gera casos de teste compreendendo descrições de linguagem natural e itera o código até que todos os testes sejam aprovados, reduzindo, assim, o tempo de...
7 meses atrás
03K
Xorbits Inference:一键部署多种AI模型,分布式推理框架

Xorbits Inference: implantação com um clique de vários modelos de IA, uma estrutura de inferência distribuída

Introdução abrangente O Xorbits Inference (Xinference) é uma estrutura de inferência distribuída avançada e abrangente que oferece suporte à inferência para uma ampla variedade de modelos de IA, como modelos de linguagem ampla (LLMs), modelos de reconhecimento de fala e modelos multimodais. Com o Xorbits I...
11 meses atrás
03K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily: um assistente de IA para gerar atas de reuniões, transcrever e gerar resumos de reuniões em tempo real

Descrição geral O Meetily é um assistente de reunião com tecnologia de IA desenvolvido pela Zackriya Solutions que captura o áudio da reunião em tempo real, realiza a transcrição de voz e gera resumos da reunião. Ele é único, pois todo o processamento é feito localmente no dispositivo, garantindo a privacidade do usuário...
6 meses atrás
03K