Projeto de código aberto de IA

Total de 1020 artigos
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: ferramenta de globalização multilíngue para vídeo com tradução e dublagem em um clique

Introdução abrangente O KrillinAI é uma ferramenta de processamento de vídeo de código aberto que se concentra no uso da inteligência artificial para ajudar os usuários a traduzir vídeos e dublá-los automaticamente. Ela pode começar desde o download do vídeo até a geração do produto final adaptado a diferentes plataformas, e todo o processo é feito com apenas alguns cliques. Os desenvolvedores estão disponíveis no GitHub...
2 meses atrás
01.7K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: documentos PDF serão traduzidos para ferramentas bilíngues de código aberto

Introdução geral O BabelDOC é uma ferramenta de código aberto projetada para traduzir documentos PDF em um formato bilíngue. Ela foi desenvolvida pela equipe funstory-ai, hospedada no GitHub, atendendo principalmente à necessidade de lidar com usuários de documentos em idiomas estrangeiros, como pesquisadores ...
2 meses atrás
01.5K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas

Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a compreensão humana do vídeo...
2 meses atrás
01.2K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: orquestração de tarefas de vários modelos e encapsulamento em uma interface de API

Introdução geral O DeepGemini é um projeto de código aberto criado pelo desenvolvedor Thomas Sligter. É uma ferramenta de gerenciamento de IA que oferece suporte à orquestração de vários modelos. O principal recurso é a capacidade de combinar de forma flexível uma variedade de modelos de IA e, por meio da compatibilidade com o OpenAI, ...
2 meses atrás
01.2K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: uma ferramenta de código aberto para gerar vídeo com sincronização labial diretamente do áudio

Introdução geral O LatentSync é uma ferramenta de código aberto desenvolvida pela ByteDance e hospedada no GitHub. Ela aciona os movimentos labiais dos personagens em um vídeo diretamente pelo áudio, de modo que o formato da boca corresponda precisamente à voz. O projeto é baseado no Stable Di...
2 meses atrás
02.5K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

HeyGem: Produto de almofada de alfinetes humana digital Heygen de código aberto da Silicon Intelligence

Introdução geral O HeyGem é uma ferramenta de composição de vídeo totalmente off-line projetada para sistemas Windows, desenvolvida pela equipe do GuijiAI (Silicon Intelligence) e com código aberto no GitHub. Ele usa algoritmos avançados de IA para clonar com precisão a aparência e a voz do usuário...
2 meses atrás
02.8K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: reprodutor de vídeo que gera legendas em tempo real com tradução bilíngue

Introdução geral O LLPlayer é um reprodutor de mídia de código aberto para alunos de idiomas, hospedado no GitHub e criado pelo desenvolvedor umlx5h. Ele integra uma variedade de recursos úteis, como exibição de legendas bilíngues, legendas geradas automaticamente por IA, tradução em tempo real e pesquisa de palavras...
2 meses atrás
02.5K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: uma estrutura para criação e implementação rápidas de inteligências de IA por meio de linguagem natural

Introdução geral O AutoAgent é uma estrutura de inteligências de IA de código aberto desenvolvida pelo Laboratório de Inteligência de Dados da Universidade de Hong Kong (HKUDS) e hospedada no GitHub. Ele permite que os usuários criem e implementem rapidamente inteligências de IA personalizadas, descrevendo seus requisitos em linguagem puramente natural, sem qualquer base de programação...
2 meses atrás
01.5K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: Modelo de aprendizagem profunda para remoção rápida de fundo de imagens e vídeos

Introdução abrangente O BEN2 (Background Erase Network 2) é um modelo de aprendizagem profunda desenvolvido pela Prama LLC, projetado especificamente para remover automaticamente o plano de fundo de uma imagem e gerar uma imagem em primeiro plano. O modelo usa uma inovadora tecnologia Confiden...
2 meses atrás
02.1K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: uma estrutura de código aberto para executar inteligências de IA para navegar na Web, permitindo que a IA manipule automaticamente as páginas da Web

Introdução geral A interface do usuário da Web do Browser Use é um projeto inovador de código aberto que se concentra em fornecer aos agentes de IA recursos de interação com o navegador como uma ferramenta de interface gráfica. O projeto foi desenvolvido com base na estrutura principal do Browser Use, desenvolvida com o Gradio ...
2 meses atrás
02.8K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: ferramenta de tradução de IA que preserva a tipografia completa dos PDFs

Introdução abrangente O PDFMathTranslate é uma ferramenta de código aberto voltada para a tradução de artigos científicos. Os documentos PDF podem ser traduzidos na íntegra e gerar uma versão bilíngue. Ele usa tecnologia de IA para manter o layout completo do documento original, incluindo fórmulas, diagramas, índices e notas, suporte ...
2 meses atrás
03K