Projet open source sur l'IA

Total 1020 articles
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI : outil de globalisation multilingue pour la vidéo avec traduction et doublage en un clic

Introduction complète KrillinAI est un outil de traitement vidéo open source qui se concentre sur l'utilisation de l'intelligence artificielle pour aider les utilisateurs à traduire des vidéos et à les doubler automatiquement. Il peut commencer par le téléchargement de la vidéo, jusqu'à la génération du produit fini adapté à différentes plateformes, le tout en quelques clics. Les développeurs sont disponibles sur GitHub...
Il y a 2 mois
01.7K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind : projet open source de positionnement des vidéos en fonction de l'heure, du contenu et des questions-réponses

Introduction générale VideoMind est un outil d'IA multimodale open source qui se concentre sur l'inférence, les questions-réponses et la génération de résumés pour les vidéos de longue durée. Il a été développé par Ye Liu de l'Université polytechnique de Hong Kong et une équipe du Show Lab de l'Université nationale de Singapour. L'outil imite la compréhension humaine des vidéos...
Il y a 2 mois
01.2K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini : orchestration multi-modèle des tâches et encapsulation dans une interface API

Introduction générale DeepGemini est un projet open source créé par le développeur Thomas Sligter. Il s'agit d'un outil de gestion de l'IA qui prend en charge l'orchestration multi-modèle, dont la principale caractéristique est la capacité de combiner de manière flexible une variété de modèles d'IA, et grâce à l'OpenAI-compatible ...
Il y a 2 mois
01.2K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync : un outil open source pour générer des vidéos avec synchronisation labiale directement à partir de l'audio

Introduction générale LatentSync est un outil open source développé par ByteDance et hébergé sur GitHub. Il pilote les mouvements des lèvres des personnages d'une vidéo directement à travers l'audio, de sorte que la forme de la bouche corresponde précisément à la voix. Le projet est basé sur Stable Di...
Il y a 2 mois
02.5K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

HeyGem : le produit open source Heygen Digital Human Pincushion de Silicon Intelligence

Introduction générale HeyGem est un outil de composition vidéo entièrement hors ligne conçu pour les systèmes Windows, développé par l'équipe GuijiAI (Silicon Intelligence) et ouvert sur GitHub. Il utilise des algorithmes d'intelligence artificielle avancés pour cloner avec précision l'apparence et la voix de l'utilisateur...
Il y a 2 mois
02.8K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer : lecteur vidéo qui génère des sous-titres en temps réel avec traduction bilingue

Introduction générale LLPlayer est un lecteur multimédia open source pour les apprenants de langues, hébergé sur GitHub et créé par le développeur umlx5h. Il intègre une variété de fonctionnalités utiles telles que l'affichage des sous-titres bilingues, les sous-titres générés automatiquement par l'IA, la traduction en temps réel et la recherche de mots...
Il y a 2 mois
02.5K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent : un cadre pour la création et le déploiement rapides d'intelligences IA par le biais du langage naturel

Introduction générale AutoAgent est un framework d'intelligence artificielle open source développé par le Data Intelligence Laboratory de l'Université de Hong Kong (HKUDS) et hébergé sur GitHub. Il permet aux utilisateurs de créer et de déployer rapidement des intelligences artificielles personnalisées en décrivant leurs besoins en langage purement naturel, sans aucune base de programmation....
Il y a 2 mois
01.5K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2 : Modèle d'apprentissage profond pour la suppression rapide de l'arrière-plan dans les images et les vidéos

Introduction complète BEN2 (Background Erase Network 2) est un modèle d'apprentissage profond développé par Prama LLC spécifiquement conçu pour supprimer automatiquement l'arrière-plan d'une image et générer une image de premier plan. Le modèle utilise une méthode innovante de Confiden...
Il y a 2 mois
02.1K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI : un cadre open source pour l'exécution d'intelligences IA pour naviguer sur le web, permettant à l'IA de manipuler automatiquement les pages web.

Introduction générale Browser Use Web UI est un projet open source innovant visant à fournir aux agents d'intelligence artificielle des capacités d'interaction avec le navigateur en tant qu'outil d'interface graphique. Le projet s'appuie sur le framework browser-use core, construit avec Gradio ...
Il y a 2 mois
02.8K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate : outil de traduction IA qui préserve la typographie complète des PDF

Introduction complète PDFMathTranslate est un outil open source axé sur la traduction de documents scientifiques. Les documents PDF peuvent être traduits dans leur intégralité et générer une version bilingue. Il utilise la technologie de l'IA pour conserver la mise en page originale du document, y compris les formules, les diagrammes, les tables des matières et les notes, ...
Il y a 2 mois
03K