Cercle de partage de l'IA

Le jour arche un pion et partage pour le roi !
Trackers:用于视频对象跟踪的开源工具库

Trackers : bibliothèque d'outils open source pour le suivi d'objets vidéo

Introduction générale Trackers est une bibliothèque d'outils Python open source axée sur le suivi d'objets multiples dans les vidéos. Elle intègre plusieurs algorithmes de suivi de premier plan, tels que SORT et DeepSORT, et permet aux utilisateurs de combiner différents modèles de détection d'objets (tels que YOLO...
Il y a 3 mois
02K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio : traitement audio open source et modèle de base de dialogue

Introduction générale Kimi-Audio est un modèle de base audio open source développé par Moonshot AI, qui se concentre sur la compréhension, la génération et le dialogue audio. Il prend en charge un large éventail de tâches de traitement audio telles que la reconnaissance vocale, les questions-réponses audio et la reconnaissance des émotions vocales. Le modèle a été testé sur plus de 130...
Il y a 3 mois
02.3K
Describe Anything:为图像和视频区域生成详细描述的开源工具

Describe Anything : un outil open source pour générer des descriptions détaillées d'images et de zones vidéo

Description générale Describe Anything est un projet open source développé par NVIDIA et plusieurs universités, dont le cœur est le modèle Describe Anything (DAM). Cet outil permet d'étiqueter des images ou des vidéos en fonction des...
Il y a 3 mois
02.3K
Cooragent:一句话构建多智能体任务协作工具

Cooragent : construire un outil de collaboration multi-intelligence en une seule phrase

Introduction générale Cooragent est un cadre de collaboration d'agents d'IA open source développé par LeapLab à l'Université de Tsinghua et hébergé sur GitHub. Il permet aux utilisateurs de créer des agents d'IA intelligents avec une description d'une phrase et supporte plusieurs agents pour collaborer sur des tâches complexes. Le cadre fournit deux...
Il y a 3 mois
02.3K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter : un outil open source pour générer des personnages cohérents à partir d'une seule image

Introduction générale InstantCharacter est un projet open source développé par Tencent Hunyuan et l'équipe InstantX, hébergé sur GitHub. Il génère des cartes de caractères cohérentes avec une image de référence et une description textuelle...
Il y a 3 mois
02.6K
Claude生成深度研究报告的MCP服务

Le service MCP de Claude pour la production de rapports de recherche approfondis

Introduction générale MCP Server Deep Research est un outil open source qui génère automatiquement des rapports de recherche structurés pour des problèmes complexes grâce à l'intelligence artificielle et à la recherche sur le web. Les utilisateurs saisissent une question de recherche, et l'outil décompose la question, recherche des informations faisant autorité, évalue la crédibilité de la source...
Il y a 3 mois
01.9K
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall : un outil open source qui fournit un cadre de mémoire de classe entreprise pour les grands modèles

Introduction complète Deep Recall est un cadre de mémoire open source de classe entreprise conçu pour les grands modèles de langage (LLM). Il offre une réactivité hyperpersonnalisée grâce à une récupération et une intégration contextuelles efficaces. Le cadre utilise une architecture à trois niveaux, comprenant un service de mémoire, un service de raisonnement et un coordinateur, qui prend en charge...
Il y a 3 mois
02.1K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee : un assistant de recherche IA open source génère des études de citations

Introduction générale CleverBee est un assistant de recherche en IA open source hébergé sur GitHub et développé par SureScaleAI. Il aide les utilisateurs en combinant la technologie de navigation web avec de grands modèles de langage (tels que Gemini et Claude)...
Il y a 3 mois
02.1K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking : un outil open source pour générer des portraits parlants réalistes

Introduction générale FantasyTalking est un projet open source développé par l'équipe Fantasy-AMAP, qui vise à générer des portraits vidéo parlants réalistes par le biais d'un lecteur audio. Le projet est basé sur le modèle de diffusion vidéo avancé Wan2.1 , combiné à l'encodeur audio Wa...
Il y a 3 mois
02.6K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code : Transformation automatique d'articles sur l'apprentissage automatique en code exécutable

Introduction générale Paper2Code est un projet open source qui vise à résoudre le problème du manque d'implémentations de code pour les articles sur l'apprentissage automatique. Il transforme automatiquement les articles scientifiques en référentiels de codes exécutables par le biais du système multi-agent de modélisation des grands langages (LLM) PaperCoder. Le système utilise la planification ...
Il y a 3 mois
02K