Projet open source sur l'IA

Total 1020 articles
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG : Générer des actifs numériques modélisés en 3D à haute résolution à partir d'une seule image

Introduction générale TripoSG est un projet open source développé par l'équipe de recherche VAST AI pour générer des modèles 3D de haute qualité à partir d'une seule image. Le projet utilise la technologie des convertisseurs redresseur-flux à grande échelle, combinée à une formation hybride supervisée et à des ensembles de données de haute qualité, pour permettre aux modèles 3D générés d'avoir...
il y a 5 mois
02.5K
Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。

Boîte de réception Zéro : Atteignez facilement le niveau zéro dans votre boîte de réception, avec l'aide de l'IA pour vous aider à catégoriser, filtrer et traiter vos e-mails.

Description générale Inbox Zero est une application open source de gestion des emails conçue pour aider les utilisateurs à atteindre rapidement la boîte de réception zéro grâce à un assistant IA. L'application offre une variété de fonctionnalités telles que la réponse automatique, l'archivage, l'étiquetage et le transfert d'emails, la gestion et le désabonnement aux lettres d'information, le blocage des...
Il y a 8 mois
02.4K
GraphAgent:构建知识图谱,自动化任务规划与执行

GraphAgent : construire des graphes de connaissances pour automatiser la planification et l'exécution des tâches

Introduction complète GraphAgent est un système automatisé intelligent qui intègre la génération de graphes, la planification et l'exécution de tâches. Il est capable de traiter des données structurées et non structurées, de construire des graphes de dépendance sémantique complexes et d'exécuter efficacement les tâches de l'utilisateur grâce à l'auto-planification et à l'adaptation des outils.
Il y a 7 mois
02.4K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat : dialogue vocal naturel à faible latence avec l'IA

Introduction générale RealtimeVoiceChat est un projet open source axé sur les conversations naturelles en temps réel avec l'intelligence artificielle par le biais de la voix. Les utilisateurs utilisent un microphone pour saisir leur voix, et le système capture l'audio via un navigateur, le convertit rapidement en texte, et un grand modèle de langage (LLM) génère...
Il y a 3 mois
02.4K
Dia:生成超现实多人对话的文本转语音模型

Dia : un modèle de synthèse vocale pour générer des dialogues multijoueurs hyperréalistes

Introduction générale Dia est un modèle de synthèse vocale open source développé par Nari Labs et destiné à générer des dialogues audio hyperréalistes. Il transforme les scripts textuels en dialogues réalistes à plusieurs personnages en un seul processus, prend en charge le contrôle des émotions et de l'intonation, et génère même des représentations non verbales...
Il y a 4 mois
02.4K
茴香豆:基于LLM(大型语言模型) 的群聊助手

Fennel Bean : assistant de chat de groupe basé sur le LLM (Large Language Model)

Introduction détaillée HuixiangDou est un assistant de chat de groupe basé sur un modèle de langage à grande échelle (LLM) conçu pour faire face aux scénarios de chat de groupe grâce à un processus de prétraitement, de rejet et de réponse en trois étapes. Il est capable de répondre aux questions des utilisateurs sans provoquer d'inondation d'informations. Le projet fournit un ...
Il y a 6 mois
02.4K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent : Générer des vidéos d'explications mathématiques animées de plus de 5 minutes avec Manim

Introduction générale TheoremExplainAgent est un projet innovant développé par TIGER AI Lab pour transformer des théorèmes mathématiques et scientifiques complexes en animations vidéo faciles à comprendre en utilisant des techniques d'intelligence artificielle. L'outil est basé sur le Large Language Model (LLM)...
Il y a 6 mois
02.4K
Trackers:用于视频对象跟踪的开源工具库

Trackers : bibliothèque d'outils open source pour le suivi d'objets vidéo

Introduction générale Trackers est une bibliothèque d'outils Python open source axée sur le suivi d'objets multiples dans les vidéos. Elle intègre plusieurs algorithmes de suivi de premier plan, tels que SORT et DeepSORT, et permet aux utilisateurs de combiner différents modèles de détection d'objets (tels que YOLO...
Il y a 3 mois
02.4K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research : un assistant de recherche approfondie basé sur l'IA fournissant des outils de recherche efficaces et des capacités de génération de rapports.

Introduction générale Deep Research est un assistant de recherche basé sur l'IA conçu pour effectuer une recherche approfondie itérative en combinant les moteurs de recherche, l'exploration du Web et les grands modèles de langage. Le projet a été publié par dzhng sur GitHub dans le but de fournir un générateur de recherche...
Il y a 4 mois
02.4K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2 : outil de génération de modèles 3D haute résolution open source de Tencent

Introduction générale Hunyuan3D-2 est un projet open source développé par Tencent pour générer des modèles 3D haute résolution à partir de textes ou d'images. Il se compose de deux éléments principaux : le modèle de génération de formes (Hunyuan3D-DiT) et le modèle de génération de textures (Hunyuan3D...
il y a 5 mois
02.4K
CoT-Lab:探索人机协作迭代思考的实验性对话工具

CoT-Lab : un outil de dialogue expérimental pour explorer la réflexion itérative sur la collaboration homme-machine

CoT-Lab est une interface expérimentale permettant d'explorer de nouveaux paradigmes de collaboration entre l'homme et l'ordinateur. Basé sur la théorie de la charge cognitive et les principes de l'apprentissage actif, CoT-Lab facilite l'alignement cognitif profond entre les humains et l'intelligence artificielle (IA) à travers la création de relations de "partenaires de réflexion". Le projet vise à...
Il y a 6 mois
02.4K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher : IA de conduite basée sur l'apprentissage par renforcement pour étudier les problèmes complexes

Introduction complète DeepResearcher est un projet open source développé par l'équipe GAIR-NLP de l'Université Jiao Tong de Shanghai. Il s'agit d'un outil de recherche intelligent basé sur de grands modèles de langage (LLM), formés de bout en bout dans des environnements Web réels grâce à l'apprentissage par renforcement (RL). Le projet ...
Il y a 4 mois
02.4K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT : un grand modèle multimodal pour la compréhension des régions d'images et de vidéos afin d'améliorer l'analyse du contenu visuel

Introduction complète Omni-RGPT est un modèle de langage multimodal à grande échelle conçu pour permettre la compréhension des images et des vidéos au niveau de la région. En introduisant la technique de la marque de jeton, Omni-RGPT est capable de mettre en évidence des régions cibles dans l'espace des caractéristiques visuelles avec des...
Il y a 7 mois
02.4K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver : génère automatiquement des documents Markdown à partir de la structure et du contenu du code.

Introduction générale CodeWeaver est un outil en ligne de commande conçu pour tisser des bibliothèques de code dans des documents Markdown uniques et faciles à naviguer. Il génère une représentation structurée de la hiérarchie des fichiers d'un projet en analysant récursivement les répertoires et en intégrant le contenu de chaque fichier dans des blocs de code. Cet outil...
Il y a 6 mois
02.4K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror : déploiement en un clic de sites miroirs Grok rentables

Introduction complète Grok-Mirror est une station miroir domestique Grok3 à déploiement rapide sans serveur, basée sur la construction d'une station miroir Grok opérationnelle. Elle permet aux utilisateurs de déployer des kiosques Grok locaux en un seul clic via Docker.Grok est une intelligence artificielle de xAI...
il y a 5 mois
02.4K
自动解析PDF内容并提取文字与表格的开源服务

Analyse automatique du contenu des PDF et extraction du texte et des tableaux des services open source

Introduction complète Il analyse automatiquement la mise en page des documents PDF, identifie le texte, les titres, les images, les tableaux, les formules et autres éléments de la page, et détermine leur ordre correct. L'outil prend en charge la fonctionnalité OCR et peut convertir les PDF numérisés en texte consultable. Il fonctionne sur Docker et fournit deux modèles...
Il y a 4 mois
02.4K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo : un outil open source pour segmenter automatiquement des objets arbitraires en mouvement à partir d'une vidéo

Introduction générale SegAnyMo est un projet open source développé par une équipe de chercheurs de l'UC Berkeley et de l'Université de Pékin, comprenant des membres tels que Nan Huang. Cet outil se concentre sur le traitement vidéo et peut automatiquement identifier et segmenter des objets arbitraires en mouvement dans une vidéo, tels que des personnes, des animaux ou...
Il y a 4 mois
02.4K
Local Deep Research:本地运行的生成深度研究报告工具

Local Deep Research : un outil géré localement pour générer des rapports de recherche approfondis

Introduction générale Local Deep Research est un assistant de recherche IA open source conçu pour aider les utilisateurs à mener des recherches approfondies et à générer des rapports détaillés sur des problèmes complexes. Il prend en charge l'exécution locale, ce qui permet aux utilisateurs d'effectuer des tâches de recherche sans dépendre de services en nuage. L'outil ...
Il y a 3 mois
02.4K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V : Un modèle graphique hybride de raisonnement multimodal Open Source par Kunlun Wanwen

Introduction générale Skywork-R1V est un modèle de raisonnement multimodal open source développé par l'équipe SkyworkAI (Kunlun Wanwei) et publié sur GitHub. Il est capable de traiter des images et du texte simultanément, d'effectuer un raisonnement logique en plusieurs étapes, et est particulièrement performant pour analyser des problèmes d'images complexes. Cette...
il y a 5 mois
02.4K
AI Logo:AI快速生成定制化品牌Logo

AI Logo : l'IA génère rapidement des logos de marque personnalisés

Introduction générale AI Logo est un projet d'application d'IA open source dont l'objectif est d'aider les utilisateurs à générer rapidement des logos de marque personnalisés grâce à l'intelligence artificielle. Il combine des techniques d'IA puissantes telles que la diffusion stable et la DeepAI pour permettre aux utilisateurs d'entrer de simples...
il y a 5 mois
02.4K
Zev:用自然语言快速查询终端命令的CLI工具

Zev : un outil CLI pour l'interrogation rapide des commandes de terminal en langage naturel

Introduction générale Zev est un outil d'interface de ligne de commande (CLI) facile à utiliser qui permet aux utilisateurs d'interroger et de générer rapidement des commandes de terminal en langage naturel. Au lieu d'avoir à mémoriser une syntaxe de commande complexe, Zev génère des commandes de terminal en décrivant vos besoins en langage courant. Basé sur Ope...
Il y a 4 mois
02.4K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser : captures d'écran de l'interface utilisateur analysées en éléments structurés pour faciliter la compréhension et la manipulation de grands modèles.

Introduction générale OmniParser est un outil développé par Microsoft pour analyser les captures d'écran de l'interface utilisateur en éléments structurés et faciles à comprendre. Cet outil améliore considérablement la capacité de GPT-4V à générer des actions précises dans la zone d'interface correspondante. Cet outil améliore considérablement la capacité de GPT-4V à générer des actions précises dans la zone d'interface correspondante....
Il y a 6 mois
02.4K
CogView4:生成中英双语高清图片的开源文生图模型

CogView4 : un modèle graphique open source pour la génération d'images haute définition bilingues en chinois et en anglais

Introduction générale CogView4 est un modèle texte-graphe open source développé par le KEG Lab (THUDM) de l'Université de Tsinghua, qui se concentre sur la conversion de descriptions textuelles en images de haute qualité. Il prend en charge l'entrée de mots repères bilingues et est particulièrement efficace pour comprendre les repères chinois et générer des images avec des caractères chinois, des...
il y a 5 mois
02.4K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN Chinese Podcast : saisie automatique d'articles technologiques populaires, l'IA génère des résumés en chinois et les convertit en podcasts.

Introduction générale Le projet de podcast chinois de Hacker News est une plateforme innovante basée sur la technologie de l'IA, visant à saisir automatiquement les articles populaires de Hacker News chaque jour et à générer des résumés en chinois et du contenu de podcast grâce à l'IA. Le projet est dirigé par ccbikai ...
Il y a 6 mois
02.4K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit : un outil open source pour l'édition d'images avec des instructions en langage naturel

Introduction générale Step1X-Edit est un outil d'édition d'images open source développé par l'équipe Stepfun AI et hébergé sur GitHub. Il combine un modèle de langage large multimodal (Qwen-VL) et un transformateur de diffusion (DiT) pour permettre aux utilisateurs de créer des images par le biais d'un...
Il y a 3 mois
02.4K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL : un outil open source pour transformer le langage naturel en requêtes SQL

Introduction complète OpenSearch-SQL est un projet open source, c'est un puissant outil Text-to-SQL qui peut transformer les descriptions en langage naturel de l'utilisateur en instructions de requête SQL, afin d'aider les personnes qui ne sont pas familières avec la base de données à accéder facilement aux données. Ce projet a été développé par O...
il y a 5 mois
02.4K
MegaPairs:BGE新推出的多模态向量嵌入模型

MegaPairs : un nouveau modèle d'intégration de vecteurs multimodaux de BGE

Introduction complète MegaPairs est un projet open source sur GitHub de l'équipe VectorSpaceLab visant à générer des modèles d'intégration multimodaux pour les tâches de recherche d'images et de textes à l'aide de techniques de synthèse de données à grande échelle. Le projet est basé sur plus de 26 millions de données hétérogènes ...
il y a 5 mois
02.4K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPT Researcher : Générer des rapports de recherche complets et détaillés en utilisant des données locales et en ligne

Introduction complète GPT Researcher est un agent autonome basé sur le Large Language Model (LLM) conçu pour effectuer des recherches locales et sur le web et pour générer des rapports de recherche détaillés. L'outil offre des performances stables et une vitesse plus rapide en parallélisant le travail de l'agent, ce qui garantit la précision des informations...
Il y a 4 mois
02.4K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave : permettre aux applications d'intégrer rapidement des bases de connaissances pour une recherche intelligente

Introduction générale Airweave est un outil open source conçu pour rendre n'importe quelle application consultable en synchronisant les données de l'application de l'utilisateur, les API, les bases de données et les sites Web avec des bases de données graphiques et vectorielles....
Il y a 6 mois
02.4K
Plandex:支持超长上下文的开源AI编码助手

Plandex : un assistant de codage IA open source prenant en charge les contextes ultra-longs

Introduction générale Plandex est un assistant de codage IA open source de bout en bout conçu pour les projets logiciels complexes et de grande envergure. Il peut planifier et exécuter des tâches en plusieurs étapes, gérer des contextes allant jusqu'à 2 millions de jetons et prendre en charge plus de 30 langages de programmation....
Il y a 4 mois
02.3K
Story-Flicks:输入主题自动生成儿童短故事视频

Story-Flicks : saisie de sujets pour générer automatiquement des vidéos d'histoires courtes pour enfants

Introduction Story-Flicks est un outil d'IA open source qui aide les utilisateurs à générer rapidement des vidéos HD. Les utilisateurs n'ont qu'à saisir un sujet d'histoire, et le système génère le contenu de l'histoire à l'aide d'un modèle de langage étendu, et combine les images, le son et les sous-titres générés par l'IA pour produire une vidéo complète...
il y a 5 mois
02.3K
Paper to Podcast:把学术论文转换为多人对话播客

Du papier au podcast : convertir des documents académiques en podcasts de conversation à plusieurs personnes

Introduction générale Paper to Podcast est un outil open source spécialisé dans la transformation de documents de recherche académique en podcasts vivants et divertissants. Il utilise une technologie d'intelligence artificielle pour transformer un document au format PDF en un dialogue entre trois personnages - l'hôte, l'apprenant et l'expert - afin de rendre...
Il y a 4 mois
02.3K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ : un outil open source pour la connexion et la gestion flexibles d'intelligences IA

Introduction générale AgentIQ est un outil open source de NVIDIA conçu pour aider les développeurs à connecter et gérer efficacement les intelligences IA. Il permet aux intelligences issues de différents cadres de collaborer de manière transparente, de connecter des données et des outils d'entreprise et de créer des flux de travail tels que des fonctions d'appel. Le plus grand...
il y a 5 mois
02.3K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO : Prise en charge des outils de génération d'images personnalisées à sujet unique et à sujets multiples (adaptés aux graphiques de commerce électronique)

UNO est un cadre de génération d'images open source développé par l'équipe de création intelligente ByteDance. Il est basé sur le modèle FLUX.1 et se concentre sur la génération d'images personnalisées à sujet unique et multi-sujets par le biais d'une approche de généralisation...
Il y a 4 mois
02.3K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架

PrimisAI Nexus : un cadre léger pour la construction de systèmes évolutifs d'intelligence artificielle multiple et d'automatisation des tâches

Introduction générale PrimisAI Nexus est un framework Python léger et open-source hébergé sur GitHub et développé par l'équipe PrimisAI, visant à aider les utilisateurs à construire et à gérer des systèmes de corps multi-intelligents évolutifs grâce à la modélisation du grand langage (LLM), permettant...
il y a 5 mois
02.3K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot : un cadre open source pour exécuter efficacement des tâches d'IA et de traitement par lots dans n'importe quel nuage.

Introduction générale SkyPilot est un framework open source initié par le Sky Computing Lab de l'Université de Californie, Berkeley, conçu pour aider les utilisateurs à exécuter efficacement des tâches d'intelligence artificielle et de traitement par lots sur n'importe quelle infrastructure en nuage. Il prend en charge plus de 14 services en nuage (dont ...
Il y a 6 mois
02.3K
Shandu:多轮收集分析信息的AI研究自动化工具

Shandu : un outil d'automatisation de la recherche en IA pour la collecte et l'analyse d'informations en plusieurs étapes

Introduction générale Shandu est un système de recherche open source basé sur l'intelligence artificielle, hébergé sur GitHub et créé par le développeur jolovicdev. Il utilise les technologies LangChain et LangGraph et vise à fournir des informations automatisées, complètes et...
Il y a 4 mois
02.3K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流

Fast-Agent : grammaire déclarative et intégration MCP pour la construction rapide de flux de travail multi-intelligents pour le corps humain

Introduction générale Fast-Agent est un outil open source maintenu par l'équipe evalstate sur GitHub, conçu pour aider les développeurs à définir, tester et construire rapidement des workflows de multi-intelligence. Il est basé sur une syntaxe déclarative simple, et supporte l'utilisation de MCP (Mode...
il y a 5 mois
02.3K
Onyx:连接企业知识库的智能AI聊天平台

Onyx : une plateforme de chat intelligente qui connecte les bases de connaissances des entreprises

Introduction générale Onyx (anciennement connu sous le nom de Danswer) est une plateforme de chat IA open source développée par l'équipe onyx-dot-app pour aider les organisations à intégrer et à gérer les documents, les applications et les données des employés. Elle offre de riches fonctionnalités de chat et permet de connecter n'importe quel modèle...
il y a 5 mois
02.3K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan : embellir les articles Markdown en un clic, s'adapter à de multiples formats de plates-formes multimédia (client local open source)

Introduction WenYan est un outil conçu pour la composition et l'embellissement d'articles en Markdown. Il permet de convertir des articles édités en Markdown dans un format adapté à WeChat, Zhihu, Today's headlines et d'autres plates-formes. Les utilisateurs peuvent copier l'article en un seul clic, l'article...
Il y a 7 mois
02.3K
Together Open Deep Research:生成带索引的深度研究报告

Together Open Deep Research : Générer des rapports de recherche approfondie indexés

Introduction générale Open Deep Research est un outil de recherche approfondie développé et open source par l'équipe Together AI et hébergé sur GitHub. Il simule le processus de recherche humain par le biais d'un flux de travail d'IA multi-agents, générant des rapports de recherche détaillés...
Il y a 4 mois
02.3K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou : un outil de génération et d'édition de photos qui préserve les traits du visage

Introduction générale InfiniteYou est un projet open source développé par l'équipe de création intelligente ByteDance. Il est basé sur la technologie des transformateurs de diffusion (DiTs), utilisant le modèle FLUX.1-dev. La fonction principale est de permettre aux utilisateurs de télécharger une photo et d'entrer une description textuelle, générant ainsi...
il y a 5 mois
02.3K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor : un assistant d'enseignement intelligent qui fournit des conseils de programmation personnalisés

Introduction générale Coding-Tutor est un projet open source hébergé sur GitHub et créé par le développeur iwangjian pour fournir aux apprenants une expérience d'enseignement de la programmation personnalisée. Il utilise la technologie de l'IA conversationnelle pour apprendre en fonction des connaissances de l'utilisateur et...
Il y a 6 mois
02.3K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor : un outil d'IA pour aider à la lecture et à l'analyse d'articles académiques

Introduction générale Mad Professor (Grumpy Professor Reads Papers) est un outil académique d'IA open source conçu pour les chercheurs et les étudiants afin de simplifier la lecture et l'analyse d'articles académiques. Il intègre le traitement des PDF, la traduction IA, la recherche RAG, les questions IA...
Il y a 3 mois
02.3K
GAG:利用大模型模拟人类行为生成社交关系图谱

GAG : Génération d'un graphe de relations sociales à l'aide d'un grand modèle pour simuler le comportement humain

Introduction générale GraphAgent est un framework open source hébergé sur GitHub et développé par Ji-Cather. Il utilise le Large Language Model (LLM) pour simuler le comportement humain et générer des graphes sociaux dynamiques avec des attributs textuels. Cet outil est adapté aux médias sociaux en ligne...
il y a 5 mois
02.3K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice : une interface graphique de synthèse vocale basée sur des API de flux au silicium

Introduction générale Text2Voice est un outil open source qui fournit une fonctionnalité de synthèse vocale basée sur une API de mobilité au silicium, avec une interface utilisateur graphique (GUI) propre comme sa meilleure caractéristique. Il a été créé par le développeur Sheldon Lee sur GitHub pour permettre...
Il y a 4 mois
02.3K
Deep Searcher:企业私有文档高效检索与智能问答

Deep Searcher : extraction efficace de documents privés d'entreprise et questions-réponses intelligentes

Description générale Deep Searcher est un outil qui combine de puissants modèles de langage (tels que DeepSeek et OpenAI) et des bases de données vectorielles (telles que Milvus) conçus pour rechercher, évaluer et raisonner sur la base de données privées, en fournissant des réponses très précises....
Il y a 6 mois
02.3K
VOP:提取复杂图表与数学公式的OCR工具

VOP : outil d'OCR pour l'extraction de diagrammes complexes et de formules mathématiques

Introduction complète Versatile OCR Program est un outil de reconnaissance optique de caractères (OCR) open source conçu pour travailler avec des documents académiques et éducatifs complexes. Il peut extraire du texte, des tableaux, des formules mathématiques, des diagrammes et des schémas à partir de PDF, d'images et d'autres documents et générer...
Il y a 4 mois
02.3K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni : un macromodèle multimodal pour l'analyse des émotions et des actions des vidéos humaines

Introduction générale HumanOmni est un grand modèle multimodal open source développé par l'équipe HumanMLLM et hébergé sur GitHub. Il se concentre sur l'analyse de vidéos humaines et peut traiter à la fois l'image et le son pour aider à comprendre les émotions, les actions et le contenu du dialogue. Le projet a utilisé 2...
il y a 5 mois
02.3K
OpenDeepSearch:支持智能推理的开源搜索工具

OpenDeepSearch : un outil de recherche open source qui prend en charge le raisonnement intelligent

Introduction générale OpenDeepSearch est un outil de recherche open source développé par l'équipe sentient-agi. Il combine la modélisation des grands langages (LLM) et les agents de raisonnement intelligents pour permettre aux utilisateurs de rechercher des informations sur des pages web et d'obtenir des réponses précises de manière simple. Ce ...
il y a 5 mois
02.3K
TestDriver:使用AI自动测试软件的智能工具

TestDriver : un outil intelligent pour automatiser les tests de logiciels à l'aide de l'IA

Introduction générale TestDriver est un site web qui utilise la technologie de l'intelligence artificielle pour aider les développeurs à tester les logiciels. Il automatise la tâche de test des logiciels en simulant des actions humaines, telles que cliquer sur une souris ou taper du texte. Au cœur du site se trouve un "ordinateur utilisant un agent d'intelligence artificielle" qui fonctionne comme une personne réelle...
Il y a 4 mois
02.3K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD : cadre open source pour la génération de vidéos de scènes 3D et 4D arbitraires

Introduction générale GenXD est un projet open source, développé par l'Université nationale de Singapour (NUS) et l'équipe de Microsoft. Il se concentre sur la génération de scènes 3D et 4D arbitraires, afin de résoudre le problème de la génération de scènes 3D et 4D dans le monde réel en raison de l'insuffisance des données et de la complexité de la conception du modèle. Le projet a été développé par ...
Il y a 4 mois
02.3K
Abogen:将多种文本格式转换为有声读物的工具

Abogen : un outil pour convertir de multiples formats de texte en livres audio

Introduction générale Abogen est un outil open source conçu pour convertir rapidement des fichiers ePub, PDF ou texte en audio de haute qualité. Il utilise le modèle Kokoro-82M pour générer une parole naturelle et fluide, et prend en charge la génération simultanée de sous-titres, ce qui convient à la production de livres audio...
Il y a 3 mois
02.3K
InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型

InternLM-XComposer : un macromodèle multimodal pour l'édition de textes très longs et la compréhension d'images et de vidéos

Introduction complète InternLM-XComposer est un projet de grand modèle graphique multimodal open source développé par l'équipe InternLM et hébergé sur GitHub. Il est basé sur le modèle de langage InternLM, et est capable de gérer des textes multimodaux, des images, des vidéos et d'autres...
Il y a 6 mois
02.3K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus : un système de gestion sur site pour Dify

Introduction complète Dify-Plus est une plateforme de développement d'applications d'IA basée sur le développement secondaire du projet open source Dify. Elle ajoute un nouveau centre de gestion basé sur Dify et optimise la fonctionnalité pour les scénarios d'entreprise. Le projet était initialement destiné à un usage interne par les entreprises, et a ensuite constaté que la communauté avait des besoins similaires, il...
il y a 5 mois
02.2K
OneLine:生成热点事件时间轴的AI工具

OneLine : un outil d'IA pour générer des chronologies d'événements brûlants

Introduction générale OneLine est un outil open source de génération de chronologie d'événements hébergé sur GitHub et développé par l'utilisateur chengtx809. Il génère rapidement une chronologie d'événements à partir de mots-clés entrés par l'utilisateur, en affichant l'heure, le titre, la description et les personnes liées à l'événement...
Il y a 4 mois
02.2K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen : amélioration des modèles de langage à l'aide de graphes de connaissances pour générer des données synthétiques

Introduction complète GraphGen est un framework open source développé par OpenScienceLab, un laboratoire d'IA à Shanghai, hébergé sur GitHub, axé sur l'optimisation de la mise au point supervisée des grands modèles de langage (LLM) en guidant la génération de données synthétiques par le biais de graphes de connaissances. Il a été développé à partir de ...
Il y a 3 mois
02.2K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V : 1 heure d'entraînement de 26M modèles paramétriques de langage visuel

Introduction générale MiniMind-V est un projet open source, hébergé sur GitHub, conçu pour aider les utilisateurs à entraîner un modèle de langage visuel léger (VLM) avec seulement 26 millions de paramètres en moins d'une heure. Il est basé sur le modèle de langage MiniMind, avec de nouvelles...
Il y a 4 mois
02.2K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin : Reconnaissance des langues asiatiques et modélisation de la parole vers le texte pour les langues asiatiques

Introduction complète Dolphin est un modèle open source développé par DataoceanAI et l'université de Tsinghua, qui se concentre sur la reconnaissance vocale et linguistique pour les langues asiatiques. Il prend en charge 40 langues d'Asie de l'Est, d'Asie du Sud, d'Asie du Sud-Est et du Moyen-Orient, ainsi que 22 dialectes chinois...
Il y a 4 mois
02.2K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

Chercheur d'entreprise : outil de recherche d'entreprise, saisissez l'adresse web d'une entreprise pour obtenir des informations de recherche détaillées.

Description générale Company Researcher (Company Researcher) est un outil gratuit et open source conçu pour aider les utilisateurs à obtenir une vue d'ensemble rapide et complète de n'importe quelle entreprise. Il suffit d'entrer l'URL de l'entreprise et l'outil rassemblera des informations complètes sur le web, présentant des informations sur l'organisation, ses produits...
Il y a 4 mois
02.2K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone : un outil pour générer des vidéos de portraits humains numériques à mi-corps à partir de photographies

Introduction générale ChatAnyone est un projet innovant développé par l'équipe HumanAIGC. Il utilise des techniques d'intelligence artificielle pour générer des vidéos de portraits humains numériques avec des mouvements du haut du corps à partir d'une seule photo et d'une entrée audio. Le projet est basé sur un modèle de diffusion de mouvement hiérarchique qui génère des mouvements de tête...
Il y a 4 mois
02.2K
Orchestra : Création d'équipes d'IA intelligentes pour un développement collaboratif multi-intelligence plus facile et plus efficace

Orchestra : Création d'équipes d'IA intelligentes pour un développement collaboratif multi-intelligence plus facile et plus efficace

Orchestra est un framework Python innovant et léger qui se concentre sur la construction de systèmes collaboratifs multi-intelligences basés sur le Large Language Model (LLM). Il utilise une méthode unique d'organisation des intelligences afin que plusieurs intelligences IA puissent travailler en harmonie comme dans un orchestre symphonique. En modélisant ...
Il y a 7 mois
02.2K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

OpenHealthForAll : assistant IA pour la gestion des données de santé personnelles, téléchargement de rapports d'examen pour un plan de santé personnalisé

Introduction générale OpenHealthForAll est un projet open source conçu pour aider les utilisateurs à gérer et à comprendre leurs données de santé personnelles. En s'appuyant sur la technologie de l'intelligence artificielle, OpenHealthForAll fournit un assistant de santé local pour aider les utilisateurs à mieux gérer...
Il y a 6 mois
02.2K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT : un projet open source pour créer et faire fonctionner des intelligences IA automatisées

Introduction générale AgentGPT est un projet open source développé par l'équipe Reworkd et hébergé sur GitHub, conçu pour permettre aux utilisateurs de créer, configurer et déployer de manière autonome des intelligences IA à travers un navigateur. Les utilisateurs définissent simplement un objectif, et AgentGPT peut...
il y a 5 mois
02.2K
Claude生成深度研究报告的MCP服务

Le service MCP de Claude pour la production de rapports de recherche approfondis

Introduction générale MCP Server Deep Research est un outil open source qui génère automatiquement des rapports de recherche structurés pour des problèmes complexes grâce à l'intelligence artificielle et à la recherche sur le web. Les utilisateurs saisissent une question de recherche, et l'outil décompose la question, recherche des informations faisant autorité, évalue la crédibilité de la source...
Il y a 3 mois
02.2K
LitServe:快速部署企业级通用AI模型推理服务

LitServe : déploiement rapide de services d'inférence de modèles d'IA polyvalents de niveau entreprise

Introduction complète LitServe est un moteur de service de modèle d'IA open source de Lightning AI, construit sur FastAPI, axé sur le déploiement rapide de services d'inférence pour les modèles d'IA à usage général. Il prend en charge des modèles allant des grands modèles de langage (LLM) aux modèles...
il y a 5 mois
02.2K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型

HunyuanVideoGP : un modèle hybride de génération vidéo avec prise en charge du fonctionnement des GPU bas de gamme

Introduction générale HunyuanVideoGP est un modèle de génération vidéo à grande échelle développé par DeepBeepMeep et conçu pour les utilisateurs de GPU bas de gamme. Le modèle est une version améliorée du modèle Hunyuan Video original, réduisant de manière significative les besoins en mémoire et en mémoire graphique...
Il y a 6 mois
02.2K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera : agrandissement d'images de toutes tailles, outils open source de déaliasing

Introduction générale Thera est un outil de super-résolution d'images open source développé par une équipe de l'ETH Zurich et de l'Université de Zurich. Il permet de zoomer des images basse résolution à des échelles arbitraires, telles que 2x, 3,14x ou même des multiples non entiers, et de mettre...
Il y a 4 mois
02.2K
混元Turbo S:腾讯推出的快思考大模型(开放申请)

Hybrid Turbo S : le grand modèle de Tencent pour penser vite (appel à candidatures)

Introduction complète Tencent Turbo S est une nouvelle génération du modèle de réflexion rapide développé par Tencent, qui a été lancé sur le site officiel de Tencent Cloud le 27 février 2025. Il se distingue des modèles traditionnels de réflexion lente (par exemple Deepseek R1, Hybrid T1) en ce qu'il peut réaliser la "seconde réponse", cracher...
il y a 5 mois
02.2K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI : des solutions efficaces pour la formation de modèles d'IA à grande échelle

Introduction ColossalAI est une plateforme open-source développée par HPC-AI Technologies, visant à fournir une solution efficace et rentable pour l'entraînement et l'inférence de modèles d'IA à grande échelle. En prenant en charge de multiples stratégies parallèles, une gestion hétérogène de la mémoire et une formation à précision mixte, ColossalAI...
Il y a 6 mois
02.2K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch : un outil de visualisation pour le suivi et l'optimisation des processus LLM basé sur le cadre DSPy

Introduction complète LangWatch est une plateforme complète conçue pour les opérations des grands modèles de langue (LLM), offrant des services de surveillance, d'analyse, d'évaluation, de gestion des ensembles de données et d'optimisation des indices. La plateforme est basée sur le cadre DSPy de l'Université de Stanford et est conçue pour aider les utilisateurs à mieux gérer et optimiser...
Il y a 7 mois
02.2K