Projet open source sur l'IA

Total 1020 articles
Agent S:像人类一样操作电脑的开源智能体框架

Agent S : un cadre Open Source pour les corps intelligents qui utilisent les ordinateurs comme des humains

Introduction générale Agent S est un framework open-source développé par Simular AI qui permet à des intelligences d'utiliser des ordinateurs comme des humains à travers une interface utilisateur graphique (GUI). Il utilise un modèle de langage multimodal et des techniques d'apprentissage empirique pour effectuer des tâches telles que la navigation sur le web, l'édition de documents, l'utilisation de logiciels...
Il y a 4 mois
01.3K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice : une interface graphique de synthèse vocale basée sur des API de flux au silicium

Introduction générale Text2Voice est un outil open source qui fournit une fonctionnalité de synthèse vocale basée sur une API de mobilité au silicium, avec une interface utilisateur graphique (GUI) propre comme sa meilleure caractéristique. Il a été créé par le développeur Sheldon Lee sur GitHub pour permettre...
Il y a 4 mois
01.2K
Serena:语义检索和编辑代码的免费MCP工具

Serena : un outil MCP gratuit pour la recherche sémantique et l'édition de code

Introduction générale Serena est un outil de programmation gratuit et open source développé par l'équipe Oraios AI et hébergé sur GitHub. Il s'agit d'un puissant assistant de code qui fonctionne directement dans votre base de code pour aider les développeurs à analyser, éditer et exécuter du code.Seren...
Il y a 4 mois
02K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl : un outil gratuit pour transformer les portraits en images de style Ghibli

Introduction générale EasyControl est un projet open source, le projet est basé sur l'architecture du transformateur de diffusion (DiT) pour fournir un contrôle efficace et flexible de la génération d'images. Parmi eux, Ghibli Control LoRA est l'une de ses caractéristiques spéciales, en utilisant seulement 100 sous...
Il y a 4 mois
01.7K
YOLOE:实时视频检测和分割物体的开源工具

YOLOE : un outil open source pour la détection vidéo en temps réel et la segmentation d'objets

YOLOE est un projet open source développé par le Multimedia Intelligence Group (THU-MIG) de la School of Software de l'Université de Tsinghua, dont le nom complet est "You Only Look Once Eye". Il est basé sur le framework PyTorch, qui appartient à la série d'extensions YOLO...
Il y a 4 mois
01.2K
集成多种先进语音合成服务的开源运营项目

Projet opérationnel open source qui intègre plusieurs services avancés de synthèse vocale

Introduction générale Open-VoiceCanvas est une plateforme de synthèse vocale open source développée par l'équipe ItusiAI. Elle prend en charge plus de 50 langues et permet de convertir du texte en parole naturelle, ainsi que de cloner des voix personnalisées en téléchargeant des fichiers audio. Le projet intègre Ope...
Il y a 4 mois
01.6K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind : projet open source de positionnement des vidéos en fonction de l'heure, du contenu et des questions-réponses

Introduction générale VideoMind est un outil d'IA multimodale open source qui se concentre sur l'inférence, les questions-réponses et la génération de résumés pour les vidéos de longue durée. Il a été développé par Ye Liu de l'Université polytechnique de Hong Kong et une équipe du Show Lab de l'Université nationale de Singapour. L'outil imite la compréhension humaine des vidéos...
Il y a 2 mois
01.3K
SuperCoder:命令行终端运行的智能代码助手

SuperCoder : Assistant de code intelligent pour l'exécution du terminal en ligne de commande

Introduction générale SuperCoder est un outil intelligent qui fonctionne dans le terminal et qui est conçu pour les programmeurs. Il utilise la technologie de l'intelligence artificielle pour aider les utilisateurs à rechercher du code, à visualiser la structure du projet, à éditer des fichiers et à corriger les bogues....
Il y a 4 mois
01.1K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo : un outil open source pour segmenter automatiquement des objets arbitraires en mouvement à partir d'une vidéo

Introduction générale SegAnyMo est un projet open source développé par une équipe de chercheurs de l'UC Berkeley et de l'Université de Pékin, comprenant des membres tels que Nan Huang. Cet outil se concentre sur le traitement vidéo et peut automatiquement identifier et segmenter des objets arbitraires en mouvement dans une vidéo, tels que des personnes, des animaux ou...
Il y a 4 mois
01.2K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD : cadre open source pour la génération de vidéos de scènes 3D et 4D arbitraires

Introduction générale GenXD est un projet open source, développé par l'Université nationale de Singapour (NUS) et l'équipe de Microsoft. Il se concentre sur la génération de scènes 3D et 4D arbitraires, afin de résoudre le problème de la génération de scènes 3D et 4D dans le monde réel en raison de l'insuffisance des données et de la complexité de la conception du modèle. Le projet a été développé par ...
Il y a 4 mois
01.2K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone : un outil pour générer des vidéos de portraits humains numériques à mi-corps à partir de photographies

Introduction générale ChatAnyone est un projet innovant développé par l'équipe HumanAIGC. Il utilise des techniques d'intelligence artificielle pour générer des vidéos de portraits humains numériques avec des mouvements du haut du corps à partir d'une seule photo et d'une entrée audio. Le projet est basé sur un modèle de diffusion de mouvement hiérarchique qui génère des mouvements de tête...
Il y a 4 mois
01.3K
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1 : Apprentissage par renforcement pour former de grands modèles de recherche et de raisonnement

Introduction générale Search-R1 est un projet open source, développé par PeterGriffinJin sur GitHub, construit sur le framework veRL. Il forme de grands modèles de langage (LLM) grâce à des techniques d'apprentissage par renforcement (RL), permettant aux modèles d'apprendre de manière autonome....
Il y a 4 mois
01.2K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini : orchestration multi-modèle des tâches et encapsulation dans une interface API

Introduction générale DeepGemini est un projet open source créé par le développeur Thomas Sligter. Il s'agit d'un outil de gestion de l'IA qui prend en charge l'orchestration multi-modèle, dont la principale caractéristique est la capacité de combiner de manière flexible une variété de modèles d'IA, et grâce à l'OpenAI-compatible ...
Il y a 2 mois
01.4K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity : un projet open source pour entraîner l'IA à effectuer des actions sur le web avec des démonstrations humaines

Introduction générale Optexity est un projet open source sur GitHub, développé par l'équipe Optexity. Son objectif principal est d'utiliser des données de démonstration humaines pour entraîner l'IA à effectuer des tâches informatiques, en particulier des opérations sur des pages web. Le projet contient trois bibliothèques de code : Compute...
Il y a 4 mois
01.4K
II-Researcher:深度搜索与分步推理解答复杂问题

II-Researcher : Recherche approfondie et raisonnement par étapes pour répondre à des questions complexes

Description générale II-Researcher est un outil de recherche IA open source développé par l'équipe Intelligent-Internet et hébergé sur GitHub. Il est conçu pour la recherche en profondeur et le raisonnement complexe, avec la capacité de rechercher à travers des pages web intelligentes et des...
Il y a 4 mois
01.1K
Paper to Podcast:把学术论文转换为多人对话播客

Du papier au podcast : convertir des documents académiques en podcasts de conversation à plusieurs personnes

Introduction générale Paper to Podcast est un outil open source spécialisé dans la transformation de documents de recherche académique en podcasts vivants et divertissants. Il utilise une technologie d'intelligence artificielle pour transformer un document au format PDF en un dialogue entre trois personnages - l'hôte, l'apprenant et l'expert - afin de rendre...
Il y a 4 mois
01K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync : un outil open source pour générer des vidéos avec synchronisation labiale directement à partir de l'audio

Introduction générale LatentSync est un outil open source développé par ByteDance et hébergé sur GitHub. Il pilote les mouvements des lèvres des personnages d'une vidéo directement à travers l'audio, de sorte que la forme de la bouche corresponde précisément à la voix. Le projet est basé sur Stable Di...
Il y a 2 mois
02.7K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife : une personne numérique secondaire qui prend en charge la diffusion en direct de la station B et l'interaction vocale.

VirtualWife est un projet open source de personne virtuelle numérique créé par le développeur yakami129. Il est actuellement en phase d'incubation, l'objectif est de créer un personnage virtuel avec une "âme", l'utilisateur peut interagir avec lui comme avec un ami. Le projet est soutenu par B Station Live...
Il y a 4 mois
01.5K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3 : un modèle léger pour la synthèse de la parole chinoise et anglaise

Introduction MegaTTS3 est un outil de synthèse vocale open source développé par ByteDance en coopération avec l'Université de Zhejiang, qui se concentre sur la génération de discours chinois et anglais de haute qualité. Son modèle de base est seulement 0,45B paramètres, léger et efficace, supportant la génération de discours chinois et anglais mixtes et le clonage de discours. Le projet est hébergé sur ...
Il y a 4 mois
01.4K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM : un outil Open Source amélioré pour intégrer des connaissances externes dans de grands modèles

KBLaM est un projet open source développé par Microsoft, dont le nom complet est "Knowledge Base augmented Language Model" ("Modèle de base de connaissances augmentée"). Il s'agit de transformer des connaissances externes en vecteurs et de les intégrer dans un grand modèle de ...
Il y a 4 mois
01.5K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ : un outil open source pour la connexion et la gestion flexibles d'intelligences IA

Introduction générale AgentIQ est un outil open source de NVIDIA conçu pour aider les développeurs à connecter et gérer efficacement les intelligences IA. Il permet aux intelligences issues de différents cadres de collaborer de manière transparente, de connecter des données et des outils d'entreprise et de créer des flux de travail tels que des fonctions d'appel. Le plus grand...
Il y a 4 mois
01.2K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D : Un outil open source pour générer rapidement des scènes 3D multi-objets à partir d'une seule image

Introduction générale MIDI-3D est un projet open source développé par l'équipe de VAST-AI-Research pour générer rapidement des scènes 3D contenant plusieurs objets à partir d'une seule image pour les développeurs, les chercheurs et les créateurs. Cet outil est basé sur la technique de modélisation de la diffusion multi-instances...
Il y a 4 mois
01.3K
TripoSF:快速生成高分辨率3D模型的实用工具

TripoSF : un outil pratique pour la génération rapide de modèles 3D à haute résolution

Introduction générale TripoSF est un projet open source construit par l'équipe VAST-AI-Research, spécifiquement conçu pour générer rapidement des modèles 3D haute résolution à partir d'une seule image. Il utilise une technologie appelée SparseFlex, une grande efficacité de traitement, peut être ...
Il y a 4 mois
01.2K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG : Générer des actifs numériques modélisés en 3D à haute résolution à partir d'une seule image

Introduction générale TripoSG est un projet open source développé par l'équipe de recherche VAST AI pour générer des modèles 3D de haute qualité à partir d'une seule image. Le projet utilise la technologie des convertisseurs redresseur-flux à grande échelle, combinée à une formation hybride supervisée et à des ensembles de données de haute qualité, pour permettre aux modèles 3D générés d'avoir...
Il y a 4 mois
01.4K
OpenDeepSearch:支持智能推理的开源搜索工具

OpenDeepSearch : un outil de recherche open source qui prend en charge le raisonnement intelligent

Introduction générale OpenDeepSearch est un outil de recherche open source développé par l'équipe sentient-agi. Il combine la modélisation des grands langages (LLM) et les agents de raisonnement intelligents pour permettre aux utilisateurs de rechercher des informations sur des pages web et d'obtenir des réponses précises de manière simple. Ce ...
Il y a 4 mois
01.3K
Vibe Draw:将手绘草图转化为3D模型的创意工具

Vibe Draw : un outil créatif pour transformer des croquis dessinés à la main en modèles 3D

Introduction générale Vibe Draw est un projet open source, développé par Martin Sit, qui permet aux utilisateurs de transformer des croquis dessinés à la main en magnifiques modèles 3D. L'objectif de cet outil est simple : rendre la modélisation 3D accessible à tous, sans qu'il soit nécessaire d'avoir de grandes compétences artistiques ou de...
Il y a 4 mois
01.3K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA : LangGraph-based AI Intelligence for Controlling Computer Operations (Intelligence IA basée sur le LangGraph pour le contrôle des opérations informatiques)

LangGraph CUA est un projet open source développé par l'équipe LangChain. Il est basé sur le framework LangGraph, permettant aux développeurs d'utiliser Python pour construire des intelligences IA qui peuvent directement faire fonctionner l'ordinateur. Le cœur de cet outil ...
il y a 5 mois
01.5K
FlowGram.AI:快速创建节点式工作流的开源引擎

FlowGram.AI : un moteur open source pour la création rapide de flux de travail nodaux

Introduction complète Flowgram.ai est un moteur de construction de processus open source développé par ByteDance. Il est basé sur l'édition de nœuds, pour aider les développeurs à créer rapidement des flux de travail, le support de la mise en page fixe et la liaison libre deux modes . Le projet est écrit en TypeScript...
il y a 5 mois
01.7K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni : un modèle de mesure finale pour la saisie multimodale et l'interaction vocale en temps réel

Introduction détaillée Qwen2.5-Omni est un modèle d'IA multimodale open source développé par l'équipe Qwen d'Alibaba Cloud. Il peut traiter de multiples entrées telles que du texte, des images, de l'audio et de la vidéo, et générer des réponses textuelles ou vocales naturelles en temps réel. Le modèle a été lancé en 2025, le 3 ...
il y a 5 mois
02.1K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus : un système de gestion sur site pour Dify

Introduction complète Dify-Plus est une plateforme de développement d'applications d'IA basée sur le développement secondaire du projet open source Dify. Elle ajoute un nouveau centre de gestion basé sur Dify et optimise la fonctionnalité pour les scénarios d'entreprise. Le projet était initialement destiné à un usage interne par les entreprises, et a ensuite constaté que la communauté avait des besoins similaires, il...
il y a 5 mois
01.2K
Rankify:支持信息检索与重排序的Python工具包

Rankify : une boîte à outils Python qui prend en charge la recherche d'informations et le réordonnancement

Introduction générale Rankify est une boîte à outils Python open source développée par le Data Science Group de l'Université d'Innsbruck, en Autriche. Il se concentre sur la recherche d'informations, le réordonnancement et la génération d'augmentation de la recherche (RAG), en fournissant un cadre unifié. La boîte à outils est livrée avec 40 benchmarks pré-récupérés intégrés...
il y a 5 mois
01.6K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star : un outil open source pour améliorer la qualité de la génération d'images et de vidéos

Introduction complète CFG-Zero-star est un projet open source développé par Weichen Fan et l'équipe du S-Lab de l'Université technologique de Nanyang. Il se concentre sur l'amélioration de la technique Classifier Free Guidance (CFG) dans les modèles d'appariement de flux en optimisant la stratégie de ...
il y a 5 mois
01.5K
Motia:用代码快速构建智能体的开发框架

Motia : un cadre de développement pour construire rapidement des intelligences dans le code

Introduction générale Motia est un framework d'agent IA open source pour les ingénieurs logiciels, hébergé sur GitHub et développé par l'équipe MotiaDev. Il permet aux développeurs d'utiliser des langages de programmation familiers (par exemple Python, TypeScript, Rub...
il y a 5 mois
01.2K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine : Moteur Open Source pour le déploiement de FLUX à faible niveau d'exigence, Wan 2.1

Introduction générale DiffSynth-Engine est un projet open source lancé par ModelScope, hébergé sur GitHub. Il est basé sur la technologie de modélisation de la diffusion, se concentre sur la génération efficace d'images et de vidéos, et convient aux développeurs pour déployer des modèles d'IA dans des environnements de production....
il y a 5 mois
01.4K
RF-DETR:实时视觉对象检测开源模型

RF-DETR : un modèle open source pour la détection d'objets visuels en temps réel

Introduction complète RF-DETR est un modèle de détection d'objets open source développé par l'équipe Roboflow. Il est basé sur l'architecture Transformer et sa caractéristique principale est l'efficacité en temps réel. Pour la première fois, le modèle atteint plus de 60 AP en temps réel sur l'ensemble de données Microsoft COCO...
il y a 5 mois
01.8K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK : un outil open source pour faciliter le déploiement de modèles d'IA multimodaux

Introduction générale Aana SDK est un framework open source développé par Mobius Labs, nommé d'après le mot malayalam ആന (éléphant). Il aide les développeurs à déployer et à gérer rapidement des modèles d'IA multimodaux, en prenant en charge le traitement du texte, des images, de l'audio et de la vidéo, ainsi que d'autres données....
il y a 5 mois
01.5K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Agent TARS : une source ouverte de renseignements qui utilise la vision et les commandes pour faire fonctionner les ordinateurs.

Introduction complète L'agent TARS est une intelligence artificielle multimodale mise à disposition par ByteDance, dont les principales caractéristiques aident les utilisateurs à accomplir des tâches informatiques complexes en comprenant visuellement le contenu du web et en combinant les opérations de la ligne de commande et du système de fichiers. Au lieu de nécessiter des opérations manuelles comme les outils traditionnels, il peut...
il y a 5 mois
01.5K
Qlib:微软开发的AI量化投资研究工具

Qlib : un outil d'analyse quantitative des investissements basé sur l'IA et développé par Microsoft

Introduction complète Qlib est une plateforme open source développée par Microsoft qui se concentre sur l'utilisation de la technologie de l'IA pour aider les utilisateurs à rechercher des investissements quantitatifs. Elle commence par le traitement des données les plus élémentaires et aide les utilisateurs à explorer des idées d'investissement et à les transformer en stratégies utilisables. La plateforme est simple et facile à utiliser, et convient à ceux qui souhaitent utiliser l'apprentissage automatique pour améliorer leur recherche d'investissement...
il y a 5 mois
01.8K
自动爬取小说并生成多角色有声书的工具

Un outil qui parcourt automatiquement les romans et génère des livres audio à plusieurs personnages

Introduction générale Auto-Audio-Book est un projet open source hébergé sur GitHub. Il explore automatiquement le contenu des romans à partir de sites web et les convertit en livres audio avec plusieurs voix de personnages. Développeur zqq-nuli utilisant Python 3.1...
il y a 5 mois
01.2K
Oliva:语音控制的多智能体产品搜索助手

Oliva : un assistant de recherche de produits à intelligence multiple commandé par la voix

Introduction générale Oliva est un assistant multi-intelligence open source développé par Deluxer sur GitHub. Il aide les utilisateurs à rechercher des informations sur les produits dans la base de données Qdrant grâce à la collaboration de plusieurs intelligences artificielles. La principale caractéristique est la prise en charge des opérations vocales...
il y a 5 mois
01.1K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft : outils open source de conversion de documents PDF numérisés en Markdown

Introduction générale PDF Craft est un outil open source conçu pour scanner des PDF de livres et les convertir au format Markdown. Il a été développé par oomol-lab et est hébergé sur GitHub pour les utilisateurs qui souhaitent organiser leurs livres électroniques. L'outil fonctionne à travers ce ...
il y a 5 mois
01.4K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou : un outil de génération et d'édition de photos qui préserve les traits du visage

Introduction générale InfiniteYou est un projet open source développé par l'équipe de création intelligente ByteDance. Il est basé sur la technologie des transformateurs de diffusion (DiTs), utilisant le modèle FLUX.1-dev. La fonction principale est de permettre aux utilisateurs de télécharger une photo et d'entrer une description textuelle, générant ainsi...
il y a 5 mois
01.5K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror : déploiement en un clic de sites miroirs Grok rentables

Introduction complète Grok-Mirror est une station miroir domestique Grok3 à déploiement rapide sans serveur, basée sur la construction d'une station miroir Grok opérationnelle. Elle permet aux utilisateurs de déployer des kiosques Grok locaux en un seul clic via Docker.Grok est une intelligence artificielle de xAI...
il y a 5 mois
01.4K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me : des sosies d'IA formés localement et dotés de souvenirs et d'habitudes personnels

Second Me est un projet open source développé par l'équipe Mindverse qui vous permet de créer une IA sur votre ordinateur qui agit comme un "sosie numérique", apprenant vos schémas d'élocution et vos habitudes à travers vos mots et vos souvenirs, et devenant une personne intelligente qui comprend vos...
il y a 5 mois
02.2K
StarVector:从图像和文字生成SVG矢量图的基础模型

StarVector : un modèle de base pour générer des graphiques vectoriels SVG à partir d'images et de textes

Introduction générale StarVector est un projet open source créé par des développeurs tels que Juan A. Rodriguez pour convertir des images et du texte en Scalable Vector Graphics (SVG). Cet outil utilise un modèle de langage visuel pour pouvoir comprendre le contenu de l'image et du texte...
il y a 5 mois
01.5K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset : un outil facile à utiliser pour créer de grands ensembles de données finement réglées.

Introduction complète Easy Dataset est un outil open source conçu spécifiquement pour affiner les grands modèles (LLM), hébergé sur GitHub. Il fournit une interface facile à utiliser qui permet aux utilisateurs de télécharger des fichiers, de segmenter automatiquement le contenu, de générer des questions et des réponses, et finalement de produire un...
il y a 5 mois
01.4K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V : Un modèle graphique hybride de raisonnement multimodal Open Source par Kunlun Wanwen

Introduction générale Skywork-R1V est un modèle de raisonnement multimodal open source développé par l'équipe SkyworkAI (Kunlun Wanwei) et publié sur GitHub. Il est capable de traiter des images et du texte simultanément, d'effectuer un raisonnement logique en plusieurs étapes, et est particulièrement performant pour analyser des problèmes d'images complexes. Cette...
il y a 5 mois
01.5K
AI Logo:AI快速生成定制化品牌Logo

AI Logo : l'IA génère rapidement des logos de marque personnalisés

Introduction générale AI Logo est un projet d'application d'IA open source dont l'objectif est d'aider les utilisateurs à générer rapidement des logos de marque personnalisés grâce à l'intelligence artificielle. Il combine des techniques d'IA puissantes telles que la diffusion stable et la DeepAI pour permettre aux utilisateurs d'entrer de simples...
il y a 5 mois
01.2K
Docs:开源的协作笔记和文档管理工具

Docs : outils open source de gestion collaborative de notes et de documents

Introduction générale Docs est une plateforme open source de prise de notes collaborative et de gestion de documents développée par l'équipe de suitenumerique. Elle est construite à l'aide des technologies Django et React dans le but de fournir un outil facile à utiliser pour aider les utilisateurs à prendre des notes, à gérer...
il y a 5 mois
01.6K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead : annote automatiquement les documents PDF techniques et fournit des citations pertinentes

Introduction complète SmartRead est un outil open source basé sur l'IA et conçu pour les documents techniques. Il peut analyser automatiquement les fichiers PDF, marquer le contenu clé, tel que les termes importants, les titres ou les idées principales, afin d'aider les utilisateurs à comprendre rapidement les documents complexes. En même temps, il peut également fournir le document principal...
il y a 5 mois
01.6K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2 : outil de génération de modèles 3D haute résolution open source de Tencent

Introduction générale Hunyuan3D-2 est un projet open source développé par Tencent pour générer des modèles 3D haute résolution à partir de textes ou d'images. Il se compose de deux éléments principaux : le modèle de génération de formes (Hunyuan3D-DiT) et le modèle de génération de textures (Hunyuan3D...
il y a 5 mois
01.2K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus : un cadre d'automatisation de l'IA open source qui prend en charge la collaboration multi-intelligence

Introduction générale LangManus est un cadre d'automatisation de l'IA open source hébergé sur GitHub. Développé par un groupe d'anciens collègues pendant leur temps libre, il s'agit d'un projet académique dont l'objectif est de combiner des modèles de langage et des outils spécialisés pour la recherche sur le web, l'exploration de données et l'exécution de code...
il y a 5 mois
01.4K
闲鱼卖家全天自动值守的AI客服机器人

Des robots d'assistance à la clientèle dotés d'une IA et gérés automatiquement par des vendeurs inactifs tout au long de la journée.

Introduction complète XianyuAutoAgent est un système de robot de service client intelligent conçu pour la plateforme Idlefish, ouvert par le développeur shaxiu sur GitHub. Il utilise la technologie de l'IA pour assurer un service automatique 7×24 heures afin d'aider les vendeurs de poissons...
il y a 5 mois
01.3K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC : permet la conversion en temps réel de la parole et de la chanson avec moins d'échantillons

Introduction générale Seed-VC est un projet open source sur GitHub, développé par Plachtaa. Il peut utiliser une référence audio de 1 à 30 secondes, une conversion rapide de la parole ou de la chanson, sans formation supplémentaire. Le projet supporte la conversion de la voix en temps réel, le retard ...
il y a 5 mois
01.7K
PilottAI:构建企业级多智能体应用的开源项目

PilottAI : un projet open source pour construire des applications de multi-intelligence de niveau entreprise

Introduction générale PilottAI est un framework Python open source hébergé sur GitHub et créé par le développeur anuj0456. Il a pour objectif d'aider les utilisateurs à construire des systèmes corporels multi-intelligents de classe entreprise, prend en charge l'intégration du Large Language Model (LLM),...
il y a 5 mois
01.2K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni : un macromodèle multimodal pour l'analyse des émotions et des actions des vidéos humaines

Introduction générale HumanOmni est un grand modèle multimodal open source développé par l'équipe HumanMLLM et hébergé sur GitHub. Il se concentre sur l'analyse de vidéos humaines et peut traiter à la fois l'image et le son pour aider à comprendre les émotions, les actions et le contenu du dialogue. Le projet a utilisé 2...
il y a 5 mois
01.1K
TxAgent:帮医生分析药物作用和治疗方案的AI工具

TxAgent : un outil d'IA pour aider les médecins à analyser les effets des médicaments et les options thérapeutiques

Introduction complète TxAgent est un outil d'IA open-source développé par l'équipe d'intelligence artificielle médicale et scientifique (MIMS) de l'université de Harvard pour aider les médecins à analyser les interactions médicamenteuses et à élaborer des plans de traitement personnalisés. Il combine des situations spécifiques au patient grâce à un raisonnement en plusieurs étapes et à l'extraction en temps réel de connaissances biomédicales...
il y a 5 mois
01.1K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL : un outil open source pour transformer le langage naturel en requêtes SQL

Introduction complète OpenSearch-SQL est un projet open source, c'est un puissant outil Text-to-SQL qui peut transformer les descriptions en langage naturel de l'utilisateur en instructions de requête SQL, afin d'aider les personnes qui ne sont pas familières avec la base de données à accéder facilement aux données. Ce projet a été développé par O...
il y a 5 mois
01.1K