Projet open source sur l'IA

Total 1020 articles
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR : l'outil d'IA qui restaure intelligemment les vieilles photos jaunies et usées

Bringing Old Photos Back to Life est un projet open source développé par une équipe de recherche de Microsoft qui se concentre sur la restauration de vieilles photos à l'aide de la technologie de l'IA. Il est basé sur une approche d'apprentissage profond qui peut traiter des problèmes de dégradation graves dans les photos, tels que les rayures...
il y a 5 mois
01.7K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer : un outil open source permettant d'optimiser les mots-guides pour les modèles d'IA grand public

Introduction générale Prompt Optimizer est un outil open source axé sur l'optimisation des mots-guides, développé par linshenkx sur GitHub. Il aide les utilisateurs à optimiser les mots-guides des modèles d'IA grâce à des algorithmes intelligents, améliorant ainsi la qualité du contenu généré...
il y a 5 mois
02.7K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain : conversion de la parole en texte en temps réel et optimisation des mots prononcés

Introduction générale WhisperChain est un projet open source basé sur l'IA, hébergé sur GitHub et dirigé par le développeur Chris Choy. Il est principalement utilisé pour convertir la parole en texte et optimiser automatiquement l'expression grâce à la technologie de l'IA, en supprimant les redondances...
il y a 5 mois
02.6K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion : des invites textuelles génèrent des vidéos en boucle sans interruption

Introduction générale Mobius Diffusion est un outil en ligne innovant qui permet de générer du contenu vidéo en boucle à partir d'un texte. Il est basé sur des modèles de diffusion vidéo pré-entraînés et ne nécessite pas de formation de l'utilisateur ou de données d'annotation pour démarrer rapidement. La technologie de base du site est le ...
il y a 5 mois
02.3K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI : cadre backend basé sur SpringBoot pour le chat et le dessin d'IA

Introduction RuoYi AI est un projet back-end basé sur le framework ruoyi-plus, qui se concentre sur l'intégration des fonctions de chat et de peinture de l'IA. Il est entièrement open source et gratuit, utilisant Java17 et SpringBoot 3.X technology stack, backend management ...
il y a 5 mois
03.5K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent : une intelligence visuelle pour résoudre les tâches de détection de cibles visuelles multiples

Introduction générale Vision Agent est un projet open source développé par LandingAI (Team Enda Wu), hébergé sur GitHub, conçu pour aider les utilisateurs à générer rapidement du code pour résoudre des tâches de vision par ordinateur. Il utilise un cadre d'agent avancé et des modèles multimodaux...
il y a 5 mois
02.3K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio : un modèle audio de bout en bout pour l'interaction vocale en temps réel

Introduction complète Baichuan-Audio est un projet open source développé par Baichuan Intelligence (baichuan-inc), hébergé sur GitHub, qui se concentre sur la technologie d'interaction vocale de bout en bout. Le projet fournit un cadre de traitement audio complet qui permet de ...
il y a 5 mois
02.7K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish : suivre et résumer l'actualité de l'IA en temps réel et la publier automatiquement sur WeChat.

Introduction générale ai-trend-publish est un projet open source hébergé sur GitHub, développé par l'équipe d'OpenAISpace, axé sur le suivi et la publication en temps réel des dernières tendances en matière d'intelligence artificielle. Cet outil est conçu pour aider les développeurs, les...
il y a 5 mois
02.3K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent : Générer des vidéos d'explications mathématiques animées de plus de 5 minutes avec Manim

Introduction générale TheoremExplainAgent est un projet innovant développé par TIGER AI Lab pour transformer des théorèmes mathématiques et scientifiques complexes en animations vidéo faciles à comprendre en utilisant des techniques d'intelligence artificielle. L'outil est basé sur le Large Language Model (LLM)...
il y a 5 mois
02.2K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat : client de dialogue IA qui prend en charge les sessions simultanées avec plusieurs chats

Introduction générale DeepChat est un projet d'assistant intelligent open source développé par l'équipe ThinkInAIXYZ sur GitHub. Il vise à connecter les utilisateurs avec le monde numérique grâce à une puissante technologie d'IA afin de fournir une expérience de chat efficace et naturelle. Il prend en charge Win...
il y a 5 mois
03.1K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev : Outil de génération de code et de débogage automatisé avec support multilingue

Introduction générale AutoDev est un projet open source développé par l'équipe Unit Mesh et hébergé sur GitHub, visant à améliorer l'efficacité de la programmation des développeurs grâce à une technologie d'intelligence artificielle. Il s'agit d'un puissant assistant de codage qui prend en charge de nombreux langages de programmation, y compris Ja...
Il y a 6 mois
02.6K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer : lecteur vidéo qui génère des sous-titres en temps réel avec traduction bilingue

Introduction générale LLPlayer est un lecteur multimédia open source pour les apprenants de langues, hébergé sur GitHub et créé par le développeur umlx5h. Il intègre une variété de fonctionnalités utiles telles que l'affichage des sous-titres bilingues, les sous-titres générés automatiquement par l'IA, la traduction en temps réel et la recherche de mots...
Il y a 2 mois
03.9K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor : un assistant d'enseignement intelligent qui fournit des conseils de programmation personnalisés

Introduction générale Coding-Tutor est un projet open source hébergé sur GitHub et créé par le développeur iwangjian pour fournir aux apprenants une expérience d'enseignement de la programmation personnalisée. Il utilise la technologie de l'IA conversationnelle pour apprendre en fonction des connaissances de l'utilisateur et...
Il y a 6 mois
02K
Flock:低代码工作流编排快速构建聊天机器人

Flock : orchestration de flux de travail low-code pour la construction rapide de chatbots

Introduction générale Flock est une plateforme open source low-code pour les flux de travail, hébergée sur GitHub et développée par l'équipe Onelevenvy. Elle est basée sur les technologies LangChain et LangGraph et a pour but d'aider les utilisateurs à construire rapidement des machines à discuter...
Il y a 6 mois
02.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent : un outil intelligent conçu pour analyser des données tabulaires complexes

Introduction complète TableGPT Agent est un outil intelligent basé sur le projet open source GitHub, conçu pour le traitement et l'analyse de données tabulaires. Il s'appuie sur le modèle de langage TableGPT2 et utilise l'interaction avec le langage naturel pour permettre aux utilisateurs d'interroger, de manipuler...
Il y a 6 mois
02.8K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV : Générer rapidement des vidéos de présentation à partir de diapositives/PPT et de notes explicatives

Introduction générale TRV est un outil open source, hébergé sur GitHub, conçu pour aider les utilisateurs à convertir rapidement des diapositives et des notes de présentation en vidéos avec narration. Il génère automatiquement du contenu audio et vidéo à partir de fichiers de présentation d'entrée par le biais de simples opérations en ligne de commande...
Il y a 6 mois
02.1K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM : l'outil de développement Open Source Low-Code de Shangtang pour la création d'applications corporelles multi-intelligentes

Introduction complète LazyLLM est un outil open source développé par l'équipe LazyAGI, qui vise à simplifier le processus de développement d'applications multi-intelligence à grand modèle. Il aide les développeurs à créer rapidement des applications d'IA complexes grâce à un déploiement en un clic et à des mécanismes de passerelle légers, évitant ainsi une configuration technique fastidieuse...
Il y a 6 mois
02.5K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate : génération d'animations de structures squelettiques à partir de modèles 3D statiques

Introduction complète MagicArticulate est un framework d'IA développé par ByteDance en collaboration avec l'Université Technologique de Nanyang (NTU), qui se concentre sur la transformation rapide de modèles 3D statiques en ressources numériques animées. Pour ce faire, il utilise un transformateur autorégressif avancé et un modèle de diffusion fonctionnelle,...
Il y a 6 mois
02.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk : Installation en un clic de modèles d'IA et d'interfaces de discussion sur des ordinateurs personnels (avec DeepSeek)

Introduction générale AingDesk est un logiciel open source et gratuit conçu pour aider les utilisateurs à déployer et à exécuter facilement divers modèles d'IA sur leurs ordinateurs locaux. Qu'il s'agisse d'un modèle DeepSeek ou Llama, AingDesk permet une...
Il y a 6 mois
02.8K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit : Extraire la structure complexe du contenu PDF de l'outil open-source

Introduction complète PDF-Extract-Kit est un projet open source développé par l'équipe d'OpenDataLab, qui se concentre sur l'extraction efficace de contenu de haute qualité à partir de documents PDF complexes et diversifiés. Il intègre une technologie avancée d'analyse de documents pour prendre en charge la détection de la mise en page, la reconnaissance des formules ...
Il y a 6 mois
03.1K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI : un cadre d'intelligence artificielle dans lequel vous pouvez saisir des questions pour entraîner un modèle en temps réel et produire les résultats.

Introduction générale TPO-LLM-WebUI est un projet innovant ouvert par Airmomo sur GitHub qui permet l'optimisation en temps réel de grands modèles de langage (LLM) par le biais d'une interface web intuitive. Il utilise TPO (Test-Time Pr...
Il y a 6 mois
03.3K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D : une plateforme d'IA pour générer des ressources numériques modélisées en 3D à haute résolution

Introduction générale Neural4D est une plateforme innovante basée sur l'IA qui aide les utilisateurs à générer rapidement des modèles 3D et des animations de haute qualité à partir d'une simple saisie de texte ou d'image. Développée par DreamTech, elle s'appuie sur la première technologie mondiale de génération de grands modèles 3D de bout en bout...
Il y a 6 mois
02.5K
InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型

InternLM-XComposer : un macromodèle multimodal pour l'édition de textes très longs et la compréhension d'images et de vidéos

Introduction complète InternLM-XComposer est un projet de grand modèle graphique multimodal open source développé par l'équipe InternLM et hébergé sur GitHub. Il est basé sur le modèle de langage InternLM, et est capable de gérer des textes multimodaux, des images, des vidéos et d'autres...
Il y a 6 mois
02.1K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense : un outil d'annotation d'images gratuit pour améliorer l'efficacité des projets de vision par ordinateur

Introduction générale Make Sense est un outil d'annotation d'images en ligne gratuit conçu pour aider les utilisateurs à préparer rapidement des ensembles de données pour des projets de vision par ordinateur. Il ne nécessite aucune installation compliquée, il suffit d'ouvrir un accès au navigateur pour l'utiliser, il supporte plusieurs systèmes d'exploitation, et il est idéal pour les petits projets d'apprentissage profond. Les utilisateurs peuvent...
Il y a 6 mois
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT : Interface de chat AI pour visualiser les conversations basées sur les arbres

Introduction générale TreeGPT est une application de chat open source basée sur Next.js, qui se concentre sur la visualisation des conversations avec de grands modèles de langage (LLM, par exemple, GPT) à travers des structures de graphes arborescents (graphes acycliques dirigés, DAG), remplaçant les méthodes de chat linéaires traditionnelles pour améliorer la vitesse et la...
Il y a 6 mois
02.9K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot : un assistant IA pour la génération de descriptions de texte ComfyUI workflows

Introduction complète ComfyUI-Copilot est un nœud personnalisé piloté par l'IA conçu pour le framework ComfyUI, visant à améliorer l'efficacité du débogage et du déploiement des algorithmes d'IA grâce à l'interaction avec le langage naturel. Il est développé par l'équipe AIDC-AI (Alibaba) et dérivé de GitHu...
Il y a 6 mois
02.8K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research : Collaboration multi-agents pour effectuer des recherches documentaires et générer des rapports de recherche

Introduction générale Auto-Deep-Research est un outil d'IA open-source développé par le Data Intelligence Laboratory de l'Université de Hong Kong (HKUDS), qui vise à aider les utilisateurs à automatiser les tâches de recherche approfondie. Il est construit sur le cadre AutoAgent et prend en charge de nombreux modèles de langage...
Il y a 4 mois
05.5K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek : un outil open source pour générer du matériel d'étude de mots pour la 4e année à l'aide de DeepSeek

Introduction complète "Vocabulary Book by DeepSeek" est un projet open source développé sur la base du grand modèle de DeepSeek, visant à aider les apprenants d'anglais à maîtriser efficacement le vocabulaire du College English Level 4 (CET-4). Le projet est hébergé sur GitHub...
Il y a 6 mois
03K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12 : un outil open source pour la détection de cibles en temps réel dans les images et les vidéos

Introduction complète YOLOv12 est un projet open source développé par l'utilisateur de GitHub sunsmarterjie , qui se concentre sur la technologie de détection de cible en temps réel . Le projet est basé sur la série de frameworks YOLO (You Only Look Once), l'introduction de la note ...
Il y a 6 mois
03.2K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent : un cadre pour la création et le déploiement rapides d'intelligences IA par le biais du langage naturel

Introduction générale AutoAgent est un framework d'intelligence artificielle open source développé par le Data Intelligence Laboratory de l'Université de Hong Kong (HKUDS) et hébergé sur GitHub. Il permet aux utilisateurs de créer et de déployer rapidement des intelligences artificielles personnalisées en décrivant leurs besoins en langage purement naturel, sans aucune base de programmation....
Il y a 2 mois
03K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM : un outil efficace d'exploration du Web pour le pré-entraînement LLM

Introduction détaillée Crawl4LLM est un projet open source développé conjointement par l'université Tsinghua et l'université Carnegie Mellon, qui se concentre sur l'optimisation de l'efficacité de l'exploration du web pour le pré-entraînement des grands modèles (LLM). Il réduit considérablement l'inefficacité du crawling en sélectionnant intelligemment des données web de haute qualité, affirmant pouvoir...
Il y a 6 mois
02.4K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero : Plate-forme de formation à l'apprentissage par renforcement du raisonnement à grande échelle (Open Source Large-Scale Reasoning Reinforcement Learning)

Introduction générale Open-Reasoner-Zero est un projet open source axé sur la recherche en apprentissage par renforcement (RL), développé par l'équipe Open-Reasoner-Zero sur GitHub. Il vise à fournir une formation efficace, évolutive et facile à ...
Il y a 6 mois
02.2K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI : un assistant IA pour la recherche approfondie multilingue

Introduction complète Deep Research Web UI est un outil d'aide à la recherche open source basé sur la technologie de l'IA, conçu pour aider les utilisateurs à mener des recherches itératives approfondies sur n'importe quel sujet. Il combine la puissance des moteurs de recherche, de l'exploration du web et de la modélisation du langage à grande échelle à travers une interface web intuitive...
Il y a 4 mois
02.6K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar : portraits 2D audio de personnes numériques interactives en temps réel, fonctionnant à 30 images par seconde sur l'unité centrale.

Introduction générale LiteAvatar est un outil open source développé par l'équipe HumanAIGC (qui fait partie d'Ali) qui se concentre sur la génération d'animations faciales à partir d'avatars 2D pilotés par l'audio en temps réel. Il fonctionne à 30 images par seconde (fps) en s'appuyant uniquement sur le CPU, et est particulièrement adapté...
Il y a 6 mois
02.5K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat : une application de chat de groupe avec de multiples personnages IA interagissant en temps réel

Introduction générale Botgroup.chat est une application de chat de groupe IA open source développée sur la base de React et Cloudflare Pages, visant à fournir aux utilisateurs une expérience interactive similaire au chat de groupe WeChat. Elle permet la participation simultanée de plusieurs personnages...
Il y a 6 mois
03.8K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research : l'assistant intelligent open source de LangChain pour la recherche approfondie

Introduction complète Open Deep Research est un assistant de recherche en ligne capable de générer des rapports de recherche complets sur n'importe quel sujet. Le système utilise un flux de travail "planifier et faire" qui permet aux utilisateurs de planifier et de revoir la structure du rapport avant de passer à la phase de recherche qui prend beaucoup de temps...
Il y a 4 mois
03.5K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen : un outil open source pour la génération automatique de graphes de connaissances à partir de texte simple

Introduction générale KGGen est un outil open source développé par le Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), hébergé sur GitHub, conçu pour générer automatiquement des graphes de connaissances à partir d'un texte arbitraire. Il utilise des algorithmes avancés de modélisation du langage et de...
Il y a 6 mois
03.2K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension : extension de navigateur permettant de synchroniser le contenu généré par l'IA avec les plateformes d'autoédition en un seul clic

Introduction générale MultiPost-Extension est une puissante extension de navigateur conçue pour aider les utilisateurs à publier du contenu sur plusieurs plateformes de médias sociaux en un seul clic. L'extension prend en charge la publication simultanée sur plus de 10 plateformes principales, y compris Zhihu, Weibo, Xiaohongshu, TikTok ...
Il y a 6 mois
02.8K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1 : Modèles vidéo libres pour générer des vidéos d'action humaine de haute qualité

Introduction générale SkyReels-V1 est un projet open source développé par l'équipe SkyworkAI, qui vise à générer du contenu vidéo de haute qualité, centré sur l'humain. Le projet est basé sur le modèle HunyuanVideo, à travers des dizaines de millions de films et d'extraits télévisés de haute qualité...
Il y a 6 mois
02.8K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI : client d'assistant intelligent pour le chat de groupe WeChat pour Windows

Introduction WeChatAI est un assistant intelligent personnel et de chat de groupe WeChat basé sur Python, supportant une variété de grands modèles de langage (tels que DeepSeek, Gemini, Tongyi Thousand Questions), qui peut réaliser des dialogues intelligents, des réponses automatiques et d'autres fonctions. Le projet utilise des modèles ...
Il y a 6 mois
02.5K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG : un moteur de recherche pour les données non structurées et les requêtes complexes

Introduction générale dsRAG est un moteur de recherche de haute performance conçu pour traiter des requêtes complexes sur des données non structurées. Il est particulièrement performant pour les requêtes complexes dans des textes denses tels que les rapports financiers, les documents juridiques et les articles académiques. dsRAG utilise trois approches clés pour améliorer les performances : le langage...
Il y a 6 mois
02.2K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti : outil de construction et d'interrogation de graphes de connaissances dynamiques (programme de mémoire longue sensible au temps)

Introduction générale Graphiti est un outil développé par getzep pour construire et interroger des graphes de connaissances dynamiques et temporels. Il est capable de représenter des relations complexes et évolutives entre les entités et de les interroger par le biais d'une variété de méthodes telles que les algorithmes temporels, plein texte, sémantiques et de graphe....
Il y a 6 mois
03.8K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase : une solution de mémoire à long terme basée sur le profil de l'utilisateur pour les applications d'intelligence artificielle

Introduction générale Memobase est un système de mémoire basé sur le profil de l'utilisateur, conçu pour soutenir la mémoire durable de l'utilisateur dans les applications d'IA générative. Qu'il s'agisse d'un compagnon virtuel, d'un outil éducatif ou d'un assistant personnalisé, Memobase aide votre IA à se souvenir, à comprendre et à se développer grâce à l'utilisation...
Il y a 6 mois
02.2K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Ensemble de données de distillation DeepSeek-R1 à sang complet basé en Chine, prend en charge l'ensemble de données SFT de distillation R1 en Chine

Introduction complète Le jeu de données chinois DeepSeek-R1 distillation est un jeu de données chinois open source contenant 110 000 pièces de données conçues pour soutenir l'apprentissage automatique et la recherche sur le traitement du langage naturel. Le jeu de données est publié par l'équipe NLP de Cong Liu. Le jeu de données contient non seulement des données mathématiques, mais aussi un grand nombre de types généraux...
Il y a 6 mois
02.5K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人

Base Chat : Chatbot multi-tenant pour la construction de bases de connaissances basées sur Ragie

Introduction générale Base Chat est un chatbot multi-tenant qui utilise Ragie Connect pour se connecter et dialoguer avec la base de connaissances d'une organisation. Le projet est une application de référence pour de multiples fonctionnalités de Ragie, construite sur Next.js avec le support de Goo...
Il y a 6 mois
02.3K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO : une plateforme d'agrégation commerciale intégrant plusieurs produits d'IA

Introduction AIBot PRO est un client d'agrégation d'IA basé sur .NET 6, conçu pour fournir aux utilisateurs une plate-forme pratique pour l'intégration de plusieurs produits d'IA. Le client prend en charge le dialogue de commutation sans sens et intègre ChatGPT, Gemini, Claude, Wenxin Yiyin...
Il y a 6 mois
02.4K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI : des solutions efficaces pour la formation de modèles d'IA à grande échelle

Introduction ColossalAI est une plateforme open-source développée par HPC-AI Technologies, visant à fournir une solution efficace et rentable pour l'entraînement et l'inférence de modèles d'IA à grande échelle. En prenant en charge de multiples stratégies parallèles, une gestion hétérogène de la mémoire et une formation à précision mixte, ColossalAI...
Il y a 6 mois
01.9K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT : Un grand modèle médical pour soutenir l'analyse d'images médicales et les questions-réponses en matière de diagnostic

Introduction HealthGPT est un modèle de langage visuel médical avancé qui vise à atteindre une compréhension visuelle médicale unifiée et des capacités de génération grâce à l'adaptation des connaissances hétérogènes. L'objectif du projet est d'intégrer la compréhension visuelle médicale et les capacités de génération dans un cadre autorégressif unifié qui améliore...
Il y a 6 mois
01.9K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone : outil open source pour extraire la vidéo afin de spécifier le portrait cible, générer le portrait vidéo cible

Introduction générale MatAnyone est un projet open source axé sur l'incrustation vidéo, développé et publié sur GitHub par une équipe de recherche du S-Lab, Nanyang Technological University, Singapour. Il offre aux utilisateurs des capacités de traitement vidéo stables et efficaces grâce à des techniques de propagation...
Il y a 6 mois
02.5K
HiveChat:适合公司内部快速部署的AI聊天机器人

HiveChat : le chatbot d'IA pour un déploiement rapide au sein des entreprises

Description générale HiveChat est un chatbot d'IA pour les petites et moyennes équipes qui permet aux administrateurs de configurer plusieurs modèles d'IA (tels que Deepseek, OpenAI, Claude et Gemini) en une seule fois pour une utilisation facile par les membres de l'équipe. Il ...
Il y a 6 mois
02.5K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool : la boîte à outils du passionné d'IA pour gérer, connecter et utiliser tous vos modèles d'IA dans un seul bureau !

Généralités Omnitool.ai est un "laboratoire d'IA" open source conçu pour fournir un environnement de bureau extensible basé sur un navigateur pour les apprenants, les amateurs et toute personne intéressée par les innovations actuelles en matière d'IA. Il permet aux utilisateurs de collaborer via une interface unifiée avec un large éventail d'experts en IA d'OpenAI, repl...
Il y a 6 mois
02.2K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V : un modèle vidéo de Vincennes prenant en charge l'entrée multilingue et la génération de vidéos de longue durée

Introduction complète Step-Video-T2V est un modèle avancé de conversion texte-vidéo de StepFun AI (StepFun Star). Le modèle a 3 milliards de paramètres et est capable de générer des vidéos jusqu'à 204 fps. Avec un Auto-Encoder Variable (VAE) profondément compressé, le modèle...
Il y a 6 mois
02.3K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser : captures d'écran de l'interface utilisateur analysées en éléments structurés pour faciliter la compréhension et la manipulation de grands modèles.

Introduction générale OmniParser est un outil développé par Microsoft pour analyser les captures d'écran de l'interface utilisateur en éléments structurés et faciles à comprendre. Cet outil améliore considérablement la capacité de GPT-4V à générer des actions précises dans la zone d'interface correspondante. Cet outil améliore considérablement la capacité de GPT-4V à générer des actions précises dans la zone d'interface correspondante....
Il y a 6 mois
02.2K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio : un cadre d'interaction vocale multimodale qui reconnaît la parole et communique à l'aide de la parole clonée, entre autres caractéristiques.

Introduction complète Step-Audio est un cadre d'interaction vocale intelligente open source conçu pour fournir des capacités de compréhension et de génération vocales prêtes à l'emploi pour les environnements de production. Le cadre prend en charge les conversations multilingues (par exemple, le chinois, l'anglais, le japonais), les discours émotionnels (par exemple, heureux, triste), les dialectes régionaux (par exemple, le cantonais, le sichuan ...
Il y a 6 mois
02.8K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Watermark Removal:open source image watermark removal tool, picture watermark recovery original image

Introduction générale Watermark Removal est un projet open source qui utilise des techniques d'apprentissage automatique et d'apprentissage profond pour la restauration d'images, en particulier pour supprimer les filigranes des images. Le projet a été développé par Chimzuruoke Okafor et s'inspire de Con...
Il y a 6 mois
03.2K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp : une plateforme open source d'entretien vocal avec IA génère des questions d'entretien personnalisées et une analyse intelligente

Introduction générale FoloUp est une plateforme open source conçue pour fournir aux entreprises des solutions d'entretiens vocaux alimentés par l'IA. Avec FoloUp, les entreprises peuvent rapidement générer des questions d'entretien personnalisées pour les descriptions de poste et mener des entretiens conversationnels naturels avec l'IA. La plateforme fournit également une analyse détaillée des entretiens...
il y a 5 mois
02.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM : Assistant de programmation Vim natif piloté par LLM, programmation intelligente en toute sécurité hors ligne

Introduction générale VimLM est un plugin Vim qui fournit un assistant de code piloté par le LLM (Large Language Model) natif. Interagissant avec le modèle LLM natif par le biais de commandes Vim, il obtient automatiquement le contexte du code et aide les utilisateurs à éditer du code dans Vim....
Il y a 6 mois
02.7K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI : un cadre pour l'évaluation automatisée de grands modèles de langage, comparant la qualité de la sortie de différents mots repères de grands modèles.

Introduction complète DeepEval est un cadre d'évaluation LLM open source facile à utiliser pour évaluer et tester de grands systèmes de modélisation du langage. Il est similaire à Pytest mais se concentre sur les tests unitaires de la sortie LLM. Il est similaire à Pytest, mais se concentre sur les tests unitaires des résultats LLM. DeepEval combine les derniers résultats de la recherche...
Il y a 6 mois
02.8K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic : un formulaire d'analyse de données en ligne qui intègre le dialogue avec l'IA et l'exécution du code

Description générale Quadratic est un tableur intelligent open source qui combine des fonctionnalités d'IA, de code et de connectivité des données conçues pour fournir aux utilisateurs de puissantes capacités de traitement et d'analyse des données. En prenant en charge des langages de programmation tels que Python, SQL et Rust, Quadratic...
Il y a 6 mois
02.6K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS : SadTalker amélioré pour générer des personnes numériques à partir de portraits vidéo

Description générale SadTalker-Video-Lip-Sync est un outil de synthèse labiale vidéo basé sur l'implémentation de SadTalkers. Le projet génère des formes de lèvres à partir de la voix et utilise une amélioration configurable de la région faciale pour améliorer la clarté des formes de lèvres générées...
Il y a 6 mois
02.2K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO : un modèle qui supporte les jeux de rôle et les dialogues complexes, avec des performances supérieures à 32b (avec installateur en un clic)

Introduction complète Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 est un modèle de langage efficace conçu pour supporter les jeux de rôles complexes et les dialogues à plusieurs tours. Profondément optimisé sur la base de Qwen 2.5-7B, il dispose d'une excellente...
Il y a 6 mois
03.3K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant : l'intelligence artificielle qui automatise les actions de bureau sur les appareils macOS

Introduction générale mac assistant est un projet d'intelligence artificielle conçu pour macOS, visant à simplifier les opérations de l'utilisateur en combinant le logiciel natif et les fonctionnalités web. Le projet prend actuellement en charge les API OpenAI et GEMINI, et prévoit de ...
Il y a 6 mois
02.7K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver : génère automatiquement des documents Markdown à partir de la structure et du contenu du code.

Introduction générale CodeWeaver est un outil en ligne de commande conçu pour tisser des bibliothèques de code dans des documents Markdown uniques et faciles à naviguer. Il génère une représentation structurée de la hiérarchie des fichiers d'un projet en analysant récursivement les répertoires et en intégrant le contenu de chaque fichier dans des blocs de code. Cet outil...
Il y a 6 mois
02.1K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI : Un cadre de travail Low-Code Multi-Intelligent Body pour simplifier les solutions d'automatisation des tâches complexes

Introduction complète PraisonAI est un framework multi-intelligence prêt à l'emploi pour les environnements de production, conçu pour créer des intelligences IA afin d'automatiser et de résoudre des problèmes allant de tâches simples à des défis complexes. Le framework fournit une solution low-code qui simplifie la construction de systèmes LLM à corps multi-intelligents et...
Il y a 6 mois
03.8K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN Chinese Podcast : saisie automatique d'articles technologiques populaires, l'IA génère des résumés en chinois et les convertit en podcasts.

Introduction générale Le projet de podcast chinois de Hacker News est une plateforme innovante basée sur la technologie de l'IA, visant à saisir automatiquement les articles populaires de Hacker News chaque jour et à générer des résumés en chinois et du contenu de podcast grâce à l'IA. Le projet est dirigé par ccbikai ...
Il y a 6 mois
02K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor : un outil pour gérer la collaboration multi-intelligence en utilisant des intelligences de supervision

Introduction générale LangGraph Supervisor est une bibliothèque Python basée sur le framework LangGraph, conçue pour créer et gérer des systèmes corporels multi-intelligents. La bibliothèque coordonne le travail de plusieurs agents spécialisés par l'intermédiaire d'un agent superviseur central, en veillant à ce que les flux de communication et les tâches soient répartis...
Il y a 6 mois
02.5K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder : projet open source pour la recherche d'inférences profondes à l'aide de connaissances locales

Introduction complète Deep Searcher est un outil puissant combinant de grands modèles de langage (LLM) et des bases de données vectorielles, conçu pour rechercher, évaluer et raisonner sur la base de données privées, en fournissant des réponses très précises et des rapports complets. Il convient à la gestion des connaissances des entreprises...
Il y a 6 mois
02.6K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research : un assistant de recherche approfondie basé sur l'IA fournissant des outils de recherche efficaces et des capacités de génération de rapports.

Introduction générale Deep Research est un assistant de recherche basé sur l'IA conçu pour effectuer une recherche approfondie itérative en combinant les moteurs de recherche, l'exploration du Web et les grands modèles de langage. Le projet a été publié par dzhng sur GitHub dans le but de fournir un générateur de recherche...
Il y a 4 mois
02.2K