Projet open source sur l'IA

Total 1020 articles
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel : technologie révolutionnaire de génération d'images à ultra-haute résolution avec des détails d'image riches

Introduction générale UltraPixel est une technologie avancée de génération d'images à ultra-haute résolution conçue pour créer des images de très haute qualité et riches en détails. Elle a été développée par l'utilisateur GitHub catcathh et présentée à NeurIPS 2024.U...
Il y a 10 mois
02.8K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher : outil automatisé de recherche approfondie pour rédiger des rapports de recherche complets

Introduction générale OpenDeepResearcher est un outil de recherche approfondie automatisé open source conçu pour améliorer l'efficacité de la recherche grâce à des techniques d'intelligence artificielle. Le projet est développé par mshumer et hébergé sur GitHub.OpenDeepResear...
Il y a 4 mois
02.8K
Atomic Agents:构建轻量级模块化AI智能体框架

Agents atomiques : un cadre pour la construction d'intelligences IA modulaires et légères

Introduction générale Atomic Agents est un cadre extrêmement léger et modulaire conçu autour du concept d'atomicité pour construire des pipelines et des applications d'intelligence artificielle. Le framework fournit un ensemble d'outils et d'agents qui peuvent être combinés pour créer des applications puissantes. Il est basé sur Instruc...
Il y a 8 mois
02.8K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID : téléchargez une image et migrez les fonctions de portrait pour générer différents styles d'images.

Introduction complète InstantID est une technologie avancée qui permet de générer des images avec des styles ou des poses personnalisés en quelques secondes, tout en garantissant un niveau élevé de fidélité à l'aide d'une seule image d'identification de référence. La technologie utilise une solution basée sur un modèle de diffusion en intégrant des images faciales, des cartes de repères...
Il y a 12 mois
02.8K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox : une interface de gestion pour l'interaction homme-machine avec les intelligences IA

Introduction générale Agent Inbox est un projet open source développé par l'équipe LangChain pour fournir une nouvelle expérience utilisateur pour interagir avec des intelligences IA. Le projet permet aux utilisateurs de gérer et d'optimiser les interactions avec plusieurs intelligences IA à travers une interface centralisée.Ag...
Il y a 7 mois
02.8K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator : un outil pour convertir le contenu web en flux RSS via l'IA

Introduction générale AI RSS est un outil innovant qui convertit le contenu web en flux RSS grâce à la technologie de l'intelligence artificielle. Il se compose de deux parties principales : un plugin de navigateur et un côté serveur. Le plugin du navigateur permet aux utilisateurs de sélectionner des listes à partir de pages web et de générer des fichiers de description de données structurées (SDD)...
Il y a 7 mois
02.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent : un nouveau cadre d'orchestration d'agents piloté par LLM et EKG (connaissance du secteur)

Introduction générale muAgent est un cadre multi-intelligentsia innovant développé par Ant Group. Ce cadre permet aux utilisateurs d'exécuter diverses procédures opérationnelles standard (POS) complexes sous la direction de l'homme, par le biais d'un système de glisser-déposer et d'écriture de texte simple, en collaboration avec des intelligences multiples, des appels de fonction, des interprètes de code et d'autres technologies...
Il y a 9 mois
02.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html : extrait les données du corps de l'URL HTML, produit du texte brut/markdown

Introduction générale magic-html est une bibliothèque Python conçue pour simplifier le processus d'extraction du contenu de la région du corps à partir du HTML. Qu'il s'agisse de structures HTML complexes ou de simples pages web, cette bibliothèque vise à fournir une interface pratique et efficace aux utilisateurs. Elle supporte l'extraction multimodale...
Il y a 11 mois
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table : un outil open source pour l'extraction et l'exploration efficaces de données structurées

Introduction complète Knowledge Table (Knowledge Table) est un projet open source conçu pour simplifier le processus d'extraction et d'exploration de données structurées à partir de documents non structurés. Les utilisateurs peuvent créer des représentations de connaissances structurées telles que des tableaux et des graphiques par le biais d'une interface d'interrogation en langage naturel. L'outil permet de personnaliser l'extraction ...
Il y a 10 mois
02.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant : l'intelligence artificielle qui automatise les actions de bureau sur les appareils macOS

Introduction générale mac assistant est un projet d'intelligence artificielle conçu pour macOS, visant à simplifier les opérations de l'utilisateur en combinant le logiciel natif et les fonctionnalités web. Le projet prend actuellement en charge les API OpenAI et GEMINI, et prévoit de ...
Il y a 6 mois
02.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box : Plugin de navigateur pour que ChatGPT fonctionne sur d'autres pages Web

Introduction générale ChatGPT Box est une extension de navigateur open source conçue pour intégrer en profondeur ChatGPT dans le navigateur de l'utilisateur. Développé par josStorer, l'outil supporte plusieurs langues et offre une variété de fonctionnalités telles que l'appel de paires de chat sur n'importe quelle page...
Il y a 4 mois
02.8K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security : outil open source d'analyse des vulnérabilités LLM qui fournit des tests fuzz complets et des techniques d'attaque.

Introduction générale Agentic Security est un outil d'analyse des vulnérabilités LLM (Large Language Model) open source conçu pour fournir aux développeurs et aux professionnels de la sécurité des techniques complètes de fuzz testing et d'attaque. L'outil prend en charge des ensembles de règles personnalisés ou des attaques basées sur des agents et est capable d'intégrer LLM AP...
Il y a 6 mois
02.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev : Outil de génération de code et de débogage automatisé avec support multilingue

Introduction générale AutoDev est un projet open source développé par l'équipe Unit Mesh et hébergé sur GitHub, visant à améliorer l'efficacité de la programmation des développeurs grâce à une technologie d'intelligence artificielle. Il s'agit d'un puissant assistant de codage qui prend en charge de nombreux langages de programmation, y compris Ja...
Il y a 6 mois
02.8K
zChunk:基于Llama-70B的通用语义分块策略

zChunk : une stratégie générique de découpage sémantique basée sur Llama-70B

Introduction zChunk est une nouvelle stratégie de découpage développée par ZeroEntropy qui vise à fournir une solution pour le découpage sémantique générique. La stratégie est basée sur le modèle Llama-70B, qui optimise le processus de découpage des documents en demandant la génération de morceaux, garantissant ainsi que la recherche d'informations est maintenue à un niveau élevé....
Il y a 6 mois
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA : Système localisé d'automatisation des courriels pour la génération rapide de projets de réponses aux courriels (Gmail)

Introduction générale LAMBDA (Local Auto MailBox Draft Assistant) est un système d'automatisation d'email AI localisé conçu pour apprendre du style d'email d'un utilisateur et générer un brouillon pour chaque email non lu dans la boîte de réception Gmail....
Il y a 8 mois
02.8K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI : outil d'intégration du protocole MCP (Model Context Protocol) pour les applications d'intelligence artificielle

Introduction générale Klavis AI est une plateforme open source visant à simplifier l'utilisation et l'intégration du Model Context Protocol (MCP), une norme ouverte qui permet aux applications d'intelligence artificielle de se connecter dynamiquement à des outils et des sources de données externes....
Il y a 3 mois
02.8K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar : portraits 2D audio de personnes numériques interactives en temps réel, fonctionnant à 30 images par seconde sur l'unité centrale.

Introduction générale LiteAvatar est un outil open source développé par l'équipe HumanAIGC (qui fait partie d'Ali) qui se concentre sur la génération d'animations faciales à partir d'avatars 2D pilotés par l'audio en temps réel. Il fonctionne à 30 images par seconde (fps) en s'appuyant uniquement sur le CPU, et est particulièrement adapté...
Il y a 6 mois
02.8K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko : Workflows intelligents en langage naturel pour l'automatisation des postes de travail et des navigateurs

Introduction générale Eko est un framework JavaScript de niveau production conçu pour construire des flux de travail d'agents intelligents efficaces par le biais de descriptions en langage naturel. Il est conçu pour permettre aux développeurs d'automatiser des tâches quotidiennes à l'aide de technologies d'IA sans programmation profonde....
il y a 5 mois
02.8K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX : Un organisme intelligent pour l'analyse des radiographies du thorax à l'aide de macromodèles multimodaux

Introduction complète MedRAX est une intelligence artificielle de pointe conçue pour l'analyse des radiographies pulmonaires (CXR). Il intègre des outils d'analyse CXR de pointe et des modèles multimodaux de langage étendu pour traiter dynamiquement des requêtes médicales complexes sans formation supplémentaire.
il y a 5 mois
02.8K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion : le cadre de planification et d'inférence de bout en bout pour la conduite autonome de Xiaomi (open source)

Introduction complète Orion est un projet open source développé par Xiaomi Labs, qui se concentre sur la technologie de conduite autonome de bout en bout (E2E). Il résout le problème de l'insuffisance du raisonnement causal dans les scénarios complexes des méthodes traditionnelles de conduite autonome grâce à des modèles de langage visuel (VLM) et à des planificateurs génératifs.
Il y a 4 mois
02.8K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker : extraction et catégorisation de documents en données structurées pour optimiser le processus de traitement des documents

Introduction ExtractThinker est un outil flexible d'intelligence documentaire qui extrait et classifie des données structurées à partir de documents en utilisant de grands modèles de langage (LLM), fournissant un flux de travail de traitement de documents transparent de type ORM. Il prend en charge une variété de chargeurs de documents, y compris Tess...
Il y a 7 mois
02.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground : Déploiement sans serveur d'un site de dialogue multimodal Gemini

Introduction générale Gemini Playground est un projet open source conçu pour aider les utilisateurs à déployer rapidement un site de dialogue multimodal. Le projet est développé par des crevettes techniques, il supporte l'utilisation de la clé API de Gemini en 10 secondes pour compléter le déploiement. Que l'utilisateur soit ...
Il y a 6 mois
02.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro : un outil pour simplifier le processus de mise au point des modèles des principaux langages visuels open source

Introduction complète Maestro est un outil développé par Roboflow pour simplifier et accélérer le processus de mise au point de modèles multimodaux, afin que chacun puisse entraîner ses propres macromodèles visuels. Il fournit des recettes prêtes à l'emploi pour affiner les modèles de langage visuel (VLM) populaires tels que F...
Il y a 6 mois
02.7K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat : Chatbots personnalisés pour l'intégration rapide de sources de données multiples

Introduction générale OpenChat est une console de chatbot conviviale conçue pour simplifier l'utilisation des grands modèles de langage (LLM). Grâce à un processus de configuration en deux étapes, OpenChat permet aux utilisateurs de créer et de gérer facilement plusieurs chatbots personnalisés. La plateforme prend en charge les G...
Il y a 7 mois
02.7K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks : convertir des ebooks epub en audiobooks m4b

Introduction générale Autiobooks est un outil open source conçu pour aider les utilisateurs à convertir rapidement les livres électroniques au format .epub en livres audio au format .m4b. Il utilise la technologie de synthèse vocale de haute qualité fournie par Kokoro pour générer un son naturel et fluide. Cet outil est alimenté par...
il y a 5 mois
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter : Wisdom Spectrum a lancé un modèle puissant de génération de textes ultra-longs, permettant de générer plus de 10 000 mots dans une seule conversation.

Introduction complète LongWriter est un puissant outil de génération de textes longs développé par le groupe de recherche sur l'exploration des données de l'université de Tsinghua (THUDM). L'outil est basé sur le modèle de langage avancé Long Context (LLM) et est capable de générer des textes longs de plus de 10 000 mots.
Il y a 8 mois
02.7K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度

VoAPI : système de gestion de l'interface de transfert de modèles d'IA de grande valeur, le site web officiel fournit un quota d'API gratuit sur une base quotidienne.

Introduction complète VoAPI est un nouveau système de gestion et de distribution d'interface de modèle IA de haut niveau et de haute performance, qui est principalement utilisé pour la gestion interne et les canaux de distribution des particuliers ou des entreprises. Développé sur la base de NewAPI, le système fournit des modules fonctionnels riches et une interface utilisateur optimisée, dans le but d'améliorer...
Il y a 9 mois
02.7K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用

Exa & Deepseek Chat App : application de chat open source pour la recherche en temps réel sur le web et le raisonnement intelligent

Introduction complète Exa & Deepseek Chat App est une application de chat intelligente open source, dont les principales fonctionnalités comprennent la recherche en temps réel sur le Web à l'aide des API d'Exa et l'utilisation du modèle de langage R1 de Deepseek pour...
Il y a 6 mois
02.7K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI : Construction d'un système intelligent de questions-réponses sur les documents et construction simple d'une base de connaissances privée sur le Web

Introduction complète RAG Web UI est un système de dialogue intelligent basé sur la technologie RAG (Retrieval Augmented Generation). Il aide les entreprises et les particuliers à créer des systèmes de questions-réponses intelligents basés sur leur propre base de connaissances. En combinant la recherche de documents et les modèles linguistiques, RAG Web UI fournit des réponses précises et...
Il y a 7 mois
02.7K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna : Utilisation des techniques RAG pour générer des requêtes SQL précises à partir de texte

Introduction complète Vanna est un framework Python open source sous licence MIT qui permet de générer des requêtes SQL grâce aux techniques RAG (Retrieval Augmented Generation). Les utilisateurs peuvent entraîner des modèles RAG, les appliquer à leurs propres données, puis poser des questions, et Vanna retournera les s...
Il y a 7 mois
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge : un environnement de programmation visuelle open source pour tester et évaluer l'efficacité de grands modèles de langue

Introduction générale ChainForge est un environnement de programmation visuelle open source conçu pour tester et évaluer l'efficacité des repères des grands modèles de langage (LLM). Il fournit un environnement d'ingénierie de repérage de flux de données grâce auquel les utilisateurs peuvent rapidement explorer et analyser la qualité de différents repères sur la réponse LLM....
Il y a 8 mois
02.7K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain : conversion de la parole en texte en temps réel et optimisation des mots prononcés

Introduction générale WhisperChain est un projet open source basé sur l'IA, hébergé sur GitHub et dirigé par le développeur Chris Choy. Il est principalement utilisé pour convertir la parole en texte et optimiser automatiquement l'expression grâce à la technologie de l'IA, en supprimant les redondances...
il y a 5 mois
02.7K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR : Un modèle Open Source pour la reconnaissance vocale multilingue de haute précision

Introduction générale FireRedASR est un modèle de reconnaissance vocale développé par l'équipe du Little Red Book FireRed, dont l'objectif est de fournir des solutions de reconnaissance vocale automatique (ASR) de haute précision et supportées par plusieurs langues. Le projet est hébergé sur GitHub pour les développeurs et les chercheurs, et offre...
il y a 5 mois
02.7K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor : un outil pour gérer la collaboration multi-intelligence en utilisant des intelligences de supervision

Introduction générale LangGraph Supervisor est une bibliothèque Python basée sur le framework LangGraph, conçue pour créer et gérer des systèmes corporels multi-intelligents. La bibliothèque coordonne le travail de plusieurs agents spécialisés par l'intermédiaire d'un agent superviseur central, en veillant à ce que les flux de communication et les tâches soient répartis...
Il y a 6 mois
02.7K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT : Outil d'essayage virtuel IA haute fidélité pour une meilleure authenticité des détails du vêtement

Introduction FitDiT est un système d'essayage virtuel haute fidélité basé sur les transformateurs de diffusion (Diffusion Transformers). Développé par le Tencent AI Lab, le projet vise à remédier aux limites des systèmes d'essayage virtuels traditionnels en montrant les détails des vêtements.
Il y a 7 mois
02.7K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder : projet open source pour la recherche d'inférences profondes à l'aide de connaissances locales

Introduction complète Deep Searcher est un outil puissant combinant de grands modèles de langage (LLM) et des bases de données vectorielles, conçu pour rechercher, évaluer et raisonner sur la base de données privées, en fournissant des réponses très précises et des rapports complets. Il convient à la gestion des connaissances des entreprises...
Il y a 6 mois
02.7K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine : Moteur Open Source pour le déploiement de FLUX à faible niveau d'exigence, Wan 2.1

Introduction générale DiffSynth-Engine est un projet open source lancé par ModelScope, hébergé sur GitHub. Il est basé sur la technologie de modélisation de la diffusion, se concentre sur la génération efficace d'images et de vidéos, et convient aux développeurs pour déployer des modèles d'IA dans des environnements de production....
il y a 5 mois
02.7K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Fragments : versions libres d'applications telles que Claude Artifacts d'Anthropic, Vercel v0 ou GPT Engineer.

Introduction générale Fragments by E2B est un projet open source qui fournit un modèle basé sur Next.js pour construire des applications entièrement générées par l'IA. Développé par E2B, le projet vise à simplifier et à accélérer le processus de développement d'applications d'IA. Il intègre une variété de...
Il y a 9 mois
02.7K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat : Interface de chat Web simple avec modèles d'IA multiplateformes intégrés (sans déploiement)

Introduction générale OrionChat est une interface de chat en IA basée sur le web qui fournit aux utilisateurs une plateforme unifiée pour interagir avec plusieurs modèles d'IA grand public. Le projet prend en charge un large éventail de modèles d'IA, notamment Ollama (exécuté localement), OpenAI GPT, Google Gemi...
Il y a 8 mois
02.7K
FramePack:6G低显存快速生成长视频的开源项目

FramePack : 6G de mémoire graphique faible croissance rapide de la vidéo longue projet open source

Introduction générale FramePack est un outil de génération vidéo open source qui vise à rendre les techniques de diffusion vidéo plus pratiques. Il découple la charge de travail de la génération de la longueur de la vidéo en compressant les images d'entrée à une longueur fixe par le biais d'un réseau neuronal unique de prédiction de l'image suivante. Cela signifie que même lors de la génération de longues vidéos, les besoins en mémoire...
Il y a 3 mois
02.7K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone : outil d'IA permettant d'extraire les vêtements d'une personne sous la forme d'une image d'affichage de vêtements en mosaïque

Introduction complète TryOffAnyone est un outil de traitement d'images par IA spécialement conçu pour résoudre les problèmes de présentation des vêtements dans le secteur du commerce électronique. Il est capable de convertir intelligemment des photos de personnes réelles portant des vêtements en images à effet d'affichage plat. Cette technologie est basée sur la dernière technologie Latent Dif...
Il y a 7 mois
02.7K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT : Plate-forme Open Source de modélisation financière en Big Language pour l'analyse et la prédiction financières

Introduction générale FinGPT est une plateforme open source de modélisation des grands langages financiers développée par la Fondation AI4Finance, conçue pour le secteur financier afin de résoudre des tâches financières complexes et de stimuler l'innovation dans la fintech....
Il y a 7 mois
02.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA : Un outil d'apprentissage par renforcement multimodal pour explorer le raisonnement visuel

Introduction complète MM-EUREKA est un projet open source développé par le laboratoire d'intelligence artificielle de Shanghai, l'université Jiao Tong de Shanghai et d'autres parties. Il étend les capacités de raisonnement textuel aux scénarios multimodaux grâce à des techniques d'apprentissage par renforcement basées sur des règles afin d'aider les modèles à traiter les images et les informations textuelles. Le cœur de cet outil...
il y a 5 mois
02.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js : un modèle Next.js pour construire des applications d'IA de dialogue vocal en temps réel

Introduction complète OpenAI Realtime API Next.js est un projet open source basé sur le framework Next.js , conçu pour aider les développeurs à créer rapidement des applications d'IA vocale en temps réel. Le projet intègre l'API en temps réel d'OpenAI et la technologie WebRTC...
Il y a 7 mois
02.7K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy : une bibliothèque Python open source pour les scientifiques des données pour une analyse efficace des données et des applications d'IA.

Introduction générale Taipy est une puissante bibliothèque Python développée par Avaiga, conçue pour les data scientists et les ingénieurs en apprentissage automatique afin de créer et de déployer rapidement des applications web basées sur les données....
Il y a 8 mois
02.7K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic : un formulaire d'analyse de données en ligne qui intègre le dialogue avec l'IA et l'exécution du code

Description générale Quadratic est un tableur intelligent open source qui combine des fonctionnalités d'IA, de code et de connectivité des données conçues pour fournir aux utilisateurs de puissantes capacités de traitement et d'analyse des données. En prenant en charge des langages de programmation tels que Python, SQL et Rust, Quadratic...
Il y a 6 mois
02.7K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档

Doc2XAPITranslate : traduction plein texte de documents : traduisez rapidement des documents PDF/MD anglais en documents chinois.

Introduction complète Doc2XAPITranslate est un puissant outil de traduction de documents en texte intégral conçu pour traduire rapidement des documents PDF ou Markdown anglais en documents chinois. L'outil prend en charge une variété de traducteurs, y compris DeepSeek, OpenAI, O...
Il y a 6 mois
02.7K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor : un outil d'IA pour fournir un tutorat personnalisé, un projet de tuteur personnel d'IA open source construit sur Llama 3.1

Introduction générale Llama Tutor est un projet open source de tuteur personnel d'IA construit sur Llama 3.1, conçu pour fournir aux utilisateurs une expérience d'apprentissage personnalisée. En intégrant plusieurs piles technologiques telles que Together AI, Next.js et T...
Il y a 9 mois
02.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker : système de dialogue intelligent pour les personnes numériques, combinant de grands modèles linguistiques et des modèles visuels pour de nouvelles expériences interactives

Introduction générale Linly-Talker est un système numérique innovant de dialogue humain qui combine de grands modèles de langage (LLM) avec des modèles visuels pour créer une nouvelle approche de l'interaction homme-machine. Le système intègre une variété de technologies telles que Whisper, Linly, Micros...
Il y a 6 mois
02.7K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos : World Base Model, une plateforme pour la construction de modèles de base d'IA du monde physique

Introduction complète NVIDIA Cosmos est une plateforme de modélisation basée sur le monde pour les développeurs, spécialement conçue pour aider les développeurs d'IA physique à construire leurs systèmes d'IA physique mieux et plus rapidement. La plateforme propose une gamme de modèles pré-entraînés, dont des modèles de diffusion et des modèles autorégressifs...
Il y a 7 mois
02.7K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook : une clé pour générer des livres audio de qualité sonore naturelle, prise en charge des formats PDF, epub, docx et autres.

Introduction complète QuickPiperAudiobook est un projet open source conçu pour convertir une variété de formats de texte (e.g. epub, mobi, txt, PDF, HTML, etc.) en livres audio à la sonorité naturelle par le biais d'une simple commande. L'outil utilise Pi...
Il y a 10 mois
02.7K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo : un outil sûr et fiable pour tester les applications LLM

Introduction complète promptfoo est un outil en ligne de commande et une bibliothèque open source dédiés à l'évaluation et au test en équipe rouge des applications du Large Language Model (LLM). Il fournit aux développeurs un ensemble complet d'outils pour construire des invites, des modèles et des générations basées sur la recherche (RAG) fiables avec...
Il y a 6 mois
02.7K
Docs:开源的协作笔记和文档管理工具

Docs : outils open source de gestion collaborative de notes et de documents

Introduction générale Docs est une plateforme open source de prise de notes collaborative et de gestion de documents développée par l'équipe de suitenumerique. Elle est construite à l'aide des technologies Django et React dans le but de fournir un outil facile à utiliser pour aider les utilisateurs à prendre des notes, à gérer...
il y a 5 mois
02.7K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D : une plateforme d'IA pour générer des ressources numériques modélisées en 3D à haute résolution

Introduction générale Neural4D est une plateforme innovante basée sur l'IA qui aide les utilisateurs à générer rapidement des modèles 3D et des animations de haute qualité à partir d'une simple saisie de texte ou d'image. Développée par DreamTech, elle s'appuie sur la première technologie mondiale de génération de grands modèles 3D de bout en bout...
Il y a 6 mois
02.7K
Meeting:本地实时转录和生成会议纪要的开源客户端

Réunion : transcription locale en temps réel et génération de comptes rendus de réunion du client open source

Introduction générale Meeting Minutes (alias Meetily) est un outil gratuit et open source d'assistant de réunion IA développé par Zackriya Solutions, qui se concentre sur la capture de l'audio des réunions en temps réel, la génération de texte transcrit et l'extraction automatique...
il y a 5 mois
02.7K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook : Cursor open source pour la conception frontale, concevoir et publier du code dans les applications React.

Introduction générale Onlook est un outil de conception open source construit pour les concepteurs et les développeurs qui permet aux utilisateurs de concevoir directement dans une application React en cours d'exécution et de convertir les modifications de conception en code. L'outil offre une expérience d'édition visuelle intuitive similaire à Figma ou Webf...
Il y a 6 mois
02.7K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1 : projet open-source de génération efficace de vidéo qui prétend générer une vidéo d'une minute en moins d'une minute

Introduction complète Magic 1-For-1 est un modèle de génération vidéo efficace conçu pour optimiser l'utilisation de la mémoire et réduire la latence de l'inférence. Le modèle décompose la tâche de génération texte-vidéo en deux sous-tâches : la génération texte-image et la génération image-vidéo, ce qui permet une formation et une distillation plus efficaces....
Il y a 6 mois
02.7K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant : Un plugin WordPress AI Assistant pour le dialogue, la génération d'articles et la traduction

Introduction complète WordPress AI Assistant Plugin (wp-ai-chat) est un plugin WordPress open source conçu pour fournir aux utilisateurs une variété de fonctionnalités IA, y compris le dialogue IA, la génération d'articles, le résumé d'articles, la traduction d'articles et la lecture de contenu. Le plugin supporte l'ancrage de plusieurs ...
Il y a 6 mois
02.7K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

Interface graphique GLIGEN : contrôle précis de la position des éléments de l'image, interface graphique intuitive basée sur ComfyUI

Introduction générale GLIGEN GUI est une interface graphique intuitive basée sur ComfyUI, conçue pour simplifier l'utilisation du modèle GLIGEN, un nouveau modèle texte-image qui permet de spécifier avec précision la position des objets dans une image. Avec GLIGE...
Il y a 11 mois
02.7K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge : le moyen le plus rapide d'exécuter et d'affiner LLM localement !

Introduction générale LlamaEdge est un projet open source conçu pour simplifier le processus d'exécution et d'ajustement des grands modèles de langage (LLM) sur les appareils locaux ou périphériques. Le projet prend en charge la famille de modèles Llama2 et fournit des services API compatibles avec l'OpenAI qui permettent aux utilisateurs de créer et d'exécuter...
Il y a 7 mois
02.7K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover : un créateur de couvertures en ligne conçu pour générer des couvertures personnalisées pour les blogs, les vidéos courtes, les médias sociaux et bien plus encore !

Introduction générale Mini-Cover est un outil open source de génération de couvertures en ligne conçu pour générer des couvertures personnalisées pour des plateformes telles que les blogs, les vidéos courtes et les médias sociaux. Développé par JLinMr, l'outil vise à fournir une solution simple et efficace pour aider les utilisateurs à générer rapidement des couvertures qui répondent à leurs besoins...
Il y a 8 mois
02.7K
TubeTube:自部署YouTube视频下载工具

TubeTube : outil de téléchargement de vidéos YouTube à déploiement automatique

Introduction générale TubeTube est un outil open source de téléchargement de vidéos YouTube développé par MattBlackOnly. L'outil utilise yt-dlp comme moteur de téléchargement principal, supporte les téléchargements multi-threads et est capable de télécharger rapidement plusieurs vidéos en même temps. Les utilisateurs peuvent yam...
Il y a 6 mois
02.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm : implémentation open source de NotebookLM basée sur Deepseek-V3 et PlayHT TTS

Introduction générale Open Source NotebookLM est un projet innovant d'intelligence artificielle qui combine les capacités de compréhension du langage de Deepseek-V3 avec la technologie de synthèse vocale de PlayHT, dans le but de créer un système de dialogue intelligent pour la prise de notes. Le projet a été développé par Build Fast...
Il y a 7 mois
02.7K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW : un client d'intelligence artificielle complet, léger et multiplateforme avec des plug-ins extensibles

Introduction complète AIaW (AI as Workspace) est un client d'IA de nouvelle génération conçu pour fournir des solutions complètes, légères et extensibles. La plateforme prend en charge un large éventail de fournisseurs de services, dont OpenAI, Anthropic et Google, et est capable de...
Il y a 8 mois
02.7K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen : Génération de dessins au trait et de croquis de haute qualité, rétropropagation des mots clés de l'image, installation du paquet en un seul clic.

Introduction générale Sketch-Gen est un outil de dessin au trait et de génération de croquis basé sur la technologie de l'IA, conçu pour aider les artistes et les designers à générer rapidement des dessins au trait et des croquis de haute qualité. Dérivé du projet Paints-UNDO, l'outil utilise des modèles avancés d'apprentissage...
Il y a 8 mois
02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2 : un modèle multimodal open source pour soutenir la compréhension vidéo et les dialogues multiples

Introduction complète CogVLM2 est un modèle multimodal open source développé par le Tsinghua University Data Mining Research Group (THUDM), basé sur l'architecture Llama3-8B, et visant à fournir des performances comparables ou même supérieures à GPT-4V. Le modèle prend en charge la compréhension des images, le dialogue...
Il y a 6 mois
02.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo : un client Python qui démontre le processus de fonctionnement d'un organisme intelligent, en fournissant une interface graphique intuitive.

Introduction complète AgentClientDemo est un projet Python complet qui intègre des fonctionnalités intelligentes (Agent) et clientes (Client). Le projet est basé sur le framework PyQt et fournit une interface graphique intuitive et facile à utiliser (G...
Il y a 8 mois
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak : outil open-source pour détecter les vulnérabilités LLM et sécuriser l'IA générative

Introduction complète NVIDIA Garak est un outil open source spécialement conçu pour détecter les vulnérabilités dans les grands modèles de langage (LLM). Il vérifie le modèle pour de multiples faiblesses telles que les illusions, les fuites de données, l'injection d'indices, la génération de messages d'erreur, la génération de contenu nuisible, etc. par le biais de sondages statiques, dynamiques et adaptatifs...
Il y a 9 mois
02.7K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni : un modèle de compréhension multimodale en bout de chaîne prenant en charge la compréhension et l'analyse multimodales de textes, d'images et de sons

Introduction Infini-Megrez est une solution d'intelligence artificielle développée par le dôme de base incontesté (Infinigence AI), visant à atteindre une compréhension et une analyse multimodales efficaces grâce à la co-conception de matériel et de logiciel. Le cœur du projet est le modèle Megrez-3B, qui prend en charge les graphes...
Il y a 7 mois
02.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink : un cadre de rédaction pour générer des essais longs et de qualité, en recherchant des connaissances externes, puis en y réfléchissant et en construisant un arbre de connaissances étape par étape.

Introduction OmniThink est un cadre innovant de rédaction automatique conçu pour générer des essais longs de haute qualité en imitant l'expansion itérative et la réflexion des processus cognitifs humains. L'objectif est de repousser les limites de la connaissance et de générer des informations riches et profondes....
Il y a 7 mois
02.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V : un modèle vidéo de Vincennes prenant en charge l'entrée multilingue et la génération de vidéos de longue durée

Introduction complète Step-Video-T2V est un modèle avancé de conversion texte-vidéo de StepFun AI (StepFun Star). Le modèle a 3 milliards de paramètres et est capable de générer des vidéos jusqu'à 204 fps. Avec un Auto-Encoder Variable (VAE) profondément compressé, le modèle...
Il y a 6 mois
02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model : Vidéo de référence de la carte de portrait statique Vidéo de génération de mouvement de portrait

Introduction générale Thin-Plate-Spline-Motion-Model est un projet révolutionnaire de génération d'animations d'images présenté à la CVPR 2022. Le projet est basé sur la théorie des transformées splines à plaques minces et est capable d'obtenir un mouvement de haute qualité à partir d'images...
Il y a 7 mois
02.7K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Système d'investissement IA : système automatisé de prise de décision en matière d'investissement en actions A, utilisant un système multi-intelligence pour analyser les données du marché.

Introduction complète A_Share_investment_Agent est un outil d'aide à la décision d'investissement en actions A basé sur un système de multi-intelligence. Le système est conçu pour analyser les données du marché, calculer la valeur intrinsèque des actions, analyser le sentiment du marché et les données fondamentales par le biais de multiples intelligences collaboratives pour...
Il y a 7 mois
02.7K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM : l'outil de développement Open Source Low-Code de Shangtang pour la création d'applications corporelles multi-intelligentes

Introduction complète LazyLLM est un outil open source développé par l'équipe LazyAGI, qui vise à simplifier le processus de développement d'applications multi-intelligence à grand modèle. Il aide les développeurs à créer rapidement des applications d'IA complexes grâce à un déploiement en un clic et à des mécanismes de passerelle légers, évitant ainsi une configuration technique fastidieuse...
Il y a 6 mois
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Ensemble de données de distillation DeepSeek-R1 à sang complet basé en Chine, prend en charge l'ensemble de données SFT de distillation R1 en Chine

Introduction complète Le jeu de données chinois DeepSeek-R1 distillation est un jeu de données chinois open source contenant 110 000 pièces de données conçues pour soutenir l'apprentissage automatique et la recherche sur le traitement du langage naturel. Le jeu de données est publié par l'équipe NLP de Cong Liu. Le jeu de données contient non seulement des données mathématiques, mais aussi un grand nombre de types généraux...
Il y a 6 mois
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft : outils open source de conversion de documents PDF numérisés en Markdown

Introduction générale PDF Craft est un outil open source conçu pour scanner des PDF de livres et les convertir au format Markdown. Il a été développé par oomol-lab et est hébergé sur GitHub pour les utilisateurs qui souhaitent organiser leurs livres électroniques. L'outil fonctionne à travers ce ...
il y a 5 mois
02.7K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI : client d'assistant intelligent pour le chat de groupe WeChat pour Windows

Introduction WeChatAI est un assistant intelligent personnel et de chat de groupe WeChat basé sur Python, supportant une variété de grands modèles de langage (tels que DeepSeek, Gemini, Tongyi Thousand Questions), qui peut réaliser des dialogues intelligents, des réponses automatiques et d'autres fonctions. Le projet utilise des modèles ...
Il y a 6 mois
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool : un client de visualisation de flux de travail pour les modèles d'IA basés sur l'orchestration de nœuds

Introduction générale NodeTool est une plateforme innovante de création d'IA conçue pour fournir une interface simple et intuitive aux passionnés d'IA, aux développeurs, aux scientifiques des données et aux créatifs. Que vous soyez artiste, développeur ou débutant, NodeTool vous aide à créer rapidement des prototypes...
Il y a 8 mois
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit : une boîte à outils open source pour connecter des intelligences IA au protocole Solana

Introduction générale Solana Agent Kit est une boîte à outils open source conçue pour connecter de manière transparente les intelligences IA au protocole de la blockchain Solana. Le kit permet aux chercheurs en IA et aux développeurs de crypto-monnaies d'utiliser n'importe quel corps intelligent entraîné par...
Il y a 6 mois
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

Editeur WeChat Markdown : outils de mise en page graphique WeChat simples et efficaces, une clé pour coller l'article au numéro public WeChat

Introduction complète WeChat Markdown Editor (WeChat Markdown Editor) est un outil de mise en page graphique WeChat très concis conçu pour aider les utilisateurs à créer facilement de beaux messages WeChat. L'éditeur prend en charge tous les ...
Il y a 7 mois
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc : extraction de contenu et synthèse de connaissances à partir de documents massifs et multi-sources

Introduction wdoc est un puissant système RAG (Retrieval Augmentation Generation) conçu pour traiter et analyser un grand nombre de documents divers. Il est capable de récupérer un grand nombre de types de documents, y compris des PDF, des pages web, des vidéos YouTube, des fichiers audio, etc. wdoc est particulièrement adapté au traitement...
Il y a 6 mois
02.7K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit : recherche sur le web et rédaction de rapports à l'aide de LLM natifs, en approfondissant automatiquement les sujets spécifiés par l'utilisateur et en générant des résumés.

Introduction générale Research Rabbit est un assistant de recherche et de résumé en ligne basé sur le LLM (Large Language Model). Après que l'utilisateur ait fourni un sujet de recherche, Research Rabbit génère une requête de recherche, obtient des résultats web pertinents et résume ces résultats...
Il y a 4 mois
02.7K