Projet open source sur l'IA

Total 1020 articles
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance : l'API du modèle Gemini est compatible avec le format OpenAI, ce qui permet de lever les restrictions régionales et de prendre en charge l'interrogation de clés multi-API.

Introduction complète Gemini Balance est un service proxy d'API OpenAI développé sur la base du framework FastAPI, visant à fournir une gestion efficace des clés multi-API et des fonctionnalités d'optimisation. Le projet prend en charge les appels de modèle Gemini, et les principales...
Il y a 4 mois
02.9K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter : ajouter un son synchronisé à une vidéo silencieuse

Introduction générale FoleyCrafter est un projet open source développé par OpenMMLab pour générer des effets sonores vivants et synchronisés pour des vidéos muettes. Le projet utilise des techniques avancées d'intelligence artificielle pour générer des effets sonores sémantiquement pertinents et synchronisés dans le temps en analysant le contenu vidéo...
Il y a 8 mois
02.9K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent : un outil intelligent conçu pour analyser des données tabulaires complexes

Introduction complète TableGPT Agent est un outil intelligent basé sur le projet open source GitHub, conçu pour le traitement et l'analyse de données tabulaires. Il s'appuie sur le modèle de langage TableGPT2 et utilise l'interaction avec le langage naturel pour permettre aux utilisateurs d'interroger, de manipuler...
Il y a 6 mois
02.9K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG : à partir de textes et d'images, générer des graphiques vectoriels SVG projet open source

Introduction générale OmniSVG est un projet open source axé sur la génération de graphiques vectoriels de haute qualité (SVG) à l'aide d'un modèle multimodal. Il utilise des modèles visuels-linguistiques pré-entraînés pour supporter la génération de SVG à partir de descriptions textuelles ou d'entrées d'images, couvrant une large gamme de scénarios allant de simples icônes à des personnages d'anime complexes. Les éléments ...
Il y a 4 mois
02.9K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork : un corps intelligent qui commande des ordinateurs par la voix et le texte et qui fournit un retour d'information vocal en temps réel.

Introduction générale TankWork est un agent de bureau open source conçu pour permettre à l'IA de percevoir et de contrôler votre ordinateur grâce à la vision par ordinateur et à l'interaction au niveau du système. Le cadre permet aux agents de contrôler directement les ordinateurs par le biais de commandes vocales et textuelles, de traiter le contenu de l'écran en temps réel et de fournir des...
Il y a 7 mois
02.9K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

light card : HTML5 card generator tool, create beautiful content cards of simple tools

Description générale lightcard est un outil de génération de cartes simple et élégant conçu pour aider les utilisateurs à créer facilement de belles cartes de contenu. L'outil prend en charge le contenu textuel personnalisé, plusieurs styles de thèmes et les codes QR pour rendre la création plus facile et plus amusante. Les utilisateurs peuvent éditer le titre, le corps et l'auteur...
Il y a 8 mois
02.9K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy : Outil de conversation audio multilingue à partir de contenus multisources, une alternative open source aux capacités de podcasting de NotebookLM

Introduction générale Podcastfy est un paquetage Python open source qui utilise la technologie d'intelligence artificielle générative (GenAI) pour convertir du contenu web, des fichiers PDF, du texte, des images, des vidéos youtube et bien d'autres sources en...
Il y a 10 mois
02.9K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme : Assistant de programmation intelligent fonctionnant dans un terminal de ligne de commande, alternative localisée à l'interprète de code ChatGPT

Introduction générale GPTMe est un outil révolutionnaire d'assistance à l'IA pour les terminaux, conçu pour améliorer l'efficacité du travail des développeurs. Il combine parfaitement de puissantes capacités d'IA avec l'environnement du terminal, prenant en charge diverses fonctions telles que l'exécution de code, l'édition de fichiers, la navigation sur le web et la reconnaissance visuelle. Comme la résolution de code ChatGPT...
Il y a 8 mois
02.9K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw : SDK open source de tableau blanc illimité, AI pour générer des wireframes minimalistes et des diagrammes UML

Description générale tldraw est un outil de dessin collaboratif gratuit et instantané qui fournit une toile illimitée où les utilisateurs peuvent rapidement dessiner des graphiques, écrire du texte et collaborer instantanément. Doté d'une interface intuitive et d'excellentes performances, il convient à la collaboration en équipe et au travail à distance. Soutenu par la communauté open source, tldr...
Il y a 9 mois
02.8K
QAnything:高度集成RAG处理流程的本地知识库问答系统

QAnything : un système de questions et réponses sur la base de connaissances locales avec des processus RAG hautement intégrés

QAnything Introduction détaillée QAnything (Question and Answer based on Anything) est un système de questions-réponses de base de connaissances locale lancé par NetEase, qui prend en charge toutes sortes de formats de fichiers et de bases de données, et qui peut être installé et utilisé hors ligne.....
Il y a 11 mois
02.8K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher : Assistant à la correction de la prononciation de l'anglais

Introduction générale Gemini Teacher est un assistant d'apprentissage de l'anglais basé sur l'IA de Google Gemini. Il reconnaît la prononciation de l'anglais de l'utilisateur en temps réel et fournit un retour instantané et des suggestions de correction. L'outil est conçu pour aider les utilisateurs à améliorer leurs compétences...
Il y a 6 mois
02.8K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo : un cadre léger et flexible pour les organismes intelligents, avec une configuration simple des rôles et des outils pour gérer de multiples charges de travail.

Introduction générale Bambo est un nouveau type de framework proxy, qui est plus léger et plus flexible que les frameworks traditionnels, et qui peut gérer une variété de tâches de charge. Bambo réalise une fonctionnalité proxy efficace en définissant tous les outils dans le catalogue d'outils et en utilisant des fonctions personnalisées asynchrones. Les utilisateurs peuvent se servir de l'outil llm_c...
Il y a 8 mois
02.8K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio : un modèle audio de bout en bout pour l'interaction vocale en temps réel

Introduction complète Baichuan-Audio est un projet open source développé par Baichuan Intelligence (baichuan-inc), hébergé sur GitHub, qui se concentre sur la technologie d'interaction vocale de bout en bout. Le projet fournit un cadre de traitement audio complet qui permet de ...
il y a 5 mois
02.8K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash : Mise en œuvre rapide de la déduplication sémantique du texte pour améliorer l'efficacité du nettoyage des données

Introduction complète SemHash est un outil léger et flexible pour dédupliquer des ensembles de données par similarité sémantique. Il combine la génération rapide d'embedding de Model2Vec avec la recherche de similarité ANN (approximate nearest neighbour) de Vicinity....
Il y a 7 mois
02.8K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse : extrait des données non structurées de documents/multimédias et les analyse en données structurées.

Introduction générale OmniParse est une puissante plateforme d'analyse et d'optimisation de données conçue pour transformer toutes les données non structurées en données structurées, exploitables et optimisées pour le cadre GenAI (Generative Artificial Intelligence). Que vous travailliez avec des documents, des tableaux, des images, des vidéos, des fichiers audio ou...
Il y a 9 mois
02.8K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress : Fournir une solution de passerelle IA efficace pour simplifier la gestion des microservices et renforcer la sécurité

Introduction complète Higress est une passerelle API cloud-native développée par Alibaba, construite sur Istio et Envoy, conçue pour fournir une planification efficace du trafic, une gouvernance des services et des solutions de sécurité. Il prend en charge les extensions Wasm pour de nombreux langages de programmation pour les activités d'IA...
Il y a 9 mois
02.8K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-preview : un macromodèle de dialogue vocal anthropomorphique de bout en bout pour l'interaction en temps réel

SpeechGPT 2.0-preview est le premier système d'interaction anthropomorphique en temps réel introduit par OpenMOSS, qui est formé sur la base de millions d'heures de données vocales. Le système est équipé d'une expression vocale anthropomorphique et d'une réponse à faible latence de 100 ms, ce qui permet de...
Il y a 6 mois
02.8K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star : un outil open source pour améliorer la qualité de la génération d'images et de vidéos

Introduction complète CFG-Zero-star est un projet open source développé par Weichen Fan et l'équipe du S-Lab de l'Université technologique de Nanyang. Il se concentre sur l'amélioration de la technique Classifier Free Guidance (CFG) dans les modèles d'appariement de flux en optimisant la stratégie de ...
il y a 5 mois
02.8K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery : Windows Native AI Model Development Toolset, End-Side Model Integration into Windows Applications (en anglais)

Introduction générale AI Dev Gallery est une application d'outils de développement d'IA de Microsoft (actuellement en avant-première publique) conçue pour les développeurs Windows. Elle fournit une plateforme complète pour aider les développeurs à intégrer facilement des fonctionnalités d'IA dans leurs...
Il y a 7 mois
02.8K
Pyramid Flow:快手推出的开源版

Pyramid Flow : une version open source de "Kringle" lancée par Racer, basée sur SD3 et fonctionnant sur des GPU de moins de 8GB (version de déploiement en un clic)

Introduction complète Pyramid Flow est une méthode efficace de génération vidéo autorégressive basée sur la technique de correspondance des flux. La méthode permet d'obtenir une meilleure efficacité de calcul dans la génération et la décompression de contenu vidéo en interpolant entre différentes résolutions et différents niveaux de bruit...
Il y a 9 mois
02.8K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK : un outil open source pour faciliter le déploiement de modèles d'IA multimodaux

Introduction générale Aana SDK est un framework open source développé par Mobius Labs, nommé d'après le mot malayalam ആന (éléphant). Il aide les développeurs à déployer et à gérer rapidement des modèles d'IA multimodaux, en prenant en charge le traitement du texte, des images, de l'audio et de la vidéo, ainsi que d'autres données....
il y a 5 mois
02.8K
OmAgent:构建多模态智能设备的智能体框架

OmAgent : un corps intelligent pour la construction d'appareils intelligents multimodaux

Introduction OmAgent est un cadre multimodal de corps intelligent développé par Om AI Lab, visant à fournir de puissantes fonctionnalités alimentées par l'IA pour les appareils intelligents. En intégrant des modèles de base multimodaux et des algorithmes de corps intelligents de pointe, le projet permet aux développeurs de créer des appareils intelligents efficaces sur une variété de...
Il y a 7 mois
02.8K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI : une plateforme de dialogue pour l'analyse de données et la génération de graphiques en langage naturel

Introduction générale PandasAI est une plateforme open source basée sur Python conçue pour simplifier le processus d'analyse des données grâce à des techniques de traitement du langage naturel. Elle permet aux utilisateurs de travailler en dialogue avec des bases de données (par exemple SQL, CSV, pandas, polars, mongodb, n...
Il y a 9 mois
02.8K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research : générer des recherches sur l'IA à partir du contenu des recherches sur le web

Introduction générale Open Deep Research est un outil open source de génération de rapports de recherche pilotés par l'IA qui constitue une alternative open source aux capacités de recherche approfondie de Google Gemini. Le projet est développé en TypeScript et basé sur Next.js 1...
Il y a 4 mois
02.8K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter : Générer des illustrations graphiques continues et cohérentes basées sur une longue histoire.

Introduction générale Story-Adapter est un cadre innovant de visualisation d'histoires qui convertit des histoires textuelles en séquences d'images cohérentes. Développé par des chercheurs, ce projet utilise une approche itérative qui ne nécessite aucune formation pour générer des illustrations d'histoires de haute qualité. Le cadre se caractérise par sa capacité à gérer de longues...
Il y a 7 mois
02.8K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine : client d'analyse et de visualisation des données par l'IA pour la génération rapide de graphiques et de rapports

Introduction générale DataLine est un puissant outil d'analyse et de visualisation de données conçu pour aider les utilisateurs à interagir avec une variété de sources de données par le biais d'opérations simples. Qu'il s'agisse d'un fichier CSV ou d'une base de données classique telle que Postgres, MySQL, Snowflake, SQL...
Il y a 6 mois
02.8K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo : Générez des copies vidéo et de courtes vidéos HD en un seul clic en entrant un thème vidéo

Introduction complète MoneyPrinterTurbo est un projet open source qui utilise une technologie avancée d'intelligence artificielle pour générer de courtes vidéos HD en un seul clic. Les utilisateurs n'ont qu'à fournir un thème vidéo ou des mots-clés, le système générera automatiquement des copies vidéo, des clips vidéo, des sous-titres vidéo et...
il y a 5 mois
02.8K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal : outil open source avancé d'intégration et d'extraction de filigranes vidéo cachés pour protéger les droits d'auteur des vidéos

Introduction générale VideoSeal est un outil de tatouage vidéo open source développé par Facebook Research, conçu pour permettre l'intégration et l'extraction efficaces de tatouages vidéo. L'outil prend en charge les modèles open source les plus récents et contient des modèles pré-entraînés, un code d'entraînement, un code d'inférence et des outils d'évaluation...
Il y a 8 mois
02.8K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask : Permet aux utilisateurs d'interroger les bases de données SQLite et les fichiers CSV/JSON pour les données d'interrogation.

Introduction générale SQLite-Utils-Ask est un outil puissant conçu pour aider les utilisateurs à effectuer des requêtes de questions-réponses sur les bases de données SQLite et les fichiers CSV/JSON à l'aide de LLM (Large Language Model). L'outil est capable de générer automatiquement des questions...
Il y a 9 mois
02.8K
Data Formulator:AI驱动的数据可视化工具

Data Formulator : un outil de visualisation de données piloté par l'IA

Introduction générale Data Formulator est un outil open source de visualisation de données piloté par l'IA et développé par Microsoft Research. L'outil combine une interface utilisateur graphique (GUI) et une saisie en langage naturel (NL) pour permettre aux utilisateurs de créer et d'itérer rapidement par le biais d'interactions et de commandes simples...
Il y a 6 mois
02.8K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent : un assistant intelligent pour les médias sociaux qui génère et gère automatiquement le contenu des médias sociaux.

Introduction générale Social Media Agent (Social Media Agent) est un projet open source qui gère les informations d'interaction par la nouvelle boîte de réception de l'agent, conçue pour aider les utilisateurs à automatiser la génération et la gestion du contenu des médias sociaux. Le projet est développé par l'équipe LangChain...
Il y a 7 mois
02.8K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen : Outil d'édition vidéo parlant de portraits en 3D, piloté par l'audio et conscient de la profondeur

Introduction JoyGen est un cadre innovant de génération vidéo en deux étapes pour les visages parlants, qui se concentre sur la résolution du problème de la génération d'expressions faciales pilotée par l'audio. Développé par une équipe de Jingdong Technology, il utilise des techniques avancées de reconstruction 3D et des méthodes d'extraction de caractéristiques audio pour capturer avec précision les caractéristiques de l'identité du locuteur et l'expression...
Il y a 7 mois
02.8K
Vision Parse : Conversion intelligente de documents PDF au format Markdown à l'aide de modèles de langage visuel

Vision Parse : Conversion intelligente de documents PDF au format Markdown à l'aide de modèles de langage visuel

Introduction Vision Parse est un outil révolutionnaire de traitement de documents, il combine astucieusement la technologie la plus avancée des modèles de langage visuel (Vision Language Models), la capacité de convertir intelligemment des documents PDF en format Markdown de haute qualité...
Il y a 8 mois
02.8K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader : Téléchargez rapidement la vidéo WeChat Video No., supporte plusieurs formats et plateformes.

Introduction complète WeChat Video No. Downloader est un projet open source conçu pour aider les utilisateurs à télécharger rapidement du contenu vidéo à partir des numéros vidéo WeChat. L'outil prend en charge une variété de formats vidéo et de plateformes, et les utilisateurs peuvent facilement l'utiliser sur les systèmes Windows et macOS. Le projet est développé par ltaoo et hébergé sur...
Il y a 7 mois
02.8K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow : base de connaissances conversationnelle basée sur GraphRAG/outil de recherche en profondeur sur le web avec des dialogues qui peuvent être intégrés dans d'autres sites web.

Introduction générale AutoFlow est un outil open source développé par PingCAP pour construire des bases de connaissances basées sur des graphes avec le stockage vectoriel sans serveur TiDB. Il intègre les frameworks LlamaIndex et DSPy pour prendre en charge la recherche de dialogues complexes et les graphes de connaissances...
Il y a 7 mois
02.8K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT : Construction d'un cadre de développement d'applications de données natives de l'IA, intégrant la gestion multi-modèle et le traitement intelligent des données

Introduction DB-GPT est un cadre open source de développement d'applications de données natives de l'IA construit à l'aide d'AWEL (Agentic Workflow Expression Language) et des technologies du corps intelligent. Le projet vise à construire une infrastructure dans le domaine des grands modèles...
il y a 5 mois
02.8K
CogView3:智谱轻言开源的级联扩散文本生成图像模型

CogView3 : modèle d'image de génération de texte par diffusion en cascade de Wisdom Spectrum (open source)

Introduction complète CogView3 est un système avancé de génération d'images par le texte développé par l'Université Tsinghua et Think Tank Team (Chi Spectrum Qingyan). Il est basé sur un modèle de diffusion en cascade et génère des images de haute résolution en plusieurs étapes. Il est basé sur un modèle de diffusion en cascade et génère des images de haute résolution à travers plusieurs étapes.
Il y a 10 mois
02.8K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

ChatGPT Service Degradation Monitoring Tool : Détection des dégradations du service ChatGPT

Introduction complète L'outil de surveillance de la dégradation du service ChatGPT est un projet open source conçu pour aider les utilisateurs à détecter si leur service ChatGPT a été dégradé en raison d'IP à haut risque. L'outil analyse les valeurs de difficulté de la preuve de travail (PoW) pour déterminer si les utilisateurs...
Il y a 8 mois
02.8K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS : simulation multi-intelligence des interactions de millions d'utilisateurs dans les médias sociaux pour étudier des phénomènes sociaux complexes

Introduction générale OASIS (Open Agent Social Interaction Simulations) est un simulateur de médias sociaux open source capable de simuler le comportement d'un million d'utilisateurs. La plateforme combine un modèle de langage à grande échelle avec un...
il y a 5 mois
02.8K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS : générer des modèles de synthèse vocale spécifiques au locuteur à partir d'un texte d'entrée

Introduction générale Parler-TTS est une bibliothèque de modèles de synthèse vocale (TTS) open source développée par Hugging Face, conçue pour générer une parole de haute qualité et à consonance naturelle. Le modèle est capable de générer de la parole à partir d'un texte d'entrée avec un style de locuteur spécifique (par exemple, le genre, la hauteur, le style d'élocution...
Il y a 6 mois
02.8K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna : Still Portrait Reference Video Pose Generation Video to Make Missy's Photos Dance

Introduction générale X-Dyna est un projet open source développé par ByteDance qui vise à générer des animations de portraits dynamiques grâce à des techniques de diffusion sans échantillonnage. Le projet utilise les expressions faciales et les mouvements du corps dans les vidéos d'entraînement pour animer des images de portraits individuels, générant ainsi des effets de mouvement réalistes et adaptés au contexte.X-D...
Il y a 7 mois
02.8K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank : gestion du budget quotidien alimentée par l'IA pour un suivi facile des budgets quotidiens

Description générale Porkybank est une application open source de gestion des finances personnelles conçue pour aider les utilisateurs à suivre facilement leur budget quotidien. Avec une formule simple (revenus - dépenses) / jours = argent liquide, les utilisateurs peuvent visualiser leur situation financière. Le projet est hébergé sur GitHu...
Il y a 7 mois
02.8K
GaiaNet node:安装和运行自己的本地模型在线代理服务

Nœud GaiaNet : installez et exécutez votre propre modèle local de service proxy en ligne

Introduction générale GaiaNet-AI/gaianet-node est un projet open source qui permet aux utilisateurs d'installer rapidement la pile logicielle de nœuds par défaut sur Mac, Linux ou Windows WSL à l'aide d'une seule commande. Les utilisateurs peuvent initialiser les noeuds, personnaliser les configurations, télécharger...
Il y a 11 mois
02.8K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Agent Laboratory : assistant automatisé de rédaction de codes et d'études pour les chercheurs

Introduction complète Agent Laboratory est un flux de travail de recherche autonome de bout en bout conçu pour aider les chercheurs à concrétiser leurs idées de recherche. Le système se compose d'agents dédiés pilotés par des modèles de langage à grande échelle qui prennent en charge l'ensemble du flux de travail de la recherche - de la réalisation d'analyses documentaires et de l'élaboration de plans à l'exécution de...
Il y a 4 mois
02.8K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Corrige les chaînes JSON invalides et résout les erreurs de formatage possibles dans les données JSON générées par les LLM.

Description générale Un module pour corriger les fichiers JSON invalides, en particulier pour analyser les données JSON incorrectes produites par les grands modèles de langage (LLM). Le module corrige les erreurs de syntaxe JSON courantes telles que les guillemets manquants, les virgules incorrectes, les...
Il y a 10 mois
02.8K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi : un cadre de dialogue vocal en temps réel avec prise en charge de plusieurs langues et accents pour les modèles de base du dialogue vocal

Introduction générale Moshi Chat est un assistant vocal d'IA en temps réel de bout en bout conçu par Kyutai, un laboratoire d'IA français à but non lucratif. Il ne se contente pas d'écouter en temps réel, mais s'engage également dans des conversations naturelles et prend en charge les interactions multimodales, y compris la capacité de voir, d'entendre et de parler.Moshi Ch...
Il y a 11 mois
02.8K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG : un outil basé sur les graphes hétérogènes pour la recherche et la génération d'informations précises

Une introduction complète NodeRAG est un système open source de génération augmentée de recherche d'information (RAG) hébergé sur GitHub et développé par Terry-Xu-666. Il optimise la recherche et la génération d'informations grâce à des structures de graphes hétérogènes, améliorant de manière significative la précision de la recherche et la pertinence contextuelle.Nod...
Il y a 4 mois
02.8K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI : un assistant IA pour la recherche approfondie multilingue

Introduction complète Deep Research Web UI est un outil d'aide à la recherche open source basé sur la technologie de l'IA, conçu pour aider les utilisateurs à mener des recherches itératives approfondies sur n'importe quel sujet. Il combine la puissance des moteurs de recherche, de l'exploration du web et de la modélisation du langage à grande échelle à travers une interface web intuitive...
Il y a 4 mois
02.8K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilot backend proxy service : reprendre le serveur de plugin GitHub Copilot avec d'autres modèles

Introduction générale Le Copilot Backend Agent Service est un projet open source conçu pour gérer le serveur de plugins GitHub Copilot en s'appuyant sur d'autres modèles FIM tels que DeepSeek, tout en prenant en charge plusieurs personnes partageant des comptes officiels. Le service supporte une variété d'IDE, y compris V...
Il y a 8 mois
02.8K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Report mAIstro : génère des rapports détaillés sur n'importe quel sujet personnalisé, tel que l'analyse commerciale, les rapports de fin d'année, etc.

Description générale Report mAIstro est un outil puissant conçu pour aider les utilisateurs à créer facilement des rapports personnalisés grâce à la technologie de traitement du langage naturel. L'outil utilise la technologie LangChain pour transformer les sujets et les structures fournis par l'utilisateur en rapports détaillés dans...
Il y a 4 mois
02.8K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch : moteur de recherche IA open source pour déployer votre propre moteur de recherche Perplexity !

Introduction complète MindSearch est un moteur de recherche IA open source lancé par le Shanghai Artificial Intelligence Laboratory (SAL), qui vise à simuler le processus de pensée humaine pour la collecte et l'intégration d'informations complexes. L'outil combine les technologies avancées de la modélisation du langage à grande échelle (LLM) et des moteurs de recherche par le biais de la multi-intelligence...
Il y a 8 mois
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table : un outil open source pour l'extraction et l'exploration efficaces de données structurées

Introduction complète Knowledge Table (Knowledge Table) est un projet open source conçu pour simplifier le processus d'extraction et d'exploration de données structurées à partir de documents non structurés. Les utilisateurs peuvent créer des représentations de connaissances structurées telles que des tableaux et des graphiques par le biais d'une interface d'interrogation en langage naturel. L'outil permet de personnaliser l'extraction ...
Il y a 10 mois
02.8K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat : un client de dialogue IA qui utilise l'intelligence MCP pour effectuer des tâches complexes

Introduction générale HyperChat est un client de chat open source développé par BigSweetPotatoStudio et hébergé sur GitHub, conçu pour fournir une vue d'ensemble du modèle de langage BigSweetPotatoStudio en intégrant les API de plusieurs grands modèles de langage (LLM) tels que OpenAI, Cla...
il y a 5 mois
02.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph : construction de graphes de connaissances et de moteurs de recherche personnels exécutés localement

Introduction générale Unigraph est un graphe de connaissances et un moteur de recherche personnel local et polyvalent conçu pour fournir aux utilisateurs un espace de travail intégré qui les aide à gérer et à rechercher une grande variété de données dans leur vie personnelle. Avec Unigraph, les utilisateurs peuvent intégrer des données provenant de différentes sources dans un...
Il y a 7 mois
02.8K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

InspireMusic : le cadre open source de génération unifiée de musique, de chansons et d'audio d'Ali

Introduction générale InspireMusic est une boîte à outils open source basée sur PyTorch et axée sur la génération de musique, de chansons et d'audio. Il fournit un cadre unifié pour la génération d'audio de haute qualité avec des contrôles pour les indices de texte, la structure de la musique et le style de...
il y a 5 mois
02.8K
Vector Vein(向量脉络):无代码AI工作流构建平台

Vector Vein : Plate-forme de construction de flux de travail d'IA sans code

Introduction complète Vector Vein est une plateforme de construction de flux de travail d'IA sans code, conçue pour aider les utilisateurs à créer facilement des flux de travail intelligents et automatisés. Sans aucune base de programmation, les utilisateurs peuvent simplement connecter divers modules fonctionnels par des opérations de glisser-déposer pour construire des flux de travail d'IA complexes....
Il y a 8 mois
02.8K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow : Construire des mini-intelligences LLM avec une "Directed Graph Structure" en 100 lignes de code

Introduction générale miniLLMFlow est un cadre de développement minimaliste de Large Language Model (LLM) qui ne contient que 100 lignes de code, démontrant la philosophie de conception de "garder les choses simples". Le cadre est spécifiquement conçu pour permettre aux assistants IA (par exemple ChatGPT, Claude, etc.) de...
Il y a 7 mois
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA : Système localisé d'automatisation des courriels pour la génération rapide de projets de réponses aux courriels (Gmail)

Introduction générale LAMBDA (Local Auto MailBox Draft Assistant) est un système d'automatisation d'email AI localisé conçu pour apprendre du style d'email d'un utilisateur et générer un brouillon pour chaque email non lu dans la boîte de réception Gmail....
Il y a 8 mois
02.8K
基于RAG构建提供健康建议的小助手(实验项目)

Construction d'un mini-assistant fournissant des conseils en matière de santé sur la base de RAG (projet pilote)

Introduction générale LLM-RAG-Longevity-Coach est un chatbot basé sur les technologies LLM (Large Language Modelling) et RAG (Retrieval Augmented Generation) conçu pour fournir aux utilisateurs des conseils personnalisés en matière de santé et de longévité. Le projet a été développé par Tyler Burle...
Il y a 6 mois
02.8K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola : application web de chat IA open source avec téléchargement de documents et prise en charge de modèles multiples

Introduction générale Zola est une application de chat IA gratuite et open source développée par le développeur Julien Thibeaut (nom d'utilisateur GitHub ibelick) et hébergée sur GitHub. Sa meilleure caractéristique est qu'elle supporte plusieurs modes d'IA...
Il y a 4 mois
02.7K
Flock:低代码工作流编排快速构建聊天机器人

Flock : orchestration de flux de travail low-code pour la construction rapide de chatbots

Introduction générale Flock est une plateforme open source low-code pour les flux de travail, hébergée sur GitHub et développée par l'équipe Onelevenvy. Elle est basée sur les technologies LangChain et LangGraph et a pour but d'aider les utilisateurs à construire rapidement des machines à discuter...
Il y a 6 mois
02.7K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground : Déploiement sans serveur d'un site de dialogue multimodal Gemini

Introduction générale Gemini Playground est un projet open source conçu pour aider les utilisateurs à déployer rapidement un site de dialogue multimodal. Le projet est développé par des crevettes techniques, il supporte l'utilisation de la clé API de Gemini en 10 secondes pour compléter le déploiement. Que l'utilisateur soit ...
Il y a 6 mois
02.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit : un ensemble complet d'outils pour la construction d'intelligences IA basées sur LangGraph

Introduction complète Le AI Agent Service Toolkit est un ensemble d'outils complet basé sur LangGraph, FastAPI et Streamlit, conçu pour aider les développeurs à créer et à exécuter rapidement des services d'agents d'intelligence artificielle. La boîte à outils fournit...
Il y a 7 mois
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker : extraction et catégorisation de documents en données structurées pour optimiser le processus de traitement des documents

Introduction ExtractThinker est un outil flexible d'intelligence documentaire qui extrait et classifie des données structurées à partir de documents en utilisant de grands modèles de langage (LLM), fournissant un flux de travail de traitement de documents transparent de type ORM. Il prend en charge une variété de chargeurs de documents, y compris Tess...
Il y a 7 mois
02.7K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank : un modèle pour générer directement des voix de rap à partir de paroles et de pistes d'accompagnement (jeu de données actuellement ouvert)

Introduction générale RapBank est un ensemble de données et d'outils conçus pour la génération de paroles de rap. Le projet a été créé par NZqian pour fournir aux chercheurs et aux développeurs des données de haute qualité sur les paroles de rap en collectant et en traitant les chansons de rap de YouTube...
Il y a 8 mois
02.7K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox : une interface de gestion pour l'interaction homme-machine avec les intelligences IA

Introduction générale Agent Inbox est un projet open source développé par l'équipe LangChain pour fournir une nouvelle expérience utilisateur pour interagir avec des intelligences IA. Le projet permet aux utilisateurs de gérer et d'optimiser les interactions avec plusieurs intelligences IA à travers une interface centralisée.Ag...
Il y a 7 mois
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge : un environnement de programmation visuelle open source pour tester et évaluer l'efficacité de grands modèles de langue

Introduction générale ChainForge est un environnement de programmation visuelle open source conçu pour tester et évaluer l'efficacité des repères des grands modèles de langage (LLM). Il fournit un environnement d'ingénierie de repérage de flux de données grâce auquel les utilisateurs peuvent rapidement explorer et analyser la qualité de différents repères sur la réponse LLM....
Il y a 8 mois
02.7K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0 : basé sur le modèle d'OCR multimodal de bout en bout QWen2 0.5B

Introduction complète GOT-OCR2.0 est un modèle de reconnaissance optique de caractères (OCR) Open Source co-proposé par StepStar, qui vise à faire évoluer la technologie OCR vers OCR-2.0 grâce à un modèle unifié de bout en bout. Le modèle prend en charge un large éventail de tâches d'OCR, y compris la reconnaissance de textes normaux, de gr...
Il y a 11 mois
02.7K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara : Service de stockage et de recherche de documents basé sur l'intégration visuelle

Introduction générale ColiVara est un service de stockage et de récupération de documents basé sur la technologie de l'intégration visuelle. Il élimine le besoin de reconnaissance optique de caractères (OCR) ou d'extraction de texte et évite les problèmes de formulaires brisés ou d'images perdues.ColiVara prend en charge plus de 100 formats de fichiers, y compris PDF...
Il y a 6 mois
02.7K
Atomic Agents:构建轻量级模块化AI智能体框架

Agents atomiques : un cadre pour la construction d'intelligences IA modulaires et légères

Introduction générale Atomic Agents est un cadre extrêmement léger et modulaire conçu autour du concept d'atomicité pour construire des pipelines et des applications d'intelligence artificielle. Le framework fournit un ensemble d'outils et d'agents qui peuvent être combinés pour créer des applications puissantes. Il est basé sur Instruc...
Il y a 8 mois
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter : Wisdom Spectrum a lancé un modèle puissant de génération de textes ultra-longs, permettant de générer plus de 10 000 mots dans une seule conversation.

Introduction complète LongWriter est un puissant outil de génération de textes longs développé par le groupe de recherche sur l'exploration des données de l'université de Tsinghua (THUDM). L'outil est basé sur le modèle de langage avancé Long Context (LLM) et est capable de générer des textes longs de plus de 10 000 mots.
Il y a 8 mois
02.7K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel : technologie révolutionnaire de génération d'images à ultra-haute résolution avec des détails d'image riches

Introduction générale UltraPixel est une technologie avancée de génération d'images à ultra-haute résolution conçue pour créer des images de très haute qualité et riches en détails. Elle a été développée par l'utilisateur GitHub catcathh et présentée à NeurIPS 2024.U...
Il y a 10 mois
02.7K
Austen:分析书籍角色关系并生成图表的AI工具

Austen : un outil d'IA pour analyser les relations entre les personnages d'un livre et générer des graphiques

Introduction générale Austen est un outil d'IA open source qui utilise le framework Angular et l'initialisation Analogjs, combinés à la technologie Mermaidjs pour générer des graphiques qui aident les utilisateurs à analyser les relations entre les personnages dans les livres. Les utilisateurs peuvent entrer dans Open...
Il y a 4 mois
02.7K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html : extrait les données du corps de l'URL HTML, produit du texte brut/markdown

Introduction générale magic-html est une bibliothèque Python conçue pour simplifier le processus d'extraction du contenu de la région du corps à partir du HTML. Qu'il s'agisse de structures HTML complexes ou de simples pages web, cette bibliothèque vise à fournir une interface pratique et efficace aux utilisateurs. Elle supporte l'extraction multimodale...
Il y a 11 mois
02.7K