Projet open source sur l'IA

Total 1020 articles
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型

HunyuanVideoGP : un modèle hybride de génération vidéo avec prise en charge du fonctionnement des GPU bas de gamme

Introduction générale HunyuanVideoGP est un modèle de génération vidéo à grande échelle développé par DeepBeepMeep et conçu pour les utilisateurs de GPU bas de gamme. Le modèle est une version améliorée du modèle Hunyuan Video original, réduisant de manière significative les besoins en mémoire et en mémoire graphique...
Il y a 6 mois
01.9K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

InspireMusic : le cadre open source de génération unifiée de musique, de chansons et d'audio d'Ali

Introduction générale InspireMusic est une boîte à outils open source basée sur PyTorch et axée sur la génération de musique, de chansons et d'audio. Il fournit un cadre unifié pour la génération d'audio de haute qualité avec des contrôles pour les indices de texte, la structure de la musique et le style de...
il y a 5 mois
02.7K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground : Déploiement sans serveur d'un site de dialogue multimodal Gemini

Introduction générale Gemini Playground est un projet open source conçu pour aider les utilisateurs à déployer rapidement un site de dialogue multimodal. Le projet est développé par des crevettes techniques, il supporte l'utilisation de la clé API de Gemini en 10 secondes pour compléter le déploiement. Que l'utilisateur soit ...
Il y a 6 mois
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc : extraction de contenu et synthèse de connaissances à partir de documents massifs et multi-sources

Introduction wdoc est un puissant système RAG (Retrieval Augmentation Generation) conçu pour traiter et analyser un grand nombre de documents divers. Il est capable de récupérer un grand nombre de types de documents, y compris des PDF, des pages web, des vidéos YouTube, des fichiers audio, etc. wdoc est particulièrement adapté au traitement...
Il y a 6 mois
02.6K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1 : projet open-source de génération efficace de vidéo qui prétend générer une vidéo d'une minute en moins d'une minute

Introduction complète Magic 1-For-1 est un modèle de génération vidéo efficace conçu pour optimiser l'utilisation de la mémoire et réduire la latence de l'inférence. Le modèle décompose la tâche de génération texte-vidéo en deux sous-tâches : la génération texte-image et la génération image-vidéo, ce qui permet une formation et une distillation plus efficaces....
Il y a 6 mois
02.6K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine : client d'analyse et de visualisation des données par l'IA pour la génération rapide de graphiques et de rapports

Introduction générale DataLine est un puissant outil d'analyse et de visualisation de données conçu pour aider les utilisateurs à interagir avec une variété de sources de données par le biais d'opérations simples. Qu'il s'agisse d'un fichier CSV ou d'une base de données classique telle que Postgres, MySQL, Snowflake, SQL...
Il y a 6 mois
02.8K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot : un corps intelligent pour améliorer l'efficacité de l'analyse des données financières et de la recherche en investissement

Introduction complète FinRobot est une plateforme d'intelligence IA open source développée par la Fondation AI4Finance et conçue pour l'analyse financière. Elle couvre non seulement les modèles de langage traditionnels, mais incorpore également une variété de technologies d'IA, visant à fournir une solution complète pour l'industrie financière.F...
Il y a 6 mois
02.5K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

Simba : un système de gestion des connaissances pour l'organisation des documents, intégré de manière transparente dans tout système RAG.

Introduction générale Simba est un système de gestion des connaissances (KMS) portable conçu pour s'intégrer de manière transparente à n'importe quel système RAG (Retrieval Augmentation Generation). Créé par l'utilisateur de GitHub GitHamza0206, le projet fournit une solution de gestion des connaissances efficace pour...
Il y a 6 mois
02.3K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG : Outil de chat intelligent pour soutenir les questions-réponses locales sur les documents PDF multi-sources

Introduction complète LocalPdfChatRAG est un projet open source qui vise à mettre en œuvre une fonctionnalité de chat intelligent en combinant des documents PDF locaux avec des modèles de Génération Augmentée de Récupération (RAG). Le projet permet aux utilisateurs de télécharger des documents PDF et de poser des questions en langage naturel pour passer du document à la...
Il y a 6 mois
02.4K
Deep Searcher:企业私有文档高效检索与智能问答

Deep Searcher : extraction efficace de documents privés d'entreprise et questions-réponses intelligentes

Description générale Deep Searcher est un outil qui combine de puissants modèles de langage (tels que DeepSeek et OpenAI) et des bases de données vectorielles (telles que Milvus) conçus pour rechercher, évaluer et raisonner sur la base de données privées, en fournissant des réponses très précises....
Il y a 6 mois
02K
LineAvatars:生成 Notion 风格线条头像的免费工具

LineAvatars : un outil gratuit pour générer des avatars de lignes de style Notion

Description générale LineAvatars est un outil en ligne gratuit et facile à utiliser, conçu pour générer des avatars de style Notion. Les utilisateurs peuvent télécharger une photo ou prendre une photo via une webcam et le système générera automatiquement un avatar en ligne en utilisant l'IA. Cet outil...
Il y a 6 mois
02.4K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku : génère des vidéos détaillées et cohérentes, idéales pour créer des publicités avec des personnages et des objets détaillés.

Introduction complète Goku est un modèle fédéré de génération d'images et de vidéos basé sur des techniques de transformation de flux conçues pour atteindre des performances de niveau industriel. Il intègre des techniques avancées de génération visuelle de haute qualité, y compris le regroupement de données à grain fin, la conception du modèle et la formulation de la transformation de flux....
Il y a 6 mois
03.2K
Data Formulator:AI驱动的数据可视化工具

Data Formulator : un outil de visualisation de données piloté par l'IA

Introduction générale Data Formulator est un outil open source de visualisation de données piloté par l'IA et développé par Microsoft Research. L'outil combine une interface utilisateur graphique (GUI) et une saisie en langage naturel (NL) pour permettre aux utilisateurs de créer et d'itérer rapidement par le biais d'interactions et de commandes simples...
Il y a 6 mois
02.8K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE : une application d'IA iOS open source basée sur des modèles OLMoE fonctionnant hors ligne

Introduction générale Ai2 OLMoE est une application iOS open source développée par l'Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence) pour fournir des modèles d'IA fonctionnant entièrement sur des appareils. L'application s'appuie sur le logiciel open source ol...
Il y a 6 mois
03.5K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily : un assistant IA pour générer des comptes rendus de réunions, transcrire et générer des résumés de réunions en temps réel.

Description générale Meetily est un assistant de réunion doté d'une intelligence artificielle, développé par Zackriya Solutions, qui capture l'audio des réunions en temps réel, effectue la transcription vocale et génère des résumés de réunion. Il est unique en ce sens que tout le traitement est effectué localement sur l'appareil, ce qui garantit la confidentialité de l'utilisateur...
Il y a 6 mois
03.1K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2 : un modèle expert de langage visuel pour une compréhension multimodale avancée

Introduction complète DeepSeek-VL2 est une série de modèles avancés de langage visuel avec mélange d'experts (MoE) qui améliorent de manière significative les performances de son prédécesseur, DeepSeek-VL. Les modèles sont utiles pour les questions-réponses visuelles, la reconnaissance...
Il y a 6 mois
03K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box : Plugin de navigateur pour que ChatGPT fonctionne sur d'autres pages Web

Introduction générale ChatGPT Box est une extension de navigateur open source conçue pour intégrer en profondeur ChatGPT dans le navigateur de l'utilisateur. Développé par josStorer, l'outil supporte plusieurs langues et offre une variété de fonctionnalités telles que l'appel de paires de chat sur n'importe quelle page...
Il y a 4 mois
02.6K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant : Un plugin WordPress AI Assistant pour le dialogue, la génération d'articles et la traduction

Introduction complète WordPress AI Assistant Plugin (wp-ai-chat) est un plugin WordPress open source conçu pour fournir aux utilisateurs une variété de fonctionnalités IA, y compris le dialogue IA, la génération d'articles, le résumé d'articles, la traduction d'articles et la lecture de contenu. Le plugin supporte l'ancrage de plusieurs ...
Il y a 6 mois
02.6K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo : un outil sûr et fiable pour tester les applications LLM

Introduction complète promptfoo est un outil en ligne de commande et une bibliothèque open source dédiés à l'évaluation et au test en équipe rouge des applications du Large Language Model (LLM). Il fournit aux développeurs un ensemble complet d'outils pour construire des invites, des modèles et des générations basées sur la recherche (RAG) fiables avec...
Il y a 6 mois
02.6K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

NoneBot DeepSeek Plugin : dialogue intelligent pour le service clientèle basé sur NoneBot & DeepSeek.

Introduction générale Le plugin NoneBot DeepSeek est un plugin NoneBot qui intègre le modèle DeepSeek et est conçu pour fournir un dialogue intelligent et une fonctionnalité de questions-réponses. En accédant au modèle DeepSeek, les utilisateurs peuvent utiliser le plugin NoneBot ...
Il y a 6 mois
02.5K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit : une boîte à outils open source pour connecter des intelligences IA au protocole Solana

Introduction générale Solana Agent Kit est une boîte à outils open source conçue pour connecter de manière transparente les intelligences IA au protocole de la blockchain Solana. Le kit permet aux chercheurs en IA et aux développeurs de crypto-monnaies d'utiliser n'importe quel corps intelligent entraîné par...
Il y a 6 mois
02.5K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora : Extraction de sous-titres de livres audio et traduction multilingue, transcription de livres audio en plusieurs langues

Introduction LiberSonora, qui signifie "son libre", est un puissant ensemble d'outils de livres audio open source basé sur l'intelligence artificielle. Il prend en charge l'extraction intelligente de sous-titres, la génération de titres par l'IA, la traduction multilingue, etc. et est capable d'effectuer un traitement hors ligne par lots sous accélération GPU.LiberSo...
Il y a 6 mois
02.4K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock : outil d'analyse boursière basé sur l'IA, suivi en temps réel de cotations boursières sélectionnées par l'utilisateur et analyse approfondie basée sur l'IA

Introduction complète go-stock est un outil d'analyse boursière basé sur l'IA et construit sur Wails et NaiveUI. L'outil est capable de surveiller en temps réel les cotations boursières, d'afficher les coûts et les profits/pertes et de déclencher des alarmes. Toutes les données sont sauvegardées localement pour...
Il y a 6 mois
02.9K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers : moteur de performance pour l'inférence de grands modèles : accélération extrême, autonomisation flexible

KTransformers : Un cadre Python de haute performance pour briser le goulot d'étranglement de l'inférence de grands modèles. C'est plus qu'un simple outil d'exécution de modèle, c'est un ensemble de moteurs d'optimisation de performances extrêmes et une plateforme flexible d'habilitation d'interface. KTransf...
Il y a 6 mois
03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG : un cadre RAG pour comprendre les vidéos ultra-longues avec un support pour la recherche multimodale et la construction de graphes de connaissances.

Introduction complète VideoRAG est un cadre génératif amélioré par la recherche d'information conçu pour traiter et comprendre les vidéos contextuelles de très longue durée. L'outil associe une base de connaissances textuelles orientée graphe à un encodage contextuel multimodal hiérarchique pour traiter efficacement sur un seul GPU NVIDIA RTX 3090...
Il y a 6 mois
03K
Instructor:简化大语言模型结构化输出工作流的Python库

Instructeur : une bibliothèque Python pour simplifier les flux de production structurés pour les grands modèles de langage

Introduction générale Instructor est une bibliothèque Python populaire conçue pour traiter les résultats structurés des grands modèles de langage (LLM). Construite sur Pydantic, elle fournit une API simple, transparente et conviviale pour gérer les données...
Il y a 6 mois
02.4K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX : Un organisme intelligent pour l'analyse des radiographies du thorax à l'aide de macromodèles multimodaux

Introduction complète MedRAX est une intelligence artificielle de pointe conçue pour l'analyse des radiographies pulmonaires (CXR). Il intègre des outils d'analyse CXR de pointe et des modèles multimodaux de langage étendu pour traiter dynamiquement des requêtes médicales complexes sans formation supplémentaire.
il y a 5 mois
02.7K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot : robot de messagerie instantanée open source de grande taille, compatible avec le déploiement multiplateforme de robots IA (WeChat, QQ, Flybook, etc.)

LangBot est une plateforme de bot de messagerie instantanée basée sur un grand modèle qui prend en charge plusieurs plateformes de messagerie et de grands modèles. La plateforme s'adapte à QQ, WeChat (WeChat d'entreprise, WeChat personnel), Flybook, Discord, OneBot et d'autres plateformes de messagerie, et prend en charge Open...
Il y a 6 mois
02.9K
zChunk:基于Llama-70B的通用语义分块策略

zChunk : une stratégie générique de découpage sémantique basée sur Llama-70B

Introduction zChunk est une nouvelle stratégie de découpage développée par ZeroEntropy qui vise à fournir une solution pour le découpage sémantique générique. La stratégie est basée sur le modèle Llama-70B, qui optimise le processus de découpage des documents en demandant la génération de morceaux, garantissant ainsi que la recherche d'informations est maintenue à un niveau élevé....
Il y a 6 mois
02.4K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

Hibiki : un modèle de traduction vocale en temps réel, une traduction en continu qui préserve les caractéristiques de la voix originale

Introduction générale Hibiki est un modèle de traduction vocale haute fidélité en temps réel développé par Kyutai Labs. Contrairement aux traducteurs traditionnels hors ligne, Hibiki est capable de générer des traductions vocales naturelles dans la langue cible en temps réel pendant que l'utilisateur parle, ainsi que de fournir des traductions textuelles. Le modèle...
Il y a 6 mois
03.3K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac : utilisez les grands modèles de Qwen dans la barre de menu du Mac pour des conversations à tout moment !

Introduction générale Qwen4Mac est un projet open source conçu pour intégrer le Large Language Model (LLM) de Qwen dans la barre de menu du Mac, ce qui permet aux utilisateurs de l'appeler et de l'utiliser à tout moment. Le projet est développé et maintenu par andreaturchet et fournit un moyen facile pour les utilisateurs de...
Il y a 6 mois
02.1K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI : un assistant IA hors ligne fonctionnant dans votre téléphone, adapté à DeepSeek-R1 (5.37GB)

Introduction générale Pocket AI (PocketPal AI version chinoise) est un puissant assistant d'intelligence artificielle hors ligne conçu pour permettre aux utilisateurs de parler à l'intelligence artificielle à tout moment et en tout lieu. Il est basé sur les petits modèles linguistiques (SLM) et fonctionne sur les téléphones portables sans connexion internet, spécialement adapté à l'expérience des utilisateurs chinois. Mouth...
Il y a 6 mois
03.1K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

OpenHealthForAll : assistant IA pour la gestion des données de santé personnelles, téléchargement de rapports d'examen pour un plan de santé personnalisé

Introduction générale OpenHealthForAll est un projet open source conçu pour aider les utilisateurs à gérer et à comprendre leurs données de santé personnelles. En s'appuyant sur la technologie de l'intelligence artificielle, OpenHealthForAll fournit un assistant de santé local pour aider les utilisateurs à mieux gérer...
Il y a 6 mois
02K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统

OpenPilot : système de conduite autonome à code source ouvert, permettant de bricoler un ensemble de systèmes de conduite intelligents pour votre voiture.

Introduction générale OpenPilot est un système de conduite autonome open source développé par comma.ai pour améliorer l'expérience de conduite et la sécurité des véhicules existants grâce à des fonctionnalités avancées d'aide à la conduite. Depuis sa première version en 2016, OpenPilot a pris en charge plus de 2...
Il y a 6 mois
02.6K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security : outil open source d'analyse des vulnérabilités LLM qui fournit des tests fuzz complets et des techniques d'attaque.

Introduction générale Agentic Security est un outil d'analyse des vulnérabilités LLM (Large Language Model) open source conçu pour fournir aux développeurs et aux professionnels de la sécurité des techniques complètes de fuzz testing et d'attaque. L'outil prend en charge des ensembles de règles personnalisés ou des attaques basées sur des agents et est capable d'intégrer LLM AP...
Il y a 6 mois
02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2 : un modèle multimodal open source pour soutenir la compréhension vidéo et les dialogues multiples

Introduction complète CogVLM2 est un modèle multimodal open source développé par le Tsinghua University Data Mining Research Group (THUDM), basé sur l'architecture Llama3-8B, et visant à fournir des performances comparables ou même supérieures à GPT-4V. Le modèle prend en charge la compréhension des images, le dialogue...
Il y a 6 mois
02.4K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster : logiciel puissant et convivial de retouche et d'édition de photos et de vidéos

Introduction générale VisoMaster est un outil d'édition et d'échange de visages vidéo puissant et facile à utiliser. Il utilise la technologie de l'intelligence artificielle pour obtenir des effets d'échange de visages naturels et réalistes. Qu'il s'agisse d'une image ou d'une vidéo, VisoMaster peut générer des résultats d'échange de visages de haute qualité avec des opérations simples,...
Il y a 6 mois
04.1K
基于RAG构建提供健康建议的小助手(实验项目)

Construction d'un mini-assistant fournissant des conseils en matière de santé sur la base de RAG (projet pilote)

Introduction générale LLM-RAG-Longevity-Coach est un chatbot basé sur les technologies LLM (Large Language Modelling) et RAG (Retrieval Augmented Generation) conçu pour fournir aux utilisateurs des conseils personnalisés en matière de santé et de longévité. Le projet a été développé par Tyler Burle...
Il y a 6 mois
02.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro : un outil pour simplifier le processus de mise au point des modèles des principaux langages visuels open source

Introduction complète Maestro est un outil développé par Roboflow pour simplifier et accélérer le processus de mise au point de modèles multimodaux, afin que chacun puisse entraîner ses propres macromodèles visuels. Il fournit des recettes prêtes à l'emploi pour affiner les modèles de langage visuel (VLM) populaires tels que F...
Il y a 6 mois
02.6K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

Bilingual Book Maker : Utilisez la traduction automatique pour créer des livres électroniques bilingues, un outil de traduction automatique de livres complets.

Introduction générale Bilingual Book Maker est un projet open source conçu pour aider les utilisateurs à créer des versions multilingues de livres électroniques en utilisant la technologie de l'IA. L'outil utilise principalement ChatGPT pour la traduction et prend en charge plusieurs formats de fichiers, dont epub, txt et srt...
Il y a 6 mois
02.7K
Rowfill:批量提取文档结构化信息并自动化分析

Rowfill : Extraction par lots d'informations structurées à partir de documents et analyse automatisée

Introduction générale Rowfill est une plateforme de traitement de documents open source conçue pour les travailleurs du savoir. Elle utilise des techniques avancées d'intelligence artificielle pour extraire, analyser et traiter des données à partir de documents complexes, d'images et de PDF.
Il y a 6 mois
02.3K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG : Outil de génération d'augmentation de la recherche paramétrique pour l'amélioration des performances des systèmes de questions-réponses

Introduction PRAG (Parametric Retrieval-Augmented Generation) est un outil innovant de génération augmentée par récupération qui vise à améliorer la génération de connaissances externes en les intégrant directement dans l'espace des paramètres d'un Grand Modèle de Langage (LLM)....
Il y a 6 mois
03.5K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPT Researcher : Générer des rapports de recherche complets et détaillés en utilisant des données locales et en ligne

Introduction complète GPT Researcher est un agent autonome basé sur le Large Language Model (LLM) conçu pour effectuer des recherches locales et sur le web et pour générer des rapports de recherche détaillés. L'outil offre des performances stables et une vitesse plus rapide en parallélisant le travail de l'agent, ce qui garantit la précision des informations...
Il y a 4 mois
02.2K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker : système de dialogue intelligent pour les personnes numériques, combinant de grands modèles linguistiques et des modèles visuels pour de nouvelles expériences interactives

Introduction générale Linly-Talker est un système numérique innovant de dialogue humain qui combine de grands modèles de langage (LLM) avec des modèles visuels pour créer une nouvelle approche de l'interaction homme-machine. Le système intègre une variété de technologies telles que Whisper, Linly, Micros...
Il y a 6 mois
02.6K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave : permettre aux applications d'intégrer rapidement des bases de connaissances pour une recherche intelligente

Introduction générale Airweave est un outil open source conçu pour rendre n'importe quelle application consultable en synchronisant les données de l'application de l'utilisateur, les API, les bases de données et les sites Web avec des bases de données graphiques et vectorielles....
Il y a 6 mois
02.2K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio : Intégrer facilement de multiples modèles d'IA et construire des applications multimodales basées sur Gradio

Introduction générale ai-gradio est une boîte à outils Python open source conçue pour aider les développeurs à intégrer et à utiliser facilement plusieurs modèles d'IA. Construit sur Gradio, le projet fournit une interface unifiée pour prendre en charge plusieurs modèles et services d'IA. Qu'il s'agisse de texte, de parole ou de vidéo...
Il y a 6 mois
02.9K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher : outil automatisé de recherche approfondie pour rédiger des rapports de recherche complets

Introduction générale OpenDeepResearcher est un outil de recherche approfondie automatisé open source conçu pour améliorer l'efficacité de la recherche grâce à des techniques d'intelligence artificielle. Le projet est développé par mshumer et hébergé sur GitHub.OpenDeepResear...
Il y a 4 mois
02.7K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara : Service de stockage et de recherche de documents basé sur l'intégration visuelle

Introduction générale ColiVara est un service de stockage et de récupération de documents basé sur la technologie de l'intégration visuelle. Il élimine le besoin de reconnaissance optique de caractères (OCR) ou d'extraction de texte et évite les problèmes de formulaires brisés ou d'images perdues.ColiVara prend en charge plus de 100 formats de fichiers, y compris PDF...
Il y a 6 mois
02.6K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本

Réinitialisation du curseur : script permettant de réinitialiser l'identifiant du dispositif pour les versions 0.45.x et supérieures du curseur.

Description générale Cursor Reset est un outil de script PowerShell pour réinitialiser les identifiants de périphériques dans l'IDE Cursor, supportant la version 0.45.x de Cursor. L'outil est conçu pour aider les utilisateurs à réinitialiser les identifiants de périphériques dans l'IDE Cursor...
Il y a 6 mois
03.8K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher : Assistant à la correction de la prononciation de l'anglais

Introduction générale Gemini Teacher est un assistant d'apprentissage de l'anglais basé sur l'IA de Google Gemini. Il reconnaît la prononciation de l'anglais de l'utilisateur en temps réel et fournit un retour instantané et des suggestions de correction. L'outil est conçu pour aider les utilisateurs à améliorer leurs compétences...
Il y a 6 mois
02.7K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive : enregistrement en direct non supervisé et découpage automatique, outil de téléchargement pour la station B

Introduction bilive est un outil conçu pour l'enregistrement en direct de stations B. Il permet un enregistrement en direct extrêmement rapide, un découpage automatique, un rendu des fenêtres contextuelles et une génération de sous-titres. L'outil est compatible avec les machines à très faible configuration, prend en charge l'enregistrement sans surveillance 7x24 heures, identifie et rend automatiquement les pop-ups et les sous-titres, coupe et...
Il y a 6 mois
02.7K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V : Apprentissage par renforcement à faible coût pour la capacité de généralisation des modèles de langage visuel

Introduction complète R1-V est un projet open source qui vise à réaliser des percées dans la modélisation du langage visuel (VLM) grâce à l'apprentissage par renforcement (RL) à faible coût. Le projet utilise des mécanismes de récompense vérifiables pour motiver les VLM à apprendre des capacités de comptage génériques. Étonnamment, le 2B de R1-V ...
Il y a 6 mois
02.9K
DSPy Examples:展示DSPy功能的实用示例

Exemples DSPy : exemples pratiques démontrant les fonctionnalités de DSPy

Introduction générale La DSPy Example Codebase est une base de code GitHub maintenue par l'équipe Langtrace AI qui présente une variété d'exemples de programmes d'IA construits en utilisant DSPy. La base de code est conçue pour démontrer les nombreuses fonctionnalités de DSPy à travers des exemples réels afin d'aider les développeurs à mieux comprendre...
Il y a 6 mois
02.8K
CoT-Lab:探索人机协作迭代思考的实验性对话工具

CoT-Lab : un outil de dialogue expérimental pour explorer la réflexion itérative sur la collaboration homme-machine

CoT-Lab est une interface expérimentale permettant d'explorer de nouveaux paradigmes de collaboration entre l'homme et l'ordinateur. Basé sur la théorie de la charge cognitive et les principes de l'apprentissage actif, CoT-Lab facilite l'alignement cognitif profond entre les humains et l'intelligence artificielle (IA) à travers la création de relations de "partenaires de réflexion". Le projet vise à...
Il y a 6 mois
02.2K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate : une API unifiée pour l'intégration de la génération de parole Well-Known, de la transcription de la parole et de la modélisation de la voix

Introduction générale Orate est une boîte à outils d'IA axée sur la génération et la transcription de la parole. Il fournit une API unifiée qui s'intègre de manière transparente avec les principaux fournisseurs d'IA tels que OpenAI, ElevenLabs et AssemblyAI afin d'aider les utilisateurs à créer des...
Il y a 6 mois
02.9K
Reflex LLM Examples:展示大语言模型实际应用的AI应用集合

Reflex LLM Examples : une collection d'applications d'intelligence artificielle démontrant l'application pratique de grands modèles de langage.

Introduction générale Reflex LLM Examples est un projet open source créé par l'équipe de développement de Reflex pour démontrer les applications pratiques du Large Language Model (LLM). Le projet rassemble plusieurs applications d'IA construites sur Reflex, présentant des applications de Googl...
Il y a 6 mois
02.1K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude : Une interface de chat fusionnant le raisonnement de la chaîne R1 de DeepSeek avec la créativité de Claude

Introduction complète DeepClaude est une API d'inférence et une interface de chat de haute performance pour le Large Language Model (LLM) qui intègre les capacités d'inférence chaînée (CoT) de DeepSeek R1 avec la créativité et la génération de code du modèle Anthropic Claude....
Il y a 6 mois
03.5K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2 : Modèle d'apprentissage profond pour la suppression rapide de l'arrière-plan dans les images et les vidéos

Introduction complète BEN2 (Background Erase Network 2) est un modèle d'apprentissage profond développé par Prama LLC spécifiquement conçu pour supprimer automatiquement l'arrière-plan d'une image et générer une image de premier plan. Le modèle utilise une méthode innovante de Confiden...
Il y a 2 mois
03.8K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用

Exa & Deepseek Chat App : application de chat open source pour la recherche en temps réel sur le web et le raisonnement intelligent

Introduction complète Exa & Deepseek Chat App est une application de chat intelligente open source, dont les principales fonctionnalités comprennent la recherche en temps réel sur le Web à l'aide des API d'Exa et l'utilisation du modèle de langage R1 de Deepseek pour...
Il y a 6 mois
02.6K
LLM API Engine:通过自然语言快速生成和部署API

LLM API Engine : Génération et déploiement rapides d'API en langage naturel

Introduction générale LLM API Engine est un projet open source conçu pour aider les développeurs à créer et à déployer rapidement des API basées sur l'IA. Le projet s'appuie sur le Large Language Model (LLM) et sur des technologies d'exploration intelligente du Web pour permettre aux utilisateurs de créer des API personnalisées à l'aide de descriptions en langage naturel....
Il y a 6 mois
02.2K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling : un outil de synthèse vocale multilingue plus petit et plus rapide que Whisper-Large v3

Introduction complète PengChengStarling (PengCheng Labs) est un outil multilingue de reconnaissance automatique de la parole (ASR) capable de convertir la parole dans différentes langues en texte correspondant. Cette boîte à outils est développée sur la base du projet icefall et fournit un processus complet de reconnaissance de la parole...
Il y a 6 mois
02.3K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档

Doc2XAPITranslate : traduction plein texte de documents : traduisez rapidement des documents PDF/MD anglais en documents chinois.

Introduction complète Doc2XAPITranslate est un puissant outil de traduction de documents en texte intégral conçu pour traduire rapidement des documents PDF ou Markdown anglais en documents chinois. L'outil prend en charge une variété de traducteurs, y compris DeepSeek, OpenAI, O...
Il y a 6 mois
02.6K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-preview : un macromodèle de dialogue vocal anthropomorphique de bout en bout pour l'interaction en temps réel

SpeechGPT 2.0-preview est le premier système d'interaction anthropomorphique en temps réel introduit par OpenMOSS, qui est formé sur la base de millions d'heures de données vocales. Le système est équipé d'une expression vocale anthropomorphique et d'une réponse à faible latence de 100 ms, ce qui permet de...
Il y a 6 mois
02.8K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose : des intelligences de programmation évolutives à source ouverte qui automatisent les tâches de programmation à part entière

Introduction générale Goose est un outil d'agent IA open source développé par Block, Inc. et conçu pour aider les développeurs à automatiser les tâches de développement quotidiennes. Il prend en charge une large gamme de grands modèles de langage (LLM) et interagit avec les utilisateurs via la ligne de commande ou les interfaces d'application de bureau....
Il y a 6 mois
04K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook : Cursor open source pour la conception frontale, concevoir et publier du code dans les applications React.

Introduction générale Onlook est un outil de conception open source construit pour les concepteurs et les développeurs qui permet aux utilisateurs de concevoir directement dans une application React en cours d'exécution et de convertir les modifications de conception en code. L'outil offre une expérience d'édition visuelle intuitive similaire à Figma ou Webf...
Il y a 6 mois
02.4K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE : Transforme les paroles en un modèle de base d'une chanson complète, prenant en charge un large éventail de styles musicaux.

Introduction générale YuE est un modèle de base open source de génération de chansons complètes qui se concentre sur la transformation des paroles en chansons complètes. Contrairement à d'autres modèles qui ne génèrent que de courts extraits de musique non vocale, YuE est capable de générer des chansons complètes avec des voix principales et secondaires d'une durée pouvant atteindre plusieurs minutes. Le modèle aborde la génération de musique en...
Il y a 6 mois
03.3K
Supermemory:导入书签和网页内容构建个人知识库

Supermemory : Importer des signets et du contenu web pour construire une base de connaissances personnelle

Introduction générale Supermemory est un projet open source conçu pour aider les utilisateurs à construire leur "deuxième cerveau". Grâce à une puissante extension Chrome et à une technologie d'intelligence artificielle, il permet aux utilisateurs de sauvegarder, d'organiser et de récupérer facilement des données à partir de pages web, de signets Twitter...
Il y a 6 mois
02.9K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux : téléchargeur vidéo en ligne de commande qui prend en charge presque toutes les plates-formes vidéo

Introduction générale Lux est une bibliothèque de téléchargement vidéo simple et rapide et un outil de ligne de commande écrit en Go. Il permet de télécharger des vidéos à partir de plusieurs sites web, dont YouTube, Bilibili, Youku, etc. Lux offre une variété d'options et de fonctionnalités de téléchargement, telles que le téléchargement multithread...
Il y a 6 mois
02.2K
Langui:开源的AI用户界面组件库

Langui : une bibliothèque open source de composants d'interface utilisateur pour l'IA

Introduction générale Langui de LangbaseInc est une bibliothèque de composants d'interface utilisateur open source conçue pour les projets d'IA générative et de modélisation des grandes langues (LLM). La bibliothèque est basée sur Tailwind CSS et fournit une collection de composants d'interface utilisateur pré-construits pour aider les développeurs à...
Il y a 7 mois
02.4K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android : Modélisation multimodale du langage par MNN pour Android

Introduction MNN (Mobile Neural Network) est un cadre d'apprentissage profond efficace et léger développé par Alibaba et optimisé pour les appareils mobiles. MNN est non seulement capable d'inférer rapidement sur les appareils mobiles, mais il prend également en charge les tâches multimodales, y compris la génération de texte...
Il y a 6 mois
03.3K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator : un outil pour convertir le contenu web en flux RSS via l'IA

Introduction générale AI RSS est un outil innovant qui convertit le contenu web en flux RSS grâce à la technologie de l'intelligence artificielle. Il se compose de deux parties principales : un plugin de navigateur et un côté serveur. Le plugin du navigateur permet aux utilisateurs de sélectionner des listes à partir de pages web et de générer des fichiers de description de données structurées (SDD)...
Il y a 7 mois
02.6K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调

UltraRAG : un système RAG à guichet unique pour simplifier la construction des données et la mise au point des modèles

Introduction complète UltraRAG est un système RAG (Retrieval Augmented Generation) proposé conjointement par le groupe THUNLP de l'Université de Tsinghua, le groupe NEUIR de l'Université de Northeastern, Modelbest.Inc et l'équipe 9#AISoft. Le cadre est basé sur le déploiement agile et la construction modulaire...
Il y a 7 mois
02.2K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B : un modèle de synthèse vocale à source ouverte pour la génération et le clonage de la parole de haute qualité

Introduction générale Llasa-3B est un modèle de synthèse vocale open source développé par le laboratoire audio de l'université des sciences et technologies de Hong Kong (HKUST Audio). Le modèle est basé sur l'architecture Llama 3.2B, qui a été soigneusement réglée pour fournir une génération de parole de haute qualité qui prend non seulement en charge de multiples...
Il y a 6 mois
03.2K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具

Fast GraphRAG : un outil de génération d'améliorations de la recherche graphique très précis et peu coûteux

Introduction complète Fast GraphRAG est un outil open source développé par Circlemind AI pour permettre une Génération d'Augmentation de la Recherche (RAG) efficace et précise à travers les algorithmes de Knowledge Graph et de PageRank. L'outil s'adapte intelligemment à l'utilisation de l'utilisateur...
Il y a 7 mois
02.4K