Projet open source sur l'IA

Total 1020 articles
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan : outil de synthèse vocale multilingue rapide et contrôlable (plus de 7000 langues prises en charge)

Introduction générale IMS Toucan est une boîte à outils de synthèse vocale de pointe développée par l'Institut de traitement du langage naturel (IMS) de l'Université de Stuttgart, en Allemagne. Cette boîte à outils prend en charge plus de 7 000 langues. Elle est rapide, contrôlable et peu gourmande en ressources informatiques....
Il y a 6 mois
03.1K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT : garantir la confidentialité des données en s'adressant à plusieurs documents sur des appareils locaux

Introduction générale LocalGPT est un projet open source conçu pour permettre aux utilisateurs de dialoguer avec des documents sur des appareils locaux, tout en garantissant la confidentialité des données. En utilisant divers modèles open source, LocalGPT peut traiter et comprendre le contenu des documents sans télécharger les données dans le nuage. Le projet supporte une variété de p...
Il y a 8 mois
03.1K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait : Outil d'animation pour générer des portraits dynamiques à partir d'images fixes et de vidéos

Introduction générale LivePortrait est un outil avancé d'animation de portraits dynamiques développé par Racer Technology. Il utilise une technologie d'IA innovante pour transformer des images fixes en animations vidéo vivantes. Que vous utilisiez des photos réelles, des styles d'animation ou des portraits artistiques, LivePo...
Il y a 9 mois
03.1K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm : un cadre pour la collaboration entre clusters multi-intelligents

Quantum Swarm est un cadre d'intelligence artificielle open source axé sur le développement et la recherche de l'intelligence des populations d'IA. Le projet est maintenu par l'équipe Quarm AI sur GitHub et vise à fournir une plateforme flexible et efficace pour construire et tester des systèmes multi-intelligence.Quan...
Il y a 7 mois
03.1K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe : Laissez l'IA contrôler directement votre ordinateur, une implémentation open source de l'ordinateur de contrôle de Claude.

Description générale Agent.exe est une application Electron open source qui utilise l'API Sonnet Claude 3.5 d'Anthropic pour permettre aux utilisateurs de contrôler leurs ordinateurs locaux directement par le biais de l'IA. Le projet a été développé par K...
Il y a 8 mois
03.1K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText : génère et édite du texte multilingue dans l'image, avec la possibilité de générer plusieurs lignes de chinois dans l'image.

Introduction complète AnyText est un outil révolutionnaire de génération et d'édition de textes visuels multilingues, développé sur la base du modèle de diffusion. Il génère des textes multilingues naturels et de haute qualité dans des images et offre des capacités d'édition de texte flexibles. Il a été développé par une équipe de chercheurs et présenté à l'ICLR 2024...
Il y a 7 mois
03.1K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT : Plate-forme intelligente de construction de corps pour l'automatisation des flux de travail et l'exécution autonome des tâches

Introduction complète AutoGPT est une plateforme puissante conçue pour aider les utilisateurs à créer, déployer et gérer des agents d'intelligence artificielle fonctionnant en continu et à automatiser des flux de travail complexes. Développée par Significant Gravitas, la plateforme offre une large gamme d'outils et de fonctionnalités qui permettent aux utilisateurs de se concentrer...
Il y a 8 mois
03.1K
Browse AI:无代码提取和监控结构化数据

Browse AI : extraire et surveiller des données structurées sans code

Présentation de Browse Browse AI est un logiciel d'automatisation web basé sur le cloud, sans codage, conçu pour aider les utilisateurs à extraire et à surveiller les données de n'importe quel site web sans programmation. Vous pouvez former un robot pour qu'il effectue des tâches d'extraction de données, de surveillance et d'automatisation en un seul point de la souris...
Il y a 11 mois
03.1K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite : un outil efficace de génération d'augmentation de la recherche (RAG) qui prend en charge plusieurs bases de données et modèles linguistiques.

Introduction générale RAGLite est une boîte à outils Python pour Retrieval Augmented Generation (RAG) qui prend en charge les bases de données PostgreSQL ou SQLite. Il offre des options de configuration flexibles qui permettent aux utilisateurs de choisir différents modèles de langage et réorganisateurs...
Il y a 9 mois
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing : Outil intelligent de doublage/traduction multilingue de vidéos par l'IA

Introduction complète Linly-Dubbing est un outil de doublage et de traduction multilingue intelligent conçu pour fournir aux utilisateurs des services de doublage vidéo et de traduction de sous-titres multilingues de haute qualité grâce à l'intégration d'une technologie d'intelligence artificielle avancée. Cet outil est particulièrement adapté à l'éducation internationale, à la localisation de contenu global et à d'autres scénarios, aidant...
Il y a 7 mois
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic : Extraction d'informations structurées pour les tableaux complexes

L'objectif de la reconnaissance de tableaux est d'analyser les tableaux dans les images, d'identifier avec précision les structures des tableaux et l'emplacement des cellules, et de les réduire à des formats de tableaux structurés (par exemple, HTML). À l'ère de l'information, un grand nombre de données tabulaires importantes existent encore à l'état non structuré (par exemple, des documents scannés avec des images de tableaux statistiques...).
il y a 5 mois
03K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2 : un modèle expert de langage visuel pour une compréhension multimodale avancée

Introduction complète DeepSeek-VL2 est une série de modèles avancés de langage visuel avec mélange d'experts (MoE) qui améliorent de manière significative les performances de son prédécesseur, DeepSeek-VL. Les modèles sont utiles pour les questions-réponses visuelles, la reconnaissance...
Il y a 6 mois
03K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

wechat-article-exporter : déploiement en un clic de l'outil d'exportation par lots d'articles de numéros publics wechat

Introduction complète wechat-article-exporter est un outil open source conçu pour aider les utilisateurs à exporter par lots les articles du numéro public WeChat. L'outil prend en charge l'exportation de l'audio et de la vidéo intégrés dans l'article sans créer d'environnement, peut restaurer le style de l'article, et prend en charge les parties privées....
Il y a 10 mois
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine : Prédire la probabilité d'événements futurs sur la base de la connaissance de la recherche

Introduction générale Forecast AI est une superbe plateforme de prévision basée sur une technologie avancée d'intelligence artificielle. Elle utilise de puissants algorithmes d'analyse de données et d'apprentissage automatique pour fournir aux utilisateurs des prédictions très précises sur les événements futurs. Qu'il s'agisse d'élections politiques, de tendances économiques ou d'événements sociaux, Forecast ...
Il y a 11 mois
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData : construire des intelligences IA avec de la mémoire, des connaissances et des outils

Introduction complète PhiData est un framework conçu pour développer des assistants intelligents. Il permet aux assistants intelligents d'engager des conversations à long terme, de fournir un contexte commercial précis et d'effectuer diverses opérations grâce à une mémoire améliorée, à l'intégration des connaissances et à des capacités d'invocation d'outils.
il y a 5 mois
03K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC : permet la conversion en temps réel de la parole et de la chanson avec moins d'échantillons

Introduction générale Seed-VC est un projet open source sur GitHub, développé par Plachtaa. Il peut utiliser une référence audio de 1 à 30 secondes, une conversion rapide de la parole ou de la chanson, sans formation supplémentaire. Le projet supporte la conversion de la voix en temps réel, le retard ...
il y a 5 mois
03K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Vision is All You Need : Building an Intelligent Document Retrieval System Using Visual Language Models (Vision RAG) (La vision est tout ce dont vous avez besoin : construire un système intelligent de recherche de documents en utilisant des modèles de langage visuel)

Introduction globale Vision-is-all-you-need est un projet de démonstration d'un système visuel innovant RAG (Retrieval Augmented Generation) qui innove en appliquant la modélisation du langage visuel (VLM) au domaine du traitement des documents. Contrairement aux méthodes traditionnelles de regroupement de textes, le système permet directement...
Il y a 7 mois
03K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger : génération d'articles de blog à partir de contenu vocal basé sur LangGraph, rédaction automatisée de blogs

Introduction générale Robo Blogger est un outil de création de blog innovant conçu pour simplifier le processus de génération de contenu grâce à la technologie speech-to-text. Les utilisateurs peuvent enregistrer des idées par le biais de n'importe quelle application de synthèse vocale, et Robo Blogger transforme ces idées en contenu de blog structuré...
Il y a 8 mois
03K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas : évaluation du rappel RAG, de la précision de l'AQ et de la corrélation des réponses

Introduction complète Ragas est un outil spécialement conçu pour évaluer et optimiser les systèmes de génération augmentée de recherche (RAG). Il fournit un ensemble complet de mesures d'évaluation en analysant les relations entre les requêtes, les contextes de recherche et les réponses générées. Ces mesures comprennent la fidélité, la pertinence de la réponse, la pertinence du contexte, l'on...
Il y a 7 mois
03K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live : AI digital people pour une interaction fluide en temps réel sur les cartes graphiques de la série 30/40

Introduction générale DH_live est un projet d'humain numérique en temps réel basé sur l'apprentissage par échantillonnage, visant à fournir aux utilisateurs une expérience de streaming en direct fluide et interactive. Le projet est compatible avec les cartes graphiques NVIDIA des séries 30 et 40 et est capable de fonctionner en temps réel à plus de 25 images par seconde. Les utilisateurs peuvent...
Il y a 9 mois
03K
Xorbits Inference:一键部署多种AI模型,分布式推理框架

Xorbits Inference : déploiement en un clic de plusieurs modèles d'IA, un cadre d'inférence distribué

Introduction complète Xorbits Inference (Xinference) est un cadre d'inférence distribué puissant et complet qui prend en charge l'inférence pour une large gamme de modèles d'intelligence artificielle tels que les grands modèles de langage (LLM), les modèles de reconnaissance vocale et les modèles multimodaux. Avec Xorbits I...
Il y a 11 mois
03K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA : Open Source Multimodal Large Language Models for Real-Time Visual and Speech Interaction (modèles multimodaux de langage à grande échelle pour l'interaction visuelle et vocale en temps réel)

Introduction générale VITA est un projet open source de modélisation interactive multimodale du langage, pionnier dans la capacité à réaliser une véritable interaction multimodale complète. Le projet a lancé VITA-1.0 en août 2024, inaugurant le premier modèle de langage interactif entièrement modal en open source....
Il y a 7 mois
03K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter : outil d'édition d'images de type gribouillis alimenté par l'IA

Introduction générale FramePainter est un outil révolutionnaire d'édition d'images piloté par l'IA qui utilise une technologie de diffusion vidéo avancée et des commandes d'esquisse intuitives pour aider les utilisateurs à réaliser facilement des éditions d'images complexes. Qu'il s'agisse d'un simple ajustement ou d'une transformation créative complexe, Fr...
Il y a 7 mois
03K
StickerBaker:用AI制作个性贴纸图片

StickerBaker : Créez des images autocollantes personnalisées grâce à l'IA

Description générale stickerbaker est un créateur d'autocollants open source qui utilise la technologie de l'intelligence artificielle pour créer une variété d'autocollants intéressants. Que vous vouliez un simple autocollant de chat ou que vous souhaitiez créer une série d'autocollants divers, stickerbaker peut répondre à vos besoins...
Il y a 11 mois
03K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

Fay Digital Human Framework : intégration de modèles linguistiques et de personnages numériques en 3D pour soutenir une variété de scénarios d'application.

Introduction complète Fay est une structure open source d'humain numérique virtuel en 3D qui intègre des modèles de langage et des personnages numériques pour une variété de scénarios d'application, tels que des guides d'achat virtuels, des présentateurs virtuels, des assistants, des serveurs, des enseignants et des assistants mobiles vocaux ou textuels....
Il y a 7 mois
03K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika : logiciel d'intelligence artificielle open-source intelligence qui comprend, divise les instructions en sous-tâches et écrit du code

Introduction générale Devika est un ingénieur logiciel IA avancé qui comprend les instructions humaines de haut niveau, les décompose en étapes, étudie les informations pertinentes et écrit du code pour atteindre un objectif donné. Il développe intelligemment des logiciels en utilisant des modèles de langage à grande échelle, des algorithmes de planification et de raisonnement, et des capacités de navigation sur le web....
il y a 5 mois
03K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer : outil professionnel de création d'illustrations manga à quatre panneaux, génération d'images, édition de pages manga

Introduction générale SP-MangaEditer est une plateforme indépendante d'édition de manga conçue pour les créateurs de manga. La plate-forme prend en charge la génération d'images, l'édition de couches, l'ajustement d'images, l'application de filtres et de nombreuses autres fonctions pour aider les utilisateurs à créer facilement des illustrations de manga de haute qualité. Les utilisateurs peuvent simplement manipuler...
Il y a 7 mois
03K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT : outil de conversion de la parole en texte en temps réel pour la reconnaissance vocale en continu à faible latence basé sur Whisper

Introduction générale RealtimeSTT est une bibliothèque de conversion de la parole vers le texte en temps réel, efficace et à faible latence, avec une détection avancée de l'activité vocale et l'activation des mots de réveil. Elle a été développée par Kolja Beigel pour soutenir les applications qui nécessitent une conversion rapide et précise...
Il y a 7 mois
03K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek : un outil open source pour générer du matériel d'étude de mots pour la 4e année à l'aide de DeepSeek

Introduction complète "Vocabulary Book by DeepSeek" est un projet open source développé sur la base du grand modèle de DeepSeek, visant à aider les apprenants d'anglais à maîtriser efficacement le vocabulaire du College English Level 4 (CET-4). Le projet est hébergé sur GitHub...
Il y a 6 mois
03K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers : moteur de performance pour l'inférence de grands modèles : accélération extrême, autonomisation flexible

KTransformers : Un cadre Python de haute performance pour briser le goulot d'étranglement de l'inférence de grands modèles. C'est plus qu'un simple outil d'exécution de modèle, c'est un ensemble de moteurs d'optimisation de performances extrêmes et une plateforme flexible d'habilitation d'interface. KTransf...
Il y a 6 mois
03K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum : s'appuyer sur MCP pour interroger et résumer les messages WeChat dans Claude

Introduction générale MCP Server ChatSum est un projet open source conçu pour aider les utilisateurs à interroger et à résumer les messages de chat. Le projet est hébergé sur GitHub et fournit un ensemble d'outils puissants qui permettent aux utilisateurs d'interroger les journaux de chat sur la base de paramètres spécifiques et de générer les résumés correspondants...
il y a 5 mois
03K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api : API légère de grand modèle convertie en interface OpenAI, fichier YAML pour configurer le canal de l'API

Introduction complète Pas d'interface, pur fichier de configuration canal API de configuration . Il suffit d'écrire un fichier pour créer sa propre station API. Le document contient un guide de configuration détaillé. uni-api est une gestion unifiée d'un grand modèle de projet API, permettant une ...
Il y a 9 mois
03K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook : ingénieurs en IA full-stack open source qui construisent et itèrent rapidement des projets TypeScript complets.

Introduction générale Srcbook est une plateforme de développement d'applications centrée sur TypeScript, conçue pour créer et itérer rapidement sur des applications web avec des assistants IA. Elle prend en charge l'exécution native, fournit une interface de carnet de notes interactive et permet aux utilisateurs d'écrire et d'exécuter du code back-end....
Il y a 9 mois
03K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS : Outils révolutionnaires de génération et de clonage de discours

Introduction complète GPT-SoVITS est un outil de conversion et de synthèse vocale open source qui combine le modèle GPT et la technologie de changement de voix SoVITS. L'outil prend en charge la conversion texte-parole à la volée avec zéro ou peu d'échantillons, et la migration de style de voix avec seulement 5 secondes d'échantillons audio. Ses fonctionnalités incluent la conversion ...
Il y a 11 mois
03K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F : Accès gratuit à GPT-4, Llama-3 et à de nombreux autres modèles d'IA via Raycast !

Introduction générale Raycast-G4F (GPT4Free) est une puissante extension Raycast qui donne aux utilisateurs un accès gratuit à un large éventail de modèles d'IA avancés, notamment GPT-4 et Llama-3. L'extension ne se contente pas de fournir des dialogues en temps réel...
Il y a 7 mois
03K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer : une bibliothèque expérimentale pour l'optimisation de grands modèles de mots-guides, optimisant automatiquement Prompt

Introduction générale Promptimizer est une bibliothèque expérimentale d'optimisation des mots-guides conçue pour aider les utilisateurs à améliorer systématiquement les mots-guides de leurs systèmes d'intelligence artificielle. En automatisant le processus d'optimisation, Promptimizer peut améliorer les performances des mots indicateurs pour des tâches spécifiques. Les utilisateurs n'ont qu'à fournir...
Il y a 9 mois
03K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director : cadre d'agent vidéo intelligent pour la recherche, l'édition et la génération de flux de travail vidéo avec des descriptions en langage naturel

Introduction générale Director est un framework open source conçu pour simplifier et optimiser les interactions et les flux de travail vidéo en construisant des agents vidéo intelligents. Le cadre est basé sur l'infrastructure "vidéo en tant que données" de VideoDB et est capable de gérer des tâches vidéo complexes telles que la recherche, l'édition, la compilation et la génération...
Il y a 8 mois
03K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1 : Modèles vidéo libres pour générer des vidéos d'action humaine de haute qualité

Introduction générale SkyReels-V1 est un projet open source développé par l'équipe SkyworkAI, qui vise à générer du contenu vidéo de haute qualité, centré sur l'humain. Le projet est basé sur le modèle HunyuanVideo, à travers des dizaines de millions de films et d'extraits télévisés de haute qualité...
Il y a 6 mois
03K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider : outil d'aide à la programmation open source, utilisation d'un assistant IA pour l'écriture de code et l'édition de fichiers

Introduction générale Aider est un puissant assistant de programmation IA open source qui aide les développeurs à écrire, éditer et remanier le code par le biais d'un dialogue en langage naturel. En tant qu'outil interactif de programmation en binôme, Aider prend en charge de nombreux langages de programmation majeurs et peut être intégré de manière transparente dans Git...
Il y a 4 mois
03K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT : Téléchargez une photo de votre chambre et redessinez-la à l'aide de l'IA !

Introduction générale RoomGPT est un projet open source développé par Nutlope, un utilisateur de GitHub, qui permet aux utilisateurs de télécharger des photos de pièces et d'en générer des versions redessinées à l'aide d'une technologie d'intelligence artificielle. Le projet vise à permettre aux utilisateurs d'accéder à une décoration d'intérieur de qualité professionnelle sans avoir à payer de coûteux honoraires de designer...
Il y a 9 mois
03K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse : analyse chaque type de document en données disponibles en LLM, en préservant toutes les informations du document, telles que les tableaux et les images, dans leur intégralité.

Introduction générale MegaParse est un outil d'analyse de documents puissant et polyvalent, conçu pour optimiser le traitement des données pour le Large Language Model (LLM). Que vous travailliez avec du texte, des PDF, des présentations PowerPoint ou des documents Word, MegaParse...
Il y a 8 mois
03K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk : Intelligent Job Search Assistant, Automated CV Placement (en anglais uniquement)

Introduction générale Auto_Jobs_Applier_AIHawk est un outil d'automatisation de la recherche d'emploi utilisant la technologie de l'intelligence artificielle. Il aide les utilisateurs à automatiser l'envoi d'un grand nombre de CV en peu de temps et à les personnaliser en fonction de leurs informations personnelles et de leurs intentions de recherche d'emploi. L'outil est conçu pour...
Il y a 8 mois
03K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense : un outil d'annotation d'images gratuit pour améliorer l'efficacité des projets de vision par ordinateur

Introduction générale Make Sense est un outil d'annotation d'images en ligne gratuit conçu pour aider les utilisateurs à préparer rapidement des ensembles de données pour des projets de vision par ordinateur. Il ne nécessite aucune installation compliquée, il suffit d'ouvrir un accès au navigateur pour l'utiliser, il supporte plusieurs systèmes d'exploitation, et il est idéal pour les petits projets d'apprentissage profond. Les utilisateurs peuvent...
Il y a 6 mois
03K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller : résumez un livre entier en un clic, distillez efficacement le contenu du livre et saisissez rapidement les idées essentielles.

Introduction complète TextDistiller est un outil avancé basé sur l'intelligence artificielle, conçu pour résumer des livres chapitre par chapitre ou dans leur ensemble, en fournissant une vue d'ensemble à la fois concise et complète. En utilisant TextDistiller, les utilisateurs sont en mesure de saisir rapidement les idées essentielles et les points clés de n'importe quel livre...
Il y a 8 mois
03K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby : un assistant de programmation IA auto-hébergé qui s'intègre à VSCode

Introduction générale Tabby est un assistant de programmation IA open source développé par l'équipe TabbyML que les utilisateurs peuvent déployer eux-mêmes localement ou sur un serveur. Il offre des fonctionnalités similaires à celles du Copilote GitHub, telles que l'auto-complétion du code et les questions-réponses intelligentes, mais le plus...
Il y a 4 mois
03K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder : outils de gestion de signets AI open source, prise en charge de plusieurs formats, classification intelligente des balises, recherche plein texte

Description générale Hoarder est un outil de gestion de signets auto-hébergé qui permet de stocker des liens, des notes, des PDF et des images. Il utilise la technologie AI pour l'étiquetage automatique et fournit des capacités de recherche en texte intégral. Les utilisateurs peuvent utiliser le plugin Chrome et le plugin Firefox...
Il y a 8 mois
03K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream : un modèle de langage visuel léger et open source pour la rétropropagation par lots de mots repères d'images

Introduction complète Moondream est un modèle de langage visuel léger open source conçu pour permettre des capacités de description d'images grâce à des techniques d'apprentissage profond et de vision par ordinateur. Le modèle est capable de fonctionner efficacement sur une variété de plates-formes, et est particulièrement adapté aux appareils...
Il y a 7 mois
03K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo : outil de lecture du code source, utilisant LLM pour analyser le code, fournir des explications détaillées sur le code, prise en charge d'une variété de langages de programmation.

Introduction générale askrepo est un outil de lecture de code source basé sur LLM (Large Language Model). Il peut lire le contenu d'un fichier texte géré par Git dans un répertoire spécifié et l'envoyer à l'API Google Gemini pour fournir des réponses à des questions basées sur des invites spécifiées...
Il y a 9 mois
03K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric : un cadre de flux de travail IA open source qui intègre de nombreux mots-clés pour traiter efficacement une variété de transactions.

Introduction générale Fabric est un framework d'IA open source développé par Daniel Miessler pour simplifier et automatiser les tâches informatiques quotidiennes et rendre l'intelligence artificielle plus facile à utiliser. Il aide efficacement les utilisateurs grâce à une conception modulaire et à des mots guides prédéfinis (Patterns)...
Il y a 10 mois
03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG : un cadre RAG pour comprendre les vidéos ultra-longues avec un support pour la recherche multimodale et la construction de graphes de connaissances.

Introduction complète VideoRAG est un cadre génératif amélioré par la recherche d'information conçu pour traiter et comprendre les vidéos contextuelles de très longue durée. L'outil associe une base de connaissances textuelles orientée graphe à un encodage contextuel multimodal hiérarchique pour traiter efficacement sur un seul GPU NVIDIA RTX 3090...
Il y a 6 mois
03K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT : Document Chat Assistant, obtenir des réponses fiables à partir de documents uniques, de sources web, prendre en charge le déploiement local

Introduction générale DocsGPT est un assistant de documentation open source conçu pour simplifier le processus d'interrogation de la documentation d'un projet. En intégrant un puissant modèle GPT, les développeurs peuvent facilement poser des questions sur le projet et obtenir des réponses précises. En intégrant un puissant modèle GPT, les développeurs peuvent facilement poser des questions sur le projet et obtenir des réponses précises.DocsGPT supporte le déploiement local pour assurer la confidentialité des données tout en...
Il y a 9 mois
03K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic : Des images de portraits audio génèrent des vidéos de démonstration numériques avec des expressions faciales vivantes.

Introduction générale Sonic est une plateforme innovante axée sur la perception audio globale, qui vise à générer des portraits animés par l'audio. Développée par une équipe de chercheurs de Tencent et de l'université de Zhejiang, la plateforme utilise les informations audio pour contrôler les expressions faciales et les mouvements de tête afin de générer des vidéos animées naturelles et fluides....
Il y a 4 mois
03K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit : un outil tout-en-un pour la restauration et l'édition d'images lancé par Tencent ARC

Introduction BrushEdit est un outil de réparation et d'édition d'images tout-en-un développé par Tencent ARC Labs. L'outil est basé sur la dernière technologie d'intelligence artificielle et est capable d'identifier et de réparer automatiquement les défauts des images, tout en prenant en charge l'édition interactive par les utilisateurs.BrushEdit combine...
Il y a 8 mois
03K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks : notes inversées de calcul oral du petit singe, rétro-ingénierie et algorithmes de décryptage

Introduction complète Ape Mouth Calculator Reverse Notes est un projet open source qui vise à documenter et à partager le processus et les méthodes de rétro-ingénierie de l'application Ape Mouth Calculator. Le projet contient une variété d'outils et de techniques de rétro-ingénierie pour utiliser les instructions, telles que Frida, dexdump , etc., pour aider les utilisateurs à comprendre et à craquer l'addition arithmétique orale du petit singe...
Il y a 10 mois
03K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me : des sosies d'IA formés localement et dotés de souvenirs et d'habitudes personnels

Second Me est un projet open source développé par l'équipe Mindverse qui vous permet de créer une IA sur votre ordinateur qui agit comme un "sosie numérique", apprenant vos schémas d'élocution et vos habitudes à travers vos mots et vos souvenirs, et devenant une personne intelligente qui comprend vos...
il y a 5 mois
02.9K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent : une intelligence qui intègre plus de 500 outils de recherche pour automatiser les tâches scientifiques et de recherche.

Introduction complète SciToolAgent est une plateforme d'outils open source développée par le Centre d'innovation de l'Université de Zhejiang à Hangzhou (HICAI-ZJU). Elle intègre plus de 500 outils scientifiques par le biais d'un graphe de connaissances (SciToolKG) et de technologies de modélisation du grand langage afin d'aider les chercheurs à...
il y a 5 mois
02.9K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek : lecture des fichiers texte du dépôt git et découpage rapide pour les modèles de grande taille

Introduction générale Yek est un outil rapide basé sur Rust pour lire des fichiers texte à partir de dépôts ou de répertoires, les découper et les sérialiser pour les utiliser dans de grands modèles de langage (LLM). L'outil utilise la règle .gitignore par défaut pour ignorer les fichiers inutiles, et utilise...
Il y a 7 mois
02.9K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama : une interface de chat propre pour interagir avec les modèles natifs d'Ollama

Introduction générale HiOllama est une interface conviviale construite sur Python et Gradio, conçue pour interagir avec les modèles Ollama. Elle fournit une interface web simple et intuitive qui prend en charge la génération de texte en temps réel et les fonctions de gestion du modèle. Les utilisateurs peuvent ajuster des paramètres tels que la température et la plupart des...
Il y a 9 mois
02.9K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage : YouTube Downloader, Télécharger gratuitement des vidéos YouTube, Extraire l'audio, Obtenir les sous-titres

Introduction générale YTSage est un outil moderne de téléchargement YouTube avec une interface PyQt6 propre. Les utilisateurs peuvent utiliser YTSage pour télécharger des vidéos de toute qualité, extraire l'audio, obtenir des sous-titres (y compris des sous-titres auto-générés), et afficher les méta...
Il y a 8 mois
02.9K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口

simple-one-api : intégration en un clic d'une variété d'API de grands modèles libres, interface OpenAI externe unifiée

Introduction complète simple-one-api est un projet open source conçu pour simplifier l'intégration de plusieurs API de grands modèles. Il prend en charge les API compatibles avec OpenAI telles que ThousandFans Big Model Platform, Xunfei Starfire Big Model, Tencent Mixed Element, MiniMax et Deep-Seek...
Il y a 9 mois
02.9K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net : un outil open source pour transposer des photos et des vidéos en animes stylisés

Introduction générale DCT-Net est un projet open source développé par DAMO Academy et Wang Xuan Institute of Computer Technology, Peking University, visant à animer la transformation stylisée des images. Le projet utilise des techniques d'apprentissage profond par le biais de la traduction calibrée par domaine (Domain-Calibrat...
Il y a 7 mois
02.9K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent : assistant de clonage vocal IA de bout en bout, assistant de dialogue vocal en temps réel, projet dérivé de Fish Speech

Introduction complète Projet de dérivation de la parole de Fish Fish Agent est un système révolutionnaire de clonage de la parole de bout en bout développé sur la base de l'architecture du modèle V0.1 3B. En tant que système de traitement de clones de parole de bout en bout, sa caractéristique la plus importante est l'utilisation de...
Il y a 7 mois
02.9K
E2B:安全云沙箱中的AI代码运行平台

E2B : plateforme d'exécution de code d'IA dans un bac à sable sécurisé dans le nuage

Introduction générale E2B est une plateforme open source conçue pour exécuter du code généré par l'IA dans un bac à sable sécurisé dans le nuage. Elle prend en charge un large éventail de langages de programmation et de cadres et fournit un environnement virtuel isolé pour garantir la sécurité et la fiabilité de l'exécution du code.E2B convient à une variété de scénarios d'application de l'IA, y compris le partitionnement des données...
Il y a 7 mois
02.9K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide : extension d'aide à l'IA qui améliore l'expérience de développement de VSCode avec l'annotation, la conversion et le code généré par l'interface utilisateur en un seul clic.

Introduction générale AIDE (AI-assisted Development Extension) est une puissante extension de développement assistée par l'IA pour VSCode, qui se concentre sur la fourniture d'une assistance unique et utile à la programmation de l'IA. Elle est différente de GitHu...
Il y a 7 mois
02.9K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl : un outil gratuit pour transformer les portraits en images de style Ghibli

Introduction générale EasyControl est un projet open source, le projet est basé sur l'architecture du transformateur de diffusion (DiT) pour fournir un contrôle efficace et flexible de la génération d'images. Parmi eux, Ghibli Control LoRA est l'une de ses caractéristiques spéciales, en utilisant seulement 100 sous...
Il y a 4 mois
02.9K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos : outil open source de création de photos d'identité intelligentes par l'IA

Introduction complète HivisionIDPhotos est un outil de production de photos de documents AI léger et open source, capable d'identifier intelligemment la scène de la photo de l'utilisateur et le keying, afin de générer une photo de document standard conforme à une variété de spécifications. L'outil prend en charge les couleurs et les tailles d'arrière-plan personnalisées et, à l'avenir, il...
Il y a 11 mois
02.9K
ANP:实现智能代理间安全高效通信的开源协议

ANP : un protocole open source pour une communication sécurisée et efficace entre agents intelligents

Introduction générale AgentNetworkProtocol (ANP en abrégé) est un projet de protocole open source, hébergé sur GitHub, visant à fournir des solutions de communication sécurisées et efficaces pour les agents intelligents (AI Agents). Il fonctionne selon une architecture à trois niveaux - identité et cryptage...
il y a 5 mois
02.9K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor : Base de connaissance + LLM Intelligent Code Review Mentor pour GitHub

Introduction complète CR-Mentor est un outil intelligent de révision de code qui combine une base de connaissances professionnelle avec la puissance de la modélisation des grands langages (LLM). Il prend non seulement en charge l'examen du code pour tous les langages de programmation, mais il personnalise également des critères d'examen exclusifs et des domaines d'intérêt pour les équipes sur la base des meilleures pratiques accumulées dans la base de connaissances. Grâce à...
Il y a 9 mois
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT : Interface de chat AI pour visualiser les conversations basées sur les arbres

Introduction générale TreeGPT est une application de chat open source basée sur Next.js, qui se concentre sur la visualisation des conversations avec de grands modèles de langage (LLM, par exemple, GPT) à travers des structures de graphes arborescents (graphes acycliques dirigés, DAG), remplaçant les méthodes de chat linéaires traditionnelles pour améliorer la vitesse et la...
Il y a 6 mois
02.9K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest : analyse de documents au format complexe, extraction de données multimodales en métadonnées et en texte

Introduction complète NV Ingest (NVIDIA Ingest) est une suite de microservices en accès anticipé conçus pour analyser des centaines de milliers de PDF non structurés complexes et désordonnés et d'autres documents d'entreprise. Il peut convertir ces documents en métadonnées et en texte pour les intégrer dans des...
Il y a 7 mois
02.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R : un système de recherche avancée d'IA (RAG) pour l'analyse de contenu multimodal et la combinaison de graphes de connaissances avec la recherche hybride

Introduction complète R2R (RAG to Riches) est un système de recherche IA avancé qui prend en charge la fonctionnalité Retrieval Augmented Generation (RAG) avec des caractéristiques prêtes à la production. Construit sur une API RESTful conteneurisée, le système fournit une analyse multimodale du contenu, une fonctionnalité de recherche hybride...
Il y a 8 mois
02.9K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk : Installation en un clic de modèles d'IA et d'interfaces de discussion sur des ordinateurs personnels (avec DeepSeek)

Introduction générale AingDesk est un logiciel open source et gratuit conçu pour aider les utilisateurs à déployer et à exécuter facilement divers modèles d'IA sur leurs ordinateurs locaux. Qu'il s'agisse d'un modèle DeepSeek ou Llama, AingDesk permet une...
Il y a 6 mois
02.9K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate : une API unifiée pour l'intégration de la génération de parole Well-Known, de la transcription de la parole et de la modélisation de la voix

Introduction générale Orate est une boîte à outils d'IA axée sur la génération et la transcription de la parole. Il fournit une API unifiée qui s'intègre de manière transparente avec les principaux fournisseurs d'IA tels que OpenAI, ElevenLabs et AssemblyAI afin d'aider les utilisateurs à créer des...
Il y a 6 mois
02.9K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita : un cadre open source pour construire des applications RAG modulaires et tester rapidement diverses stratégies RAG

Introduction complète Cognita est un framework open source développé par TrueFoundry pour simplifier le développement d'applications basées sur RAG (Retrieval-Augmented Generation). Le framework fournit une approche structurée, mod...
Il y a 7 mois
02.9K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS : formation et synthèse vocale personnalisée pour podcast

Synthesis Muyan-TTS est un modèle de synthèse vocale open source conçu pour les scénarios de podcasting. Il est pré-entraîné avec plus de 100 000 heures de données audio de podcasts et prend en charge la synthèse vocale sans échantillon pour générer une parole naturelle de haute qualité. Le modèle est basé sur Llama-3.2-3...
Il y a 3 mois
02.9K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors : modèle texte-image pour la génération d'images de haute qualité, avec prise en charge de la génération d'affiches chinoises

Introduction complète Kolors est un modèle de génération de texte-image à grande échelle développé par l'équipe Racer, basé sur des techniques de diffusion de potentiel. Le modèle est entraîné sur des milliards de paires de données texte-image, et est capable de générer des images de haute qualité, complexes et sémantiquement précises, avec une prise en charge des entrées chinoises et anglaises....
Il y a 8 mois
02.9K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG : un outil d'évaluation visuelle pour optimiser les systèmes de génération d'amélioration de la recherche.

Introduction complète XRAG (eXamining the Core) est un cadre d'analyse comparative conçu pour évaluer les composants sous-jacents des systèmes avancés de génération d'augmentation de la recherche (RAG). En profilant et en analysant chaque module de base, XRAG fournit des informations sur la manière dont les différentes configurations et les différents composants affectent...
Il y a 7 mois
02.9K
Supermemory:导入书签和网页内容构建个人知识库

Supermemory : Importer des signets et du contenu web pour construire une base de connaissances personnelle

Introduction générale Supermemory est un projet open source conçu pour aider les utilisateurs à construire leur "deuxième cerveau". Grâce à une puissante extension Chrome et à une technologie d'intelligence artificielle, il permet aux utilisateurs de sauvegarder, d'organiser et de récupérer facilement des données à partir de pages web, de signets Twitter...
Il y a 6 mois
02.9K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot : robot de messagerie instantanée open source de grande taille, compatible avec le déploiement multiplateforme de robots IA (WeChat, QQ, Flybook, etc.)

LangBot est une plateforme de bot de messagerie instantanée basée sur un grand modèle qui prend en charge plusieurs plateformes de messagerie et de grands modèles. La plateforme s'adapte à QQ, WeChat (WeChat d'entreprise, WeChat personnel), Flybook, Discord, OneBot et d'autres plateformes de messagerie, et prend en charge Open...
Il y a 6 mois
02.9K