Projet open source sur l'IA

Total 1020 articles
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS : simulation multi-intelligence des interactions de millions d'utilisateurs dans les médias sociaux pour étudier des phénomènes sociaux complexes

Introduction générale OASIS (Open Agent Social Interaction Simulations) est un simulateur de médias sociaux open source capable de simuler le comportement d'un million d'utilisateurs. La plateforme combine un modèle de langage à grande échelle avec un...
il y a 5 mois
03.1K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly : une plateforme de rédaction IA basée sur l'orchestration de processus sur un canevas libre pour la génération automatisée d'articles.

Introduction complète Refly est un moteur de création natif d'IA basé sur un canevas, conçu pour aider les utilisateurs à transformer leurs idées en contenu de haute qualité grâce au dialogue multithread, à l'intégration de la base de connaissances, à la mémoire contextuelle et à la technologie de recherche intelligente. La plateforme couvre plus de 20 modèles de scénarios professionnels, y compris l'apprentissage...
Il y a 6 mois
03.2K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick : permettre à n'importe quel LLM d'automatiser les opérations sur Android et sur PC

Introduction générale ClickClickClick est un framework développé par BandarLabs qui vise à automatiser des opérations sur Android et PC en utilisant n'importe quel Large Language Model (LLM) local ou distant. Le projet est actuellement dans une phase très expérimentale et supporte une variété de modèles tels que...
Il y a 8 mois
02.6K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

light card : HTML5 card generator tool, create beautiful content cards of simple tools

Description générale lightcard est un outil de génération de cartes simple et élégant conçu pour aider les utilisateurs à créer facilement de belles cartes de contenu. L'outil prend en charge le contenu textuel personnalisé, plusieurs styles de thèmes et les codes QR pour rendre la création plus facile et plus amusante. Les utilisateurs peuvent éditer le titre, le corps et l'auteur...
Il y a 8 mois
02.9K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify : l'outil open source classique pour coloriser les photos et vidéos en noir et blanc à l'aide de techniques d'IA

Introduction complète DeOldify est un projet open source basé sur une technologie d'apprentissage profond dédiée à la coloration intelligente et à la restauration de photos et de vidéos en noir et blanc. Le projet utilise une méthode d'apprentissage NoGAN innovante pour résoudre avec succès les défauts communs des réseaux GAN traditionnels dans le processus de coloration d'image...
Il y a 8 mois
03.7K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use : construction d'outils d'automatisation Web intelligents pour que les intelligents IA puissent facilement utiliser les navigateurs

Introduction complète Browser-Use est un outil d'automatisation web open source innovant spécialement conçu pour permettre aux modèles de langage (LLM) d'interagir naturellement avec les sites web. Il fournit un cadre puissant et flexible qui prend en charge une large gamme de modèles de langage courants, y compris GPT-4, Claud...
Il y a 8 mois
03.9K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage : YouTube Downloader, Télécharger gratuitement des vidéos YouTube, Extraire l'audio, Obtenir les sous-titres

Introduction générale YTSage est un outil moderne de téléchargement YouTube avec une interface PyQt6 propre. Les utilisateurs peuvent utiliser YTSage pour télécharger des vidéos de toute qualité, extraire l'audio, obtenir des sous-titres (y compris des sous-titres auto-générés), et afficher les méta...
Il y a 8 mois
03.2K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard : un cadre open source pour l'optimisation des projets de messages-guides afin d'améliorer la performance des tâches

Introduction complète PromptWizard est un framework open source développé par Microsoft qui utilise un mécanisme auto-évolutif permettant au modèle de générer, d'évaluer et d'améliorer les mots d'incitation et de générer des exemples de manière autonome, en améliorant la qualité du résultat grâce à un retour d'information continu. Il peut optimiser de manière autonome les mots d'incitation, générer et sélectionner des exemples appropriés et...
Il y a 8 mois
03.2K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models : Générer des modèles image-vidéo open source qui prennent en charge le contrôle de l'objectif et de l'amplitude du mouvement.

Introduction générale Ruyi-Models est un projet open source conçu pour générer des vidéos de haute qualité à partir d'images. Développé par l'équipe de IamCreateAI, le projet permet de générer des vidéos cinématiques en résolution 768, 24 images par seconde, 120 images en 5 secondes...
Il y a 8 mois
02.6K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger : génération d'articles de blog à partir de contenu vocal basé sur LangGraph, rédaction automatisée de blogs

Introduction générale Robo Blogger est un outil de création de blog innovant conçu pour simplifier le processus de génération de contenu grâce à la technologie speech-to-text. Les utilisateurs peuvent enregistrer des idées par le biais de n'importe quelle application de synthèse vocale, et Robo Blogger transforme ces idées en contenu de blog structuré...
Il y a 8 mois
03.1K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis : moteur physique génératif open source pour la simulation de mondes dynamiques 4D basés sur la physique réelle

Introduction générale Genesis est un monde physique génératif conçu pour la robotique générale et l'apprentissage de l'IA incarnée. Il fournit une plate-forme de simulation unifiée qui prend en charge un large éventail de matériaux et de phénomènes physiques. Il fournit une plateforme de simulation unifiée qui prend en charge la simulation d'un large éventail de matériaux et de phénomènes physiques....
Il y a 8 mois
03.5K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors : modèle texte-image pour la génération d'images de haute qualité, avec prise en charge de la génération d'affiches chinoises

Introduction complète Kolors est un modèle de génération de texte-image à grande échelle développé par l'équipe Racer, basé sur des techniques de diffusion de potentiel. Le modèle est entraîné sur des milliards de paires de données texte-image, et est capable de générer des images de haute qualité, complexes et sémantiquement précises, avec une prise en charge des entrées chinoises et anglaises....
Il y a 8 mois
03.1K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow : ombrage de dessins animés, ombrage automatique des images en noir et blanc pour améliorer la cohérence et la qualité des couleurs de l'image

Introduction ColorFlow est un outil d'auto-coloration de séquences d'images développé par l'équipe ARC de Tencent pour résoudre le problème de l'auto-coloration de séquences d'images en noir et blanc. L'outil utilise un pipeline d'ombrage amélioré par récupération pour générer avec précision les couleurs de divers éléments à partir d'un ensemble d'images de référence, y compris les couleurs de cheveux des personnages et les...
Il y a 8 mois
02.6K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit : un outil tout-en-un pour la restauration et l'édition d'images lancé par Tencent ARC

Introduction BrushEdit est un outil de réparation et d'édition d'images tout-en-un développé par Tencent ARC Labs. L'outil est basé sur la dernière technologie d'intelligence artificielle et est capable d'identifier et de réparer automatiquement les défauts des images, tout en prenant en charge l'édition interactive par les utilisateurs.BrushEdit combine...
Il y a 8 mois
03K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

Outlines : générer un texte structuré via des expressions régulières, JSON ou des modèles pydantiques

Introduction générale Outlines est une bibliothèque open source développée par dottxt-ai pour améliorer l'application des grands modèles de langage (LLM) par la génération de textes structurés. La bibliothèque prend en charge une variété d'intégrations de modèles, y compris OpenAI, les transformateurs...
Il y a 6 mois
03K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank : un modèle pour générer directement des voix de rap à partir de paroles et de pistes d'accompagnement (jeu de données actuellement ouvert)

Introduction générale RapBank est un ensemble de données et d'outils conçus pour la génération de paroles de rap. Le projet a été créé par NZqian pour fournir aux chercheurs et aux développeurs des données de haute qualité sur les paroles de rap en collectant et en traitant les chansons de rap de YouTube...
Il y a 8 mois
02.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R : un système de recherche avancée d'IA (RAG) pour l'analyse de contenu multimodal et la combinaison de graphes de connaissances avec la recherche hybride

Introduction complète R2R (RAG to Riches) est un système de recherche IA avancé qui prend en charge la fonctionnalité Retrieval Augmented Generation (RAG) avec des caractéristiques prêtes à la production. Construit sur une API RESTful conteneurisée, le système fournit une analyse multimodale du contenu, une fonctionnalité de recherche hybride...
Il y a 8 mois
03K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni : un modèle de compréhension multimodale en bout de chaîne prenant en charge la compréhension et l'analyse multimodales de textes, d'images et de sons

Introduction Infini-Megrez est une solution d'intelligence artificielle développée par le dôme de base incontesté (Infinigence AI), visant à atteindre une compréhension et une analyse multimodales efficaces grâce à la co-conception de matériel et de logiciel. Le cœur du projet est le modèle Megrez-3B, qui prend en charge les graphes...
Il y a 7 mois
02.7K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow : un moteur RAG open source basé sur la compréhension profonde des documents, fournissant des flux de travail de génération améliorés par la recherche.

Introduction complète RAGFlow est un moteur de Génération Augmentée de Récupération (RAG) open source basé sur une technologie de compréhension profonde des documents. Il fournit un flux de travail RAG efficace pour les entreprises de toutes tailles, en incorporant un modèle de langage à grande échelle (LLM) qui peut fournir des données dans des formats complexes basés sur des...
Il y a 7 mois
03.8K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool : un client de visualisation de flux de travail pour les modèles d'IA basés sur l'orchestration de nœuds

Introduction générale NodeTool est une plateforme innovante de création d'IA conçue pour fournir une interface simple et intuitive aux passionnés d'IA, aux développeurs, aux scientifiques des données et aux créatifs. Que vous soyez artiste, développeur ou débutant, NodeTool vous aide à créer rapidement des prototypes...
Il y a 8 mois
02.7K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank : gestion du budget quotidien alimentée par l'IA pour un suivi facile des budgets quotidiens

Description générale Porkybank est une application open source de gestion des finances personnelles conçue pour aider les utilisateurs à suivre facilement leur budget quotidien. Avec une formule simple (revenus - dépenses) / jours = argent liquide, les utilisateurs peuvent visualiser leur situation financière. Le projet est hébergé sur GitHu...
Il y a 7 mois
02.8K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI : un cadre d'intelligence collaborative multi-rôles pour simplifier les tâches complexes

Introduction CrewAI est un cadre avancé conçu pour orchestrer la collaboration entre les jeux de rôle et les agents d'intelligence artificielle autonomes. En facilitant l'intelligence collaborative, CrewAI permet aux agents de travailler ensemble de manière transparente pour résoudre des tâches complexes. Que vous construisiez une plateforme d'assistants intelligents, que vous automatisiez des équipes de service à la clientèle ou que vous...
Il y a 8 mois
03.5K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa : Ajustement virtuel de modèle haute fidélité et ajustement de la pose du personnage, modèle de génération d'image de personnage contrôlable Meta open source

Introduction Leffa est un cadre unifié pour la génération d'images de personnages contrôlables, permettant une manipulation précise de l'apparence du personnage (par exemple, l'ajustement virtuel) et de la pose (par exemple, le transfert de la pose). Le cadre réduit considérablement la distorsion des détails les plus fins en orientant la requête cible vers la clé de référence correcte dans la couche d'attention, avec...
Il y a 8 mois
03.8K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio : génération d'effets sonores synchronisés et de bandes sonores pour des séquences vidéo, outil de coformation multimodale vidéo/audio

Introduction générale MMAudio est un projet open source visant à générer un son synchronisé de haute qualité par le biais d'une formation multimodale conjointe. Développé par Ho Kei Cheng et al. à l'Université chinoise de Hong Kong, la fonction principale du projet est de générer de l'audio synchronisé à partir d'une vidéo et/ou d'un texte....
Il y a 8 mois
04K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat : Chatbots personnalisés pour l'intégration rapide de sources de données multiples

Introduction générale OpenChat est une console de chatbot conviviale conçue pour simplifier l'utilisation des grands modèles de langage (LLM). Grâce à un processus de configuration en deux étapes, OpenChat permet aux utilisateurs de créer et de gérer facilement plusieurs chatbots personnalisés. La plateforme prend en charge les G...
Il y a 7 mois
02.7K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT : garantir la confidentialité des données en s'adressant à plusieurs documents sur des appareils locaux

Introduction générale LocalGPT est un projet open source conçu pour permettre aux utilisateurs de dialoguer avec des documents sur des appareils locaux, tout en garantissant la confidentialité des données. En utilisant divers modèles open source, LocalGPT peut traiter et comprendre le contenu des documents sans télécharger les données dans le nuage. Le projet supporte une variété de p...
Il y a 8 mois
03.3K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT : un système de questions et réponses sur les documents avec un flux de traitement RAG entièrement localisé

Introduction générale PrivateGPT est un projet d'IA disponible pour les environnements de production qui permet aux utilisateurs d'interroger des documents à l'aide de modèles de langage à grande échelle (LLM) sans connexion Internet. Le projet garantit la confidentialité des données pour 100%, toutes les données étant conservées dans l'environnement d'exécution de l'utilisateur...
Il y a 8 mois
02.4K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT : Plate-forme intelligente de construction de corps pour l'automatisation des flux de travail et l'exécution autonome des tâches

Introduction complète AutoGPT est une plateforme puissante conçue pour aider les utilisateurs à créer, déployer et gérer des agents d'intelligence artificielle fonctionnant en continu et à automatiser des flux de travail complexes. Développée par Significant Gravitas, la plateforme offre une large gamme d'outils et de fonctionnalités qui permettent aux utilisateurs de se concentrer...
Il y a 8 mois
03.2K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN : Outil interactif d'édition d'images, contrôle de la position de l'image par pointer-cliquer et glisser-déposer.

Introduction générale DragGAN est un outil interactif d'édition d'images basé sur les réseaux adversoriels génératifs (GAN). Il a été présenté par Xingang Pan et al. au SIGGRAPH 2023 et vise à permettre aux utilisateurs de manipuler intuitivement par de simples opérations de pointer-cliquer et de glisser-déposer...
Il y a 8 mois
03.4K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent : un cadre basé sur Qwen pour les applications d'agents intelligents, comprenant des appels d'outils, des interprètes de code, des RAG et des extensions Chrome.

Introduction complète Qwen-Agent est un cadre d'application d'agent intelligent développé sur la base de Qwen 2.0 et plus, avec des capacités telles que le suivi des commandes, l'utilisation d'outils, la planification et la mémoire. Le cadre fournit une variété d'exemples d'applications telles que des assistants de navigateur, des interprètes de code et des assistants personnalisés...
Il y a 8 mois
03.5K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover : un créateur de couvertures en ligne conçu pour générer des couvertures personnalisées pour les blogs, les vidéos courtes, les médias sociaux et bien plus encore !

Introduction générale Mini-Cover est un outil open source de génération de couvertures en ligne conçu pour générer des couvertures personnalisées pour des plateformes telles que les blogs, les vidéos courtes et les médias sociaux. Développé par JLinMr, l'outil vise à fournir une solution simple et efficace pour aider les utilisateurs à générer rapidement des couvertures qui répondent à leurs besoins...
Il y a 8 mois
02.7K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown : Outil de conversion intelligent de Microsoft Document pour convertir divers fichiers au format Markdown

Introduction générale MarkItDown est un outil Python développé par Microsoft et conçu pour convertir divers fichiers et documents bureautiques au format Markdown. L'outil prend en charge un large éventail de types de fichiers, notamment PDF, PowerPoint, Word, Excel, diagrammes...
Il y a 8 mois
03.5K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

Claude Engineer : un assistant de dialogue corporel intelligent qui génère et gère de manière autonome des outils d'IA en utilisant le modèle Claude.

Introduction générale Claude Engineer est une interface interactive en ligne de commande (CLI) développée par Doriandarko qui utilise le modèle Claude-3.5-Sonnet d'Anthropic pour aider au développement de logiciels...
il y a 5 mois
02.9K
Swarms:多智能体编排框架,企业级生产工具

Swarms : cadre d'orchestration multi-intelligence, outil de production d'entreprise

Introduction générale Swarms est un framework d'orchestration multi-agents prêt pour la production, conçu pour stimuler la productivité de l'entreprise grâce à une gestion efficace des agents et au traitement des tâches. Prenant en charge plusieurs modèles, plusieurs systèmes de mémoire et la création d'agents personnalisés, le framework offre une conception modulaire et des fonctionnalités de journalisation complètes pour garantir que le système...
Il y a 8 mois
02.6K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic : Des images de portraits audio génèrent des vidéos de démonstration numériques avec des expressions faciales vivantes.

Introduction générale Sonic est une plateforme innovante axée sur la perception audio globale, qui vise à générer des portraits animés par l'audio. Développée par une équipe de chercheurs de Tencent et de l'université de Zhejiang, la plateforme utilise les informations audio pour contrôler les expressions faciales et les mouvements de tête afin de générer des vidéos animées naturelles et fluides....
Il y a 4 mois
03K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox : un macromodèle audio multimodal pour un dialogue vocal en temps réel de bout en bout, une implémentation open source de l'interaction vocale GPT-4o

Introduction complète Ultravox est un modèle multimodal innovant de grande langue (LLM) conçu pour le traitement de la parole en temps réel. Contrairement aux systèmes de reconnaissance vocale traditionnels, Ultravox élimine le besoin d'une étape séparée de reconnaissance de la parole audio (ASR), et est capable de convertir directement l'audio dans un espace...
Il y a 8 mois
02.9K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip : outil de synchronisation labiale vidéo de haute qualité, optimisé pour Wav2Lip

Introduction générale Easy-Wav2Lip est un outil amélioré basé sur Wav2Lip conçu pour simplifier le processus de synchronisation labiale des vidéos. L'outil offre une configuration et une implémentation plus simples avec un support pour Google Colab et une installation locale. En optimisant l'algorithme, Ea...
Il y a 8 mois
04.7K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit : recherche sur le web et rédaction de rapports à l'aide de LLM natifs, en approfondissant automatiquement les sujets spécifiés par l'utilisateur et en générant des résumés.

Introduction générale Research Rabbit est un assistant de recherche et de résumé en ligne basé sur le LLM (Large Language Model). Après que l'utilisateur ait fourni un sujet de recherche, Research Rabbit génère une requête de recherche, obtient des résultats web pertinents et résume ces résultats...
Il y a 4 mois
02.6K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo : un client Python qui démontre le processus de fonctionnement d'un organisme intelligent, en fournissant une interface graphique intuitive.

Introduction complète AgentClientDemo est un projet Python complet qui intègre des fonctionnalités intelligentes (Agent) et clientes (Client). Le projet est basé sur le framework PyQt et fournit une interface graphique intuitive et facile à utiliser (G...
Il y a 8 mois
02.7K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替

HelloMeme : Générer localement une expression de haute fidélité, une action cohérente d'une image ou d'une vidéo, Runway Act one open source ping pong !

Introduction HelloMeme est un projet open source développé par HelloVision, qui vise à intégrer des bandes de haut niveau et de haute fidélité dans les modèles de diffusion en intégrant les Spatial Knitting Attentions...
Il y a 8 mois
02.9K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr : un service tout-en-un qui utilise des modèles visuels pour l'ingestion de documents et le découpage intelligent basé sur la hiérarchie des paragraphes du texte.

Introduction générale Chunkr est une API auto-hébergée dédiée à la conversion de fichiers PDF, PPTX, DOCX et Excel en données utilisables dans RAG (Retrieval Augmented Generation) et LLM (Large Language Modelling). Le projet a été développé par Lumina...
Il y a 8 mois
03.6K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest : Convertir rapidement les dépôts de code Github en texte adapté à la compréhension du LLM

Introduction générale GitIngest est un outil open source conçu pour transformer les dépôts de code GitHub en texte adapté aux indices du Large Language Model (LLM). Avec une simple opération, les utilisateurs peuvent extraire et formater le contenu de n'importe quel dépôt GitHub pour qu'il corresponde au ...
Il y a 8 mois
03.6K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena : Comparaison des capacités de programmation LLM Open Source, vue en temps réel des meilleurs modèles de génération de code

Introduction générale CodeArena est une plateforme unique conçue pour présenter les meilleurs modèles de génération de code (LLM) open source à travers des confrontations en temps réel. Les utilisateurs peuvent regarder différents LLM s'affronter dans les mêmes tâches de programmation et voir les modèles les plus performants grâce à des classements en temps réel. La plateforme utilise Tog...
Il y a 8 mois
02.6K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2) : Copilote natif créé à l'aide de l'API GPT, avec prise en charge de dialogues complémentaires dans n'importe quelle fenêtre.

Introduction générale ChatFree est un projet open source qui vise à libérer les applications d'intelligence artificielle des contraintes des navigateurs pour les exécuter localement. Créé à l'aide de l'API GPT, Copilot est conçu pour prendre en charge une large gamme de logiciels de bureautique tels qu'Office, Word, WPS, etc. Le projet a été développé par ...
Il y a 8 mois
02.5K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen : Génération de dessins au trait et de croquis de haute qualité, rétropropagation des mots clés de l'image, installation du paquet en un seul clic.

Introduction générale Sketch-Gen est un outil de dessin au trait et de génération de croquis basé sur la technologie de l'IA, conçu pour aider les artistes et les designers à générer rapidement des dessins au trait et des croquis de haute qualité. Dérivé du projet Paints-UNDO, l'outil utilise des modèles avancés d'apprentissage...
Il y a 8 mois
02.7K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

Steel Browser : API automatisée pour navigateur Web permettant de créer des renseignements et des applications qui contrôlent les opérations du navigateur

Introduction générale Steel Browser est une API de navigateur open source conçue pour les agents et les applications d'intelligence artificielle. Il fournit une instance de navigateur complète qui permet aux utilisateurs d'automatiser les opérations web sans se soucier de l'infrastructure....
Il y a 8 mois
04K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Vidéo hybride de Vincennes : génération de séquences réalistes de vidéo de haute qualité, Tencent open source génération de vidéo de grands modèles

Introduction détaillée Tencent Mixed Yuan Text Generation Video (disponible dans Yuanbao APP) est une plateforme de génération de vidéos basée sur la technologie de l'IA lancée par Tencent. La plateforme utilise le Tencent Mixed Yuan Big Model avec de puissantes connaissances inter-domaines et une compréhension du langage naturel pour générer des vidéos de haute qualité basées sur les descriptions textuelles des utilisateurs....
Il y a 7 mois
03.5K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Ordinateur Clevrr : Automatiser la manipulation intelligente du bureau avec la bibliothèque PyAutoGUI

Introduction générale Clevrr Computer est un projet open source qui vise à automatiser les opérations système grâce à l'utilisation de la bibliothèque PyAutoGUI. Le projet a été inspiré par Anthropic pour concevoir un agent d'automatisation capable d'effectuer des opérations de manière précise et efficace en utilisant ...
Il y a 8 mois
02.5K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director : cadre d'agent vidéo intelligent pour la recherche, l'édition et la génération de flux de travail vidéo avec des descriptions en langage naturel

Introduction générale Director est un framework open source conçu pour simplifier et optimiser les interactions et les flux de travail vidéo en construisant des agents vidéo intelligents. Le cadre est basé sur l'infrastructure "vidéo en tant que données" de VideoDB et est capable de gérer des tâches vidéo complexes telles que la recherche, l'édition, la compilation et la génération...
Il y a 8 mois
03K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum : s'appuyer sur MCP pour interroger et résumer les messages WeChat dans Claude

Introduction générale MCP Server ChatSum est un projet open source conçu pour aider les utilisateurs à interroger et à résumer les messages de chat. Le projet est hébergé sur GitHub et fournit un ensemble d'outils puissants qui permettent aux utilisateurs d'interroger les journaux de chat sur la base de paramètres spécifiques et de générer les résumés correspondants...
il y a 5 mois
03.1K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter : Wisdom Spectrum a lancé un modèle puissant de génération de textes ultra-longs, permettant de générer plus de 10 000 mots dans une seule conversation.

Introduction complète LongWriter est un puissant outil de génération de textes longs développé par le groupe de recherche sur l'exploration des données de l'université de Tsinghua (THUDM). L'outil est basé sur le modèle de langage avancé Long Context (LLM) et est capable de générer des textes longs de plus de 10 000 mots.
Il y a 8 mois
02.7K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段

MuseGAN : un modèle open source pour générer des musiques/pistes sonores multipistes et créer facilement des clips musicaux pour plusieurs instruments.

Introduction générale MuseGAN est un projet de génération de musique basé sur des réseaux adverbiaux génératifs (GAN) conçus pour générer de la musique multi-pistes (multi-instruments). Le projet est capable de générer de la musique à partir de zéro ou accompagnée de pistes fournies par l'utilisateur.
Il y a 8 mois
02.6K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo : Générez des copies vidéo et de courtes vidéos HD en un seul clic en entrant un thème vidéo

Introduction complète MoneyPrinterTurbo est un projet open source qui utilise une technologie avancée d'intelligence artificielle pour générer de courtes vidéos HD en un seul clic. Les utilisateurs n'ont qu'à fournir un thème vidéo ou des mots-clés, le système générera automatiquement des copies vidéo, des clips vidéo, des sous-titres vidéo et...
il y a 5 mois
02.8K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI : outil en ligne de commande permettant d'utiliser les services MCP dans n'importe quel grand modèle, sans dépendre de Claude.

Introduction complète Le Model Context Provider CLI (mcp-cli) est un outil de ligne de commande au niveau du protocole pour interagir avec un serveur de fournisseur de contexte de modèle. L'outil permet aux utilisateurs d'envoyer des commandes, d'interroger des données et d'interagir avec diverses ressources fournies par le serveur...
il y a 5 mois
03.6K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow : Un cadre Python pour construire des flux de travail contrôlés et transparents pour les corps intelligents de l'IA

Introduction générale ControlFlow est un framework Python développé par PrefectHQ qui se concentre sur la construction et la gestion de workflows d'IA. Il fournit un cadre structuré, orienté développeur, pour définir des flux de travail et déléguer des tâches à la génération de Grands Modèles de Langage (LLM)...
Il y a 8 mois
03.3K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID : une carte de référence de portrait pour générer des vidéos cohérentes avec les caractères, une intégration multi-terminale rapide

Introduction complète ConsisID est un projet open source développé par le groupe de Yuan Rong à l'Université de Pékin, visant à réaliser une génération de texte-vidéo cohérente sur le plan de l'identité (IPT2V) grâce à des techniques de décomposition de fréquence. Le cœur du projet est un DiT (Diffusion Transfor...
Il y a 8 mois
03.5K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers : une bibliothèque légère pour l'observabilité de l'IA qui suit les données des requêtes d'API compatibles avec OpenAI

Introduction générale Observers est un SDK Python open source conçu pour fournir une observabilité complète pour les API d'IA générative. La bibliothèque permet aux utilisateurs de suivre et d'enregistrer facilement les interactions avec les modèles d'IA et de stocker ces observations dans plusieurs backends. Que ce soit...
Il y a 8 mois
02.6K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow) : plateforme open source pour la création et la gestion de graphes de connaissances, avec prise en charge native des applications RAG.

Introduction complète Knowledge Graph Studio (KGS) est une plateforme open source conçue pour simplifier le processus de création et de gestion des graphes de connaissances natifs de RAG. La plateforme offre une résolution d'entités basée sur des règles, une construction modulaire de graphes, des données...
Il y a 8 mois
03.1K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Report mAIstro : génère des rapports détaillés sur n'importe quel sujet personnalisé, tel que l'analyse commerciale, les rapports de fin d'année, etc.

Description générale Report mAIstro est un outil puissant conçu pour aider les utilisateurs à créer facilement des rapports personnalisés grâce à la technologie de traitement du langage naturel. L'outil utilise la technologie LangChain pour transformer les sujets et les structures fournis par l'utilisateur en rapports détaillés dans...
Il y a 4 mois
02.8K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS : modèle de génération d'actifs 3D développé par Microsoft avec prise en charge de plusieurs formats et souplesse d'édition.

Introduction générale TRELLIS est un modèle de génération de ressources 3D à grande échelle développé par Microsoft. Il est capable de recevoir des invites sous forme de texte ou d'image et de générer des ressources 3D de haute qualité dans divers formats, tels que des champs radiaux, des gaussiennes 3D et des maillages....
Il y a 8 mois
03.9K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast : un outil efficace d'apprentissage et de prévision des conditions météorologiques mondiales à moyen terme basé sur des modèles de diffusion

Introduction générale GraphCast est un outil de prévision météorologique avancé développé par Google DeepMind qui vise à améliorer la précision des prévisions météorologiques mondiales à moyen terme grâce à des techniques d'apprentissage profond. Le projet fournit une variété de modèles pré-entraînés et d'exemples de code, que les utilisateurs peuvent utiliser pour...
Il y a 8 mois
02.6K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo : un cadre léger et flexible pour les organismes intelligents, avec une configuration simple des rôles et des outils pour gérer de multiples charges de travail.

Introduction générale Bambo est un nouveau type de framework proxy, qui est plus léger et plus flexible que les frameworks traditionnels, et qui peut gérer une variété de tâches de charge. Bambo réalise une fonctionnalité proxy efficace en définissant tous les outils dans le catalogue d'outils et en utilisant des fonctions personnalisées asynchrones. Les utilisateurs peuvent se servir de l'outil llm_c...
Il y a 8 mois
02.9K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA : Système localisé d'automatisation des courriels pour la génération rapide de projets de réponses aux courriels (Gmail)

Introduction générale LAMBDA (Local Auto MailBox Draft Assistant) est un système d'automatisation d'email AI localisé conçu pour apprendre du style d'email d'un utilisateur et générer un brouillon pour chaque email non lu dans la boîte de réception Gmail....
Il y a 8 mois
02.8K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1 : une version open source du modèle OpenAI o1 basé sur Qwen2-7B-Instruire un réglage fin pour explorer des modèles d'inférence ouverts pour résoudre des problèmes complexes

Introduction Marco-o1 est un modèle de raisonnement ouvert développé par Alibaba International Digital Commerce Group (AIDC-AI) pour résoudre des problèmes complexes du monde réel. Le modèle combine le réglage fin de la chaîne de pensée (CoT), la recherche arborescente de Monte Carlo (MCTS) et des stratégies de raisonnement innovantes...
Il y a 8 mois
03.3K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务

Flow (Laminar) : un moteur de tâches léger pour la construction d'intelligences qui simplifie et gère les tâches de manière flexible.

Introduction complète Flow est un moteur de tâches léger conçu pour construire des agents d'intelligence artificielle en mettant l'accent sur la simplicité et la flexibilité. Contrairement aux flux de travail traditionnels basés sur les nœuds et les bords, Flow utilise un système de file d'attente dynamique qui prend en charge l'exécution parallèle, l'ordonnancement dynamique et la gestion intelligente des dépendances. Son concept de base est ...
Il y a 8 mois
02.8K
Laminar:开源AI产品工程化平台,轻松实现数据可视化追踪与评估

Laminar : plateforme open source d'ingénierie des produits d'IA pour faciliter la visualisation, le suivi et l'évaluation des données

Introduction complète Laminar est une plateforme open source d'optimisation de l'ingénierie de l'IA axée sur l'ingénierie de l'IA à partir des premiers principes. Elle aide les utilisateurs à collecter, comprendre et utiliser les données pour améliorer la qualité des applications LLM (Large Language Modelling)....
Il y a 8 mois
03K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse : analyse chaque type de document en données disponibles en LLM, en préservant toutes les informations du document, telles que les tableaux et les images, dans leur intégralité.

Introduction générale MegaParse est un outil d'analyse de documents puissant et polyvalent, conçu pour optimiser le traitement des données pour le Large Language Model (LLM). Que vous travailliez avec du texte, des PDF, des présentations PowerPoint ou des documents Word, MegaParse...
Il y a 8 mois
03.1K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio : programme open source pour la suppression par lots des arrière-plans d'images et de vidéos, optimisé pour RMBG 2.0

Introduction générale RMBG-2-Studio est une application améliorée de suppression et de remplacement d'arrière-plan développée sur la base du modèle BRIA-RMBG-2.0. L'application est conçue pour fournir aux utilisateurs des capacités de traitement d'arrière-plan d'image efficaces et précises pour une variété de types d'images, y compris le commerce électronique, les jeux et...
Il y a 8 mois
03.6K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案

OpenAlternative : une sélection de logiciels libres alternatifs aux produits SaaS couramment utilisés, pour trouver les meilleures alternatives aux logiciels libres.

Introduction générale OpenAlternative est une plateforme axée sur la fourniture d'alternatives aux logiciels open source, visant à aider les utilisateurs à trouver des outils open source appropriés pour remplacer les produits commerciaux SaaS qu'ils utilisent au quotidien. Le site aide les utilisateurs à économiser de l'argent et à s'améliorer grâce à une collection soigneusement sélectionnée d'outils open source...
Il y a 8 mois
02.3K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller : résumez un livre entier en un clic, distillez efficacement le contenu du livre et saisissez rapidement les idées essentielles.

Introduction complète TextDistiller est un outil avancé basé sur l'intelligence artificielle, conçu pour résumer des livres chapitre par chapitre ou dans leur ensemble, en fournissant une vue d'ensemble à la fois concise et complète. En utilisant TextDistiller, les utilisateurs sont en mesure de saisir rapidement les idées essentielles et les points clés de n'importe quel livre...
Il y a 8 mois
03K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge : un environnement de programmation visuelle open source pour tester et évaluer l'efficacité de grands modèles de langue

Introduction générale ChainForge est un environnement de programmation visuelle open source conçu pour tester et évaluer l'efficacité des repères des grands modèles de langage (LLM). Il fournit un environnement d'ingénierie de repérage de flux de données grâce auquel les utilisateurs peuvent rapidement explorer et analyser la qualité de différents repères sur la réponse LLM....
Il y a 8 mois
02.7K
InsightExpress:生成AI驱动的研究报告并通过电子邮件发送

InsightExpress : générer des rapports de recherche pilotés par l'IA et les envoyer par courrier électronique

Description générale InsightExpress est une application basée sur Next.js qui génère des rapports de recherche pilotés par l'IA sur la base de sujets fournis par l'utilisateur et les envoie par e-mail aux utilisateurs. L'application s'appuie sur l'IA de Langflow ...
Il y a 4 mois
02.6K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy : une bibliothèque Python open source pour les scientifiques des données pour une analyse efficace des données et des applications d'IA.

Introduction générale Taipy est une puissante bibliothèque Python développée par Avaiga, conçue pour les data scientists et les ingénieurs en apprentissage automatique afin de créer et de déployer rapidement des applications web basées sur les données....
Il y a 8 mois
02.7K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy : proxy/renversement du canal Discord Midjourney pour les appels à l'API de cartographie de l'IA (test gratuit)

Introduction complète Midjourney Proxy est un projet open source conçu pour fournir des services proxy pour le canal Discord de Midjourney, en convertissant les fonctions de dessin AI sous forme d'API. Le projet est complètement libre et open source, supportant le changement de visage en un clic, le mélange d'images, la génération de graphes ...
Il y a 8 mois
03.5K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live : AI digital people pour une interaction fluide en temps réel sur les cartes graphiques de la série 30/40

Introduction générale DH_live est un projet d'humain numérique en temps réel basé sur l'apprentissage par échantillonnage, visant à fournir aux utilisateurs une expérience de streaming en direct fluide et interactive. Le projet est compatible avec les cartes graphiques NVIDIA des séries 30 et 40 et est capable de fonctionner en temps réel à plus de 25 images par seconde. Les utilisateurs peuvent...
Il y a 9 mois
03.3K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具

multi-model-bolt.new : modification open source basée sur Bolt.new, outils de développement full-stack pilotés par l'IA

Description générale multi-modèle-bolt.new est une version modifiée de Bolt.new qui permet l'utilisation de modèles TogetherAI, prenant en charge des fonctionnalités telles que le déploiement, la réponse mobile et la saisie vocale. Les utilisateurs peuvent être invités directement dans le...
Il y a 8 mois
03.8K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow : un outil à code bas pour construire des intelligences et des flux de travail d'IA puissants

Introduction générale Langflow est un outil à code bas conçu pour les développeurs afin de construire de puissants agents d'intelligence artificielle et des flux de travail. Il supporte l'utilisation de n'importe quelle API, modèle ou base de données, simplifiant ainsi le développement d'applications complexes d'IA.
Il y a 8 mois
04K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund : système de négociation automatisé open source qui utilise des intelligences multiples pour prendre des décisions complexes en matière de négociation de fonds spéculatifs.

Introduction générale AI Hedge Fund est un fonds spéculatif d'intelligence artificielle qui utilise un système multi-agents pour prendre des décisions de trading. Le système travaille en tandem avec de multiples agents spécialisés, y compris des agents de données de marché, des agents quantitatifs, des agents de gestion du risque et des agents de gestion de portefeuille, afin de réaliser des transactions complexes....
Il y a 7 mois
04.1K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite : un outil efficace de génération d'augmentation de la recherche (RAG) qui prend en charge plusieurs bases de données et modèles linguistiques.

Introduction générale RAGLite est une boîte à outils Python pour Retrieval Augmented Generation (RAG) qui prend en charge les bases de données PostgreSQL ou SQLite. Il offre des options de configuration flexibles qui permettent aux utilisateurs de choisir différents modèles de langage et réorganisateurs...
Il y a 9 mois
03.1K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor : surveiller les activités des utilisateurs d'OpenWebUI, gérer les limites d'utilisation, supporter le déploiement en un clic.

Introduction générale OpenWebUI-Monitor est un tableau de bord permettant de surveiller les activités des utilisateurs d'OpenWebUI et de gérer les quotas d'utilisation. Il vous permet de définir efficacement les quotas d'utilisation, de visualiser les données des utilisateurs et les informations visuelles en temps réel, et supporte le déploiement en un clic pour faciliter la gestion et la surveillance des...
Il y a 9 mois
03.2K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook : ingénieurs en IA full-stack open source qui construisent et itèrent rapidement des projets TypeScript complets.

Introduction générale Srcbook est une plateforme de développement d'applications centrée sur TypeScript, conçue pour créer et itérer rapidement sur des applications web avec des assistants IA. Elle prend en charge l'exécution native, fournit une interface de carnet de notes interactive et permet aux utilisateurs d'écrire et d'exécuter du code back-end....
Il y a 9 mois
03.1K