Projet open source sur l'IA

Total 1020 articles
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS : modèle de génération d'actifs 3D développé par Microsoft avec prise en charge de plusieurs formats et souplesse d'édition.

Introduction générale TRELLIS est un modèle de génération de ressources 3D à grande échelle développé par Microsoft. Il est capable de recevoir des invites sous forme de texte ou d'image et de générer des ressources 3D de haute qualité dans divers formats, tels que des champs radiaux, des gaussiennes 3D et des maillages....
Il y a 8 mois
03.5K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq : Cadre d'orchestration de corps intelligents avec support d'agents RAG et LLM pour simplifier le développement d'applications d'IA

Introduction Dynamiq est un cadre d'orchestration d'IA open source conçu pour l'IA des agents et les applications de modélisation des grands langages (LLM). Il vise à simplifier le développement d'applications basées sur l'IA, en particulier dans le domaine de la Génération Augmentée de Récupération (RAG) et de l'orchestration d'agents LLM.Dynamiq propose...
Il y a 9 mois
03.5K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter : l'alternative open source et non censurée de Character.AI

Introduction générale OpenCharacter est un outil de création de personnages open source conçu pour fournir aux utilisateurs une expérience de création et d'interaction de personnages IA non filtrée et illimitée en tant qu'alternative à Character.AI. Les utilisateurs peuvent créer et faire fonctionner leurs propres personnages en utilisant des modèles natifs, ou...
Il y a 7 mois
03.5K
OpenSPG:开源知识图谱引擎

OpenSPG : moteur de graphe de connaissances open source

Introduction complète OpenSPG est un moteur de graphe de connaissances open source développé par Ant Group en collaboration avec OpenKG, basé sur le cadre SPG (Semantic Augmented Programmable Graph). Le moteur est conçu pour fournir des fonctionnalités telles que la représentation sémantique explicite, la définition de règles logiques et un cadre opérationnel pour soutenir la construction et la gestion de graphes de connaissances de domaine...
Il y a 11 mois
03.5K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2 : Modèle d'apprentissage profond pour la suppression rapide de l'arrière-plan dans les images et les vidéos

Introduction complète BEN2 (Background Erase Network 2) est un modèle d'apprentissage profond développé par Prama LLC spécifiquement conçu pour supprimer automatiquement l'arrière-plan d'une image et générer une image de premier plan. Le modèle utilise une méthode innovante de Confiden...
Il y a 2 mois
03.5K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI Portrait Master version chinoise : Outil de mots clés pour optimiser la génération de portraits

Introduction générale ComfyUI Portrait Master version chinoise est un outil de génération de mots-clés pour les portraits conçu pour les créateurs d'images d'IA. L'outil aide les utilisateurs à générer des portraits de haute qualité en optimisant les mots-clés. Les utilisateurs peuvent choisir différents objectifs en fonction de la demande...
Il y a 12 mois
03.5K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat : projet open source d'imitation de l'interface ChatGPT, de l'interaction avec l'IA et du dialogue

Introduction générale LibreChat est une plateforme de chat IA gratuite et open source avec des options de personnalisation étendues et un support pour de multiples fournisseurs d'IA, services et intégrations. Elle rassemble toutes les conversations d'IA en un seul endroit avec une interface familière et des fonctionnalités innovantes, prenant en charge de multiples modèles d'IA, des plugins et plusieurs langues. En...
Il y a 12 mois
03.5K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI : cadre backend basé sur SpringBoot pour le chat et le dessin d'IA

Introduction RuoYi AI est un projet back-end basé sur le framework ruoyi-plus, qui se concentre sur l'intégration des fonctions de chat et de peinture de l'IA. Il est entièrement open source et gratuit, utilisant Java17 et SpringBoot 3.X technology stack, backend management ...
il y a 5 mois
03.5K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID : une carte de référence de portrait pour générer des vidéos cohérentes avec les caractères, une intégration multi-terminale rapide

Introduction complète ConsisID est un projet open source développé par le groupe de Yuan Rong à l'Université de Pékin, visant à réaliser une génération de texte-vidéo cohérente sur le plan de l'identité (IPT2V) grâce à des techniques de décomposition de fréquence. Le cœur du projet est un DiT (Diffusion Transfor...
Il y a 8 mois
03.5K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip : montage intelligent de contenus vidéo en courts métrages, facilité d'extraction et de découpage précis de clips vidéo

Introduction complète FunClip est un outil d'édition vidéo automatisé et localisé, entièrement open source, développé par le TONGYI Speech Lab de l'Alibaba Dharma Institute. L'outil intègre le modèle de reconnaissance vocale Paraformer-Large de qualité industrielle, qui peut identifier avec précision la parole dans la vidéo...
Il y a 7 mois
03.5K
WeWe RSS:生成微信公众号RSS订阅的开源工具

WeWe RSS : outil open source pour générer des flux RSS publics WeChat

Introduction complète WeWe RSS est un outil open source gratuit conçu spécifiquement pour les utilisateurs de numéros publics WeChat. Il récupère les articles des numéros publics via la plateforme de lecture WeChat et génère des flux RSS afin que les utilisateurs puissent consulter le contenu à tout moment à l'aide d'un lecteur RSS. Cet outil résout le problème des lettres du numéro public de WeChat...
il y a 5 mois
03.5K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook : convertir des livres électroniques en livres audio, outil open source avec support multilingue et clonage de voix

Introduction générale ebook2audiobook est un puissant outil open source de conversion de livres électroniques en livres audio. Il est capable de convertir des livres électroniques dans plusieurs formats en livres audio avec des marqueurs de chapitres et des métadonnées. L'outil utilise Calibre pour la conversion des formats de livres électroniques en utilisant Co...
Il y a 7 mois
03.5K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow : un moteur RAG open source basé sur la compréhension profonde des documents, fournissant des flux de travail de génération améliorés par la recherche.

Introduction complète RAGFlow est un moteur de Génération Augmentée de Récupération (RAG) open source basé sur une technologie de compréhension profonde des documents. Il fournit un flux de travail RAG efficace pour les entreprises de toutes tailles, en incorporant un modèle de langage à grande échelle (LLM) qui peut fournir des données dans des formats complexes basés sur des...
Il y a 7 mois
03.5K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI : outil open source d'exploration asynchrone du web pour extraire des données structurées sans LLM

Introduction complète Crawl4AI est un outil d'exploration du web asynchrone open source conçu pour les grands modèles de langage (LLM) et les applications d'intelligence artificielle (IA). Il simplifie le processus d'exploration du web et d'extraction de données, supporte l'exploration efficace du web et fournit des formats de sortie adaptés aux LLM pour...
Il y a 9 mois
03.4K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX Video (LTXV) : un modèle open-source pour la génération de vidéos en temps réel qui produit des vidéos de haute qualité

Introduction générale LTX-Video est le premier modèle de génération vidéo en temps réel basé sur le DiT (Diffusion Transformer) développé par Lightricks. Le modèle est capable de générer une haute qualité à une résolution de 768x512 à 24 images par seconde...
Il y a 7 mois
03.4K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity : modélisation autorégressive bitwise de la génération d'images à haute résolution pour une génération d'images à haute résolution illimitée

Introduction générale Infinity est un cadre révolutionnaire de génération d'images haute résolution développé par l'équipe de FoundationVision. Le projet dépasse les limites des modèles traditionnels de génération d'images grâce à une approche innovante de modélisation autorégressive visuelle au niveau du bit....
Il y a 8 mois
03.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat : un assistant de chat IA localisé compatible avec de multiples plateformes

Introduction générale NextChat est un service de chat IA révolutionnaire qui permet aux utilisateurs de déployer des services de chat avec les meilleurs modèles linguistiques tels que GPT-3, GPT-4, GPT-4.5 et Gemini Pro. Il offre une interface utilisateur élégante, des fonctions de collaboration, des intégrations, des modèles et...
Il y a 6 mois
03.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot : outil de traitement intelligent de l'information sur le Web, API gratuite pour la capture de contenu Web

WebPilot Introduction générale WebPilot est un "assistant web" gratuit et open source qui vous permet de communiquer librement avec n'importe quelle page web ou d'effectuer des tâches automatisées. Vous n'avez pas besoin de changer de page ou de copier-coller, il vous suffit de sélectionner du texte ou d'entrer des commandes, webpilot...
Il y a 11 mois
03.4K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research : l'assistant intelligent open source de LangChain pour la recherche approfondie

Introduction complète Open Deep Research est un assistant de recherche en ligne capable de générer des rapports de recherche complets sur n'importe quel sujet. Le système utilise un flux de travail "planifier et faire" qui permet aux utilisateurs de planifier et de revoir la structure du rapport avant de passer à la phase de recherche qui prend beaucoup de temps...
Il y a 4 mois
03.4K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天

SiYuan (SiYuan Notes) : logiciel de gestion des connaissances personnelles axé sur la protection de la vie privée et doté d'une fonction de rédaction AI et d'un système de chat Q&A.

Généralités : SiYuan Notes (SiYuan) est un logiciel de gestion des connaissances personnelles axé sur la confidentialité qui est entièrement open source et prend en charge l'auto-hébergement. Il est écrit en TypeScript et Golang, fournit des références fines au niveau du bloc et Markdown WYSIWYG (WYSIWY...
Il y a 6 mois
03.4K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D) : génération d'actifs 3D haute résolution, flux de travail multiples pour la génération de matériaux 3D

Introduction complète Tencent Hunyuan3D (Hunyuan3D 2.0) est un système avancé de composition 3D à grande échelle de Tencent conçu pour générer des ressources 3D texturées en haute résolution. Le système se compose de deux éléments principaux : Hunyuan3D-DiT, un modèle de génération de formes à grande échelle, et Hunyuan3D-DiT, un modèle de...
Il y a 7 mois
03.4K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen : un modèle unifié de génération d'images avec des entrées multimodales pour générer des images cohérentes avec les personnages

Introduction générale OmniGen est un modèle "universel" de génération d'images développé par VectorSpaceLab qui permet aux utilisateurs de créer des effets visuels variés et riches en contexte avec de simples invites textuelles ou des entrées multimodales. Il est particulièrement bien adapté aux applications qui doivent reconnaître...
Il y a 9 mois
03.4K
ell:轻量级函数式提示词工程框架

ell : Cadre d'ingénierie des mots repères fonctionnels légers

Introduction générale ell est une bibliothèque de programmation de modèles en langage fonctionnel léger, développée par William Guss, ancien chercheur de l'OpenAI. Elle est conçue dans l'idée de traiter les signaux comme des programmes, et non comme de simples chaînes de caractères. ell fournit un contrôle de version et une sérialisation automatisés...
Il y a 6 mois
03.4K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Vidéo hybride de Vincennes : génération de séquences réalistes de vidéo de haute qualité, Tencent open source génération de vidéo de grands modèles

Introduction détaillée Tencent Mixed Yuan Text Generation Video (disponible dans Yuanbao APP) est une plateforme de génération de vidéos basée sur la technologie de l'IA lancée par Tencent. La plateforme utilise le Tencent Mixed Yuan Big Model avec de puissantes connaissances inter-domaines et une compréhension du langage naturel pour générer des vidéos de haute qualité basées sur les descriptions textuelles des utilisateurs....
Il y a 7 mois
03.4K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa : Ajustement virtuel de modèle haute fidélité et ajustement de la pose du personnage, modèle de génération d'image de personnage contrôlable Meta open source

Introduction Leffa est un cadre unifié pour la génération d'images de personnages contrôlables, permettant une manipulation précise de l'apparence du personnage (par exemple, l'ajustement virtuel) et de la pose (par exemple, le transfert de la pose). Le cadre réduit considérablement la distorsion des détails les plus fins en orientant la requête cible vers la clé de référence correcte dans la couche d'attention, avec...
Il y a 8 mois
03.4K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR : projet open source de réparation d'images endommagées et de zoom haute définition, minimum 16G de mémoire vidéo

Description générale InstantIR est un modèle innovant de restauration d'une seule image développé par l'équipe d'InstantX, conçu pour ressusciter vos images endommagées avec des détails de très haute qualité et réalistes, capable d'effectuer une restauration de haute qualité des images endommagées. L'outil ne se contente pas de restaurer les détails de l'image...
Il y a 9 mois
03.4K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR : logiciel de suppression de filigrane vidéo sans perte et de sous-titres en dur (client de suppression de filigrane vidéo 7G+).

Introduction complète Video Subtitle Remover (Video-subtitle-remover, ou VSR en abrégé) est un logiciel de traitement vidéo basé sur la technologie de l'intelligence artificielle, spécialement conçu pour supprimer les sous-titres et les filigranes des vidéos. L'outil utilise une variété de modèles d'algorithmes d'IA (STTN, L...
Il y a 7 mois
03.4K
DiffRhythm(谛韵):10秒内生成最长4分45秒的歌曲

DiffRhythm : génère des chansons d'une durée maximale de 4 minutes et 45 secondes en 10 secondes.

Introduction générale DiffRhythm est un projet open source développé par l'ASLP-lab (Audio, Speech and Language Processing Group, Northwestern Polytechnical University), qui se concentre sur la création musicale de bout en bout grâce à des techniques d'intelligence artificielle. Il est basé sur la méthode Latent Diffu...
il y a 5 mois
03.4K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2) : magie de contrôle de l'éclairage de l'image, contrôle de la lumière, de l'ombre et de l'arrière-plan de l'image

Introduction IC-Light est un projet de contrôle de l'éclairage des images qui vise à manipuler les effets d'éclairage des images à l'aide de modèles d'intelligence artificielle avancés. Développé par Lvmin Zhang et al, le projet fournit deux modèles principaux : un modèle de ré-éclairage conditionnel au texte et un modèle conditionnel à l'arrière-plan. Les utilisateurs peuvent passer...
Il y a 8 mois
03.4K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas : toile collaborative d'édition de code, version open source d'OpenAI Canvas/Claude Artifacts

Introduction générale LangChain présente Open Canvas, une application web open source conçue pour améliorer l'expérience d'édition de documents et de collaboration avec une fonctionnalité de mémoire à double agent intégrée et un smith intégré pour observer tous les détails de l'exécution. La plateforme est alimentée par OpenA...
il y a 5 mois
03.4K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR : Un cadre unifié pour l'implémentation de la réparation de visages vidéo, la réparation de vidéos en noir et blanc, de portraits flous et de vieilles vidéos

Introduction SVFR (Stable Video Face Restoration) est un cadre unifié pour la restauration de visages vidéo qui prend en charge la restauration de base des visages (BFR), la coloration, la réparation et leurs tâches combinées. Le cadre utilise des antécédents génératifs et cinématiques en unifiant...
Il y a 7 mois
03.4K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr : un service tout-en-un qui utilise des modèles visuels pour l'ingestion de documents et le découpage intelligent basé sur la hiérarchie des paragraphes du texte.

Introduction générale Chunkr est une API auto-hébergée dédiée à la conversion de fichiers PDF, PPTX, DOCX et Excel en données utilisables dans RAG (Retrieval Augmented Generation) et LLM (Large Language Modelling). Le projet a été développé par Lumina...
Il y a 8 mois
03.4K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest : Convertir rapidement les dépôts de code Github en texte adapté à la compréhension du LLM

Introduction générale GitIngest est un outil open source conçu pour transformer les dépôts de code GitHub en texte adapté aux indices du Large Language Model (LLM). Avec une simple opération, les utilisateurs peuvent extraire et formater le contenu de n'importe quel dépôt GitHub pour qu'il corresponde au ...
Il y a 8 mois
03.4K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR : Projet open source de super-résolution d'images pour améliorer la qualité de la résolution d'images

Introduction générale InvSR est un projet innovant de super-résolution d'images à code source ouvert basé sur des techniques d'inversion de diffusion capables de convertir des images à faible résolution en images de haute qualité et à haute résolution. Le projet exploite la riche connaissance préalable de l'image intégrée dans les modèles de diffusion à grande échelle pré-entraînés, par le biais d'un mécanisme d'échantillonnage flexible, pour...
Il y a 8 mois
03.4K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown : Outil de conversion intelligent de Microsoft Document pour convertir divers fichiers au format Markdown

Introduction générale MarkItDown est un outil Python développé par Microsoft et conçu pour convertir divers fichiers et documents bureautiques au format Markdown. L'outil prend en charge un large éventail de types de fichiers, notamment PDF, PowerPoint, Word, Excel, diagrammes...
Il y a 8 mois
03.4K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE : une application d'IA iOS open source basée sur des modèles OLMoE fonctionnant hors ligne

Introduction générale Ai2 OLMoE est une application iOS open source développée par l'Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence) pour fournir des modèles d'IA fonctionnant entièrement sur des appareils. L'application s'appuie sur le logiciel open source ol...
Il y a 6 mois
03.4K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis : moteur physique génératif open source pour la simulation de mondes dynamiques 4D basés sur la physique réelle

Introduction générale Genesis est un monde physique génératif conçu pour la robotique générale et l'apprentissage de l'IA incarnée. Il fournit une plate-forme de simulation unifiée qui prend en charge un large éventail de matériaux et de phénomènes physiques. Il fournit une plateforme de simulation unifiée qui prend en charge la simulation d'un large éventail de matériaux et de phénomènes physiques....
Il y a 8 mois
03.4K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js : un plugin open source qui permet de tester l'automatisation des navigateurs grâce à l'IA

Introduction générale Midscene.js est un outil d'automatisation de navigateur alimenté par l'IA qui contrôle les pages web, effectue des assertions et extrait des données par le biais de commandes en langage naturel. Il prend en charge les extensions Chrome, les SDK JavaScript et les scripts YAML, simplifiant ainsi la mesure de l'interface utilisateur...
Il y a 7 mois
03.4K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun : une plateforme open source, sans code, qui explore automatiquement les données web et les convertit en API ou en feuilles de calcul.

Introduction complète Maxun est une plateforme open source d'extraction de données web sans code qui permet aux utilisateurs de former des robots en quelques minutes pour explorer automatiquement les données web et les convertir en API ou en feuilles de calcul. La plateforme prend en charge la pagination et le défilement, s'adapte aux changements de mise en page des sites web, fournit de puissantes...
Il y a 7 mois
03.3K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG : Outil de génération d'augmentation de la recherche paramétrique pour l'amélioration des performances des systèmes de questions-réponses

Introduction PRAG (Parametric Retrieval-Augmented Generation) est un outil innovant de génération augmentée par récupération qui vise à améliorer la génération de connaissances externes en les intégrant directement dans l'espace des paramètres d'un Grand Modèle de Langage (LLM)....
Il y a 6 mois
03.3K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush : Ajouter de l'illumination aux images avec des outils de peinture intelligents

Introduction générale LuminaBrush est un outil interactif innovant d'édition d'images pour les effets de lumière, alimenté par la technologie de l'intelligence artificielle. Le projet utilise un cadre en deux étapes pour traiter les images : la première étape transforme l'image d'entrée en un aspect "uniformément éclairé", tandis que la seconde étape génère...
Il y a 7 mois
03.3K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX : Des personnes numériques intelligentes pour une interaction en temps réel, permettant un déploiement multiplateforme en un seul clic

Introduction générale DUIX (Dialogue User Interface System) est une plateforme d'interaction humaine numérique alimentée par l'IA et créée par Silicon Intelligence. Grâce aux capacités d'interaction humaine numérique open source, les développeurs peuvent facilement intégrer des modèles à grande échelle, la reconnaissance automatique de la parole (ASR)...
Il y a 7 mois
03.3K
ALog:便携AI语音日记应用,支持语音转文字。

ALog : application portable de journal vocal AI avec prise en charge de la synthèse vocale.

Introduction générale ALog est une application de journal vocal basée sur l'IA conçue pour aider les utilisateurs à enregistrer leur vie quotidienne par la voix. Elle est développée par duxins et en libre accès sur GitHub. Les utilisateurs peuvent enregistrer des entrées de journal par saisie vocale, et l'application convertit automatiquement la voix en texte...
Il y a 7 mois
03.3K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent : un cadre basé sur Qwen pour les applications d'agents intelligents, comprenant des appels d'outils, des interprètes de code, des RAG et des extensions Chrome.

Introduction complète Qwen-Agent est un cadre d'application d'agent intelligent développé sur la base de Qwen 2.0 et plus, avec des capacités telles que le suivi des commandes, l'utilisation d'outils, la planification et la mémoire. Le cadre fournit une variété d'exemples d'applications telles que des assistants de navigateur, des interprètes de code et des assistants personnalisés...
Il y a 8 mois
03.3K
Void:基于VSCode的开源Cursor替代品

Void : une alternative au curseur basée sur le code VSCode

Introduction générale Void est une alternative open source à Cursor basée sur une branche du dépôt vscode. Il fournit un environnement de développement puissant conçu pour fournir aux développeurs une expérience de codage plus efficace. L'objectif de Void est d'améliorer continuellement ses fonctionnalités et sa stabilité grâce aux contributions de la communauté et à l'itération rapide...
Il y a 10 mois
03.3K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents : A Multi-Intelligent Body Speech Interaction Application (OpenAI Example)

Introduction générale OpenAI Realtime Agents est un projet open source qui vise à montrer comment l'API temps réel d'OpenAI peut être utilisée pour construire des applications vocales multi-intelligentes. Il fournit un modèle de corps intelligent de haut niveau (emprunté à OpenAI Swarm) qui permet...
Il y a 7 mois
03.3K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR : bibliothèque d'outils d'OCR multilingue basée sur Flying Paddle, prenant en charge la reconnaissance de plus de 80 langues.

Introduction PaddleOCR est une boîte à outils multilingue d'OCR basée sur PaddlePaddle, conçue pour fournir un système d'OCR pratique et ultra-léger. Il prend en charge la reconnaissance de plus de 80 langues et fournit des outils d'annotation et de synthèse des données pour...
Il y a 8 mois
03.3K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI : un cadre d'intelligence artificielle dans lequel vous pouvez saisir des questions pour entraîner un modèle en temps réel et produire les résultats.

Introduction générale TPO-LLM-WebUI est un projet innovant ouvert par Airmomo sur GitHub qui permet l'optimisation en temps réel de grands modèles de langage (LLM) par le biais d'une interface web intuitive. Il utilise TPO (Test-Time Pr...
Il y a 6 mois
03.3K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告

STORM : recherche de données sur le web sur la base de thèmes, génération d'articles avec citations, rapports d'articles longs

Introduction générale STORM est un système d'intégration des connaissances et de génération d'articles développé par l'équipe Oval de l'université de Stanford. Il se concentre sur la génération d'articles exhaustifs de type Wikipédia (articles systématiques) à partir de zéro. Le système utilise des modèles de langage à grande échelle pour la recherche de sujets, la préparation de synopsis et la simulation...
Il y a 4 mois
03.3K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO : un modèle qui supporte les jeux de rôle et les dialogues complexes, avec des performances supérieures à 32b (avec installateur en un clic)

Introduction complète Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 est un modèle de langage efficace conçu pour supporter les jeux de rôles complexes et les dialogues à plusieurs tours. Profondément optimisé sur la base de Qwen 2.5-7B, il dispose d'une excellente...
Il y a 6 mois
03.3K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT : une plateforme de développement low-code pour des applications d'IA générative de niveau entreprise

Introduction BuffGPT est une plateforme open source de développement d'applications d'IA basée sur le Large Language Model (LLM), offrant des fonctionnalités prêtes à l'emploi telles que le traitement des données, l'invocation de modèles, la récupération de RAG et l'orchestration visuelle de flux de travail afin d'aider les utilisateurs à construire et à exploiter facilement des applications d'IA générative. La plateforme prend en charge...
il y a 5 mois
03.3K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2 : Générer et publier automatiquement des vidéos courtes sur YouTube et du contenu sur Twitter

Introduction générale MoneyPrinter V2 est un projet open source développé par FujiwaraChoki pour aider les utilisateurs à gagner de l'argent en ligne grâce à l'automatisation. Le projet intègre principalement l'automatisation de Twitter, la génération de courtes vidéos YouTube et le camping affilié...
Il y a 7 mois
03.3K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy : proxy/renversement du canal Discord Midjourney pour les appels à l'API de cartographie de l'IA (test gratuit)

Introduction complète Midjourney Proxy est un projet open source conçu pour fournir des services proxy pour le canal Discord de Midjourney, en convertissant les fonctions de dessin AI sous forme d'API. Le projet est complètement libre et open source, supportant le changement de visage en un clic, le mélange d'images, la génération de graphes ...
Il y a 8 mois
03.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android : Modélisation multimodale du langage par MNN pour Android

Introduction MNN (Mobile Neural Network) est un cadre d'apprentissage profond efficace et léger développé par Alibaba et optimisé pour les appareils mobiles. MNN est non seulement capable d'inférer rapidement sur les appareils mobiles, mais il prend également en charge les tâches multimodales, y compris la génération de texte...
Il y a 6 mois
03.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam : outil open source d'échange de visages en temps réel par l'IA, une photo pour l'échange de visages en temps réel

Introduction générale Deep Live Cam est un outil d'intelligence artificielle open source conçu pour permettre le remplacement de visages en temps réel et la génération de fausses vidéos à partir d'une seule photo. En utilisant des algorithmes avancés d'apprentissage profond, l'outil est capable de remplacer les visages en temps réel pendant la diffusion en direct ou les appels vidéo, en protégeant la vie privée de l'utilisateur et en ajoutant du plaisir...
Il y a 9 mois
03.3K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw : outil de tableau blanc virtuel dessiné à la main | Organigramme de génération de texte piloté par l'IA | Tutoriels Excalidraw

Excalidraw Description générale Excalidraw est un outil de dessin de tableau blanc virtuel open source qui vous permet de dessiner facilement des diagrammes avec un style dessiné à la main. Vous pouvez utiliser Excalidraw pour créer de magnifiques illustrations, des diagrammes filaires ou n'importe quel...
Il y a 9 mois
03.3K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat : un robot de dialogue intelligent construit sur un grand modèle, prenant en charge l'accès à WeChat et à d'autres plates-formes multidialogues.

Introduction générale Le projet ChatGPT-on-WeChat est un robot de dialogue intelligent basé sur un grand modèle, qui prend en charge l'accès multiplateforme à WeChat personnel, au numéro public WeChat, à l'application WeChat d'entreprise, à Flybook, à Nail, etc. Les utilisateurs peuvent choisir GPT3.5, GPT-4, Claude, Man...
Il y a 8 mois
03.3K
sensitive-word:敏感词过滤工具,高效DFA算法实现

sensitive-word : outil de filtrage des mots sensibles, mise en œuvre efficace de l'algorithme DFA

Introduction complète Sensitive Word Filtering Tool (Sensitive Word) est un outil de filtrage de mots sensibles Java très performant basé sur la mise en œuvre de l'algorithme DFA. L'outil est capable de détecter et de filtrer efficacement les mots sensibles, prend en charge une variété de stratégies de conversion de format et de remplacement personnalisé. Son objectif est de fournir ...
Il y a 11 mois
03.2K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS) : une boîte à outils d'apprentissage profond pour la génération de texte à partir de la parole avec un support multilingue et des capacités de clonage de la voix

Introduction complète Coqui TTS est une boîte à outils open source de génération de synthèse vocale avancée basée sur des techniques d'apprentissage profond. Il a été testé dans des environnements de recherche et de production, et fournit un ensemble riche de fonctionnalités et de modèles qui prennent en charge la conversion texte-parole dans de nombreuses langues.
Il y a 6 mois
03.2K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird : clonage vocal rapide et formation de modèles, synthèse vocale basée sur xtts v2

Introduction complète MockingBird est un projet open source qui vise à réaliser un clonage vocal rapide et une synthèse vocale grâce à la technologie de l'IA. Les utilisateurs n'ont qu'à fournir des échantillons de voix de 5 secondes, vous pouvez générer n'importe quel contenu vocal. Le projet prend en charge une variété d'ensembles de données chinoises, et dans Windows ...
Il y a 8 mois
03.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

L'IA lit les livres : l'IA lit les livres PDF page par page, extrait automatiquement les points clés de la connaissance et génère des résumés.

Introduction AI-reads-books-page-by-page est un outil d'analyse intelligente de livres PDF basé sur Python, qui peut automatiser l'analyse page par page de livres PDF, extraire les points de connaissance clés et, après l'intervalle de page spécifié, générer des...
Il y a 7 mois
03.2K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica : un moteur de recherche IA open-source qui reproduit à l'identique les fonctionnalités et l'interface de Perplexity AI.

Introduction générale Perplexica est un moteur de recherche open source piloté par l'IA et conçu pour fournir des réponses qui plongent dans les profondeurs de l'Internet. Il utilise des algorithmes avancés d'apprentissage automatique, tels que la recherche par similarité et les techniques d'intégration, afin d'optimiser les résultats de la recherche et de fournir des réponses claires avec des sources citées.
Il y a 9 mois
03.2K
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon : un outil de quiz sur les documents multimodaux, simple à déployer et open source

Introduction générale Kotaemon est un outil de Q&A documentaire open source conçu pour fournir aux utilisateurs finaux et aux développeurs des fonctionnalités de Q&A basées sur la Génération Augmentée de Récupération (RAG). Le projet a été développé par Cinnamon et supporte une variété de fournisseurs d'API LLM (par exemple OpenA...
Il y a 11 mois
03.2K
AutoGen:微软开发的多智能体对话框架

AutoGen : un cadre de dialogue corporel multi-intelligent développé par Microsoft

Introduction générale AutoGen est un framework open source développé par une équipe de chercheurs de Microsoft, dont l'objectif est de simplifier la construction d'applications à grand modèle de langage (LLM) par le biais d'un dialogue corporel multi-intelligent. Il permet aux développeurs de créer des agents d'intelligence artificielle capables de dialoguer entre eux et de collaborer pour résoudre des tâches. Cette approche améliore non seulement les performances des LLM...
Il y a 7 mois
03.2K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio : programme open source pour la suppression par lots des arrière-plans d'images et de vidéos, optimisé pour RMBG 2.0

Introduction générale RMBG-2-Studio est une application améliorée de suppression et de remplacement d'arrière-plan développée sur la base du modèle BRIA-RMBG-2.0. L'application est conçue pour fournir aux utilisateurs des capacités de traitement d'arrière-plan d'image efficaces et précises pour une variété de types d'images, y compris le commerce électronique, les jeux et...
Il y a 8 mois
03.2K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro : outil de traduction vidéo multifonctionnel open source, transcription et traduction de la voix en plusieurs langues, installation en un seul clic sous Windows

Introduction générale Voice-Pro est un outil polyvalent basé sur Gradio WebUI qui prend en charge la synthèse vocale, la synthèse vocale, la traduction en temps réel, le téléchargement de vidéos YouTube et la séparation de la voix humaine. Il intègre Whisper, Faster-Wh...
Il y a 9 mois
03.2K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent : utilisation automatisée d'un smartphone à l'aide d'intelligences multimodales

Introduction complète AppAgent est un agent multimodal basé sur le modèle du grand langage (LLM) conçu pour manipuler les applications de smartphones. Le cadre imite les interactions humaines telles que les taps et les swipes à travers un espace de manipulation simplifié, éliminant ainsi le besoin d'un accès au système back-end et étendant son utilisation à travers différentes applications...
Il y a 8 mois
03.2K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer : un assistant IA pour la gestion des connaissances et la recherche documentaire en entreprise, intégrant de multiples outils de travail

Introduction générale Danswer est un assistant IA de recherche documentaire d'entreprise open source conçu pour se connecter aux documents, applications et personnes de l'équipe afin de fournir une recherche unifiée et des réponses aux requêtes en langage naturel par le biais d'une interface de chat intelligente et de capacités de recherche unifiée. En s'assurant que les données des utilisateurs et les chats sont entièrement contrôlés...
il y a 5 mois
03.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus : outil d'IA pour générer des vidéos courtes en un clic, mélange par lots gratuit

Introduction complète MoneyPrinterPlus est un projet open source visant à générer et à mélanger toutes sortes de courtes vidéos en un seul clic grâce à la technologie de l'IA et à les publier automatiquement sur plusieurs plateformes vidéo, telles que Jieyin, Shutterbugs, Xiaohongshu et Video Number. L'outil prend en charge les modèles vocaux locaux et basés sur le...
Il y a 11 mois
03.2K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez : générer des livres audio, convertir des livres électroniques en livres audio avec Kokoro

Introduction générale Audiblez est un projet open source conçu pour convertir les livres électroniques (format .epub) en livres audio (format .m4b). Le projet utilise la technologie de synthèse vocale de haute qualité de Kokoro pour prendre en charge plusieurs langues et plusieurs voix. Les utilisateurs peuvent simplement...
Il y a 7 mois
03.2K
Novel:模仿Notion AI的开源写作编辑器

Novel : un éditeur d'écriture open source qui imite Notion AI

Introduction complète Il s'agit d'un projet open source développé par Steven Tey appelé Novel, c'est un éditeur de texte WYSIWYG de style Notion, intégrant une fonction d'auto-complétion AI qui peut aider les utilisateurs à améliorer l'efficacité de la saisie de texte. Le projet fournit une documentation détaillée et des instructions d'installation...
il y a 1 an
03.2K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB : système de base de connaissances AI Q&A prêt à l'emploi pour un service client intelligent et une base de connaissances interne

Introduction MaxKB (Max Knowledge Base) est un système de questions-réponses de base de connaissances open source basé sur de grands modèles de langage et RAG (Retrieval Augmented Generation). Le système est largement utilisé dans le service client intelligent, la base de connaissances interne de l'entreprise, la recherche universitaire, l'éducation et d'autres scénarios.
Il y a 7 mois
03.2K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow : Un cadre Python pour construire des flux de travail contrôlés et transparents pour les corps intelligents de l'IA

Introduction générale ControlFlow est un framework Python développé par PrefectHQ qui se concentre sur la construction et la gestion de workflows d'IA. Il fournit un cadre structuré, orienté développeur, pour définir des flux de travail et déléguer des tâches à la génération de Grands Modèles de Langage (LLM)...
Il y a 8 mois
03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic : portraits audio pour générer des vidéos parlantes (EchoMimicV2 accelerated installer)

Introduction générale EchoMimic est un projet open source conçu pour générer des animations de portraits réalistes pilotées par l'audio. Développé par la division Terminal Technologies d'Ant Group, le projet utilise des conditions de points de repère modifiables pour générer des vidéos de portraits dynamiques en utilisant une combinaison de points de repère audio et faciaux....
Il y a 7 mois
03.2K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN : Outil interactif d'édition d'images, contrôle de la position de l'image par pointer-cliquer et glisser-déposer.

Introduction générale DragGAN est un outil interactif d'édition d'images basé sur les réseaux adversoriels génératifs (GAN). Il a été présenté par Xingang Pan et al. au SIGGRAPH 2023 et vise à permettre aux utilisateurs de manipuler intuitivement par de simples opérations de pointer-cliquer et de glisser-déposer...
Il y a 8 mois
03.2K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库

DeepFace : une bibliothèque Python légère pour la reconnaissance faciale de l'âge, du sexe, des émotions et de la race

Introduction générale DeepFace est une bibliothèque Python légère pour la reconnaissance faciale et l'analyse des attributs faciaux (y compris l'âge, le sexe, l'émotion et l'ethnicité). Elle intègre plusieurs modèles avancés de reconnaissance faciale tels que VGG-Face, FaceNet, OpenFace, De...
Il y a 7 mois
03.2K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

Hibiki : un modèle de traduction vocale en temps réel, une traduction en continu qui préserve les caractéristiques de la voix originale

Introduction générale Hibiki est un modèle de traduction vocale haute fidélité en temps réel développé par Kyutai Labs. Contrairement aux traducteurs traditionnels hors ligne, Hibiki est capable de générer des traductions vocales naturelles dans la langue cible en temps réel pendant que l'utilisateur parle, ainsi que de fournir des traductions textuelles. Le modèle...
Il y a 6 mois
03.2K