Projet open source sur l'IA

Total 1020 articles
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot : génération d'images en temps réel en tapant des mots (accès gratuit au modèle Flux Schnell)

Description générale BlinkShot est un générateur d'images IA en temps réel open source qui utilise les technologies Together AI et Flux Schnell pour permettre aux utilisateurs de générer des images de haute qualité au fur et à mesure qu'ils saisissent des invites. La plateforme est entièrement gratuite et prend en charge la personnalisation de l'utilisateur...
Il y a 10 mois
03.2K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler : outil de recherche de contenu et de commentaires vidéo sur les plates-formes de médias multisociaux

Introduction générale MediaCrawler est un outil d'exploration du contenu des médias sociaux conçu pour les développeurs. Grâce à sa puissante fonction de crawler, il peut rapidement récupérer des vidéos, des images, des commentaires, des likes, des retweets et d'autres données provenant de plateformes sociales telles que Xiaohongshu, Shake, Shutter, B, Weibo et d'autres...
Il y a 12 mois
03.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus : outil d'IA pour générer des vidéos courtes en un clic, mélange par lots gratuit

Introduction complète MoneyPrinterPlus est un projet open source visant à générer et à mélanger toutes sortes de courtes vidéos en un seul clic grâce à la technologie de l'IA et à les publier automatiquement sur plusieurs plateformes vidéo, telles que Jieyin, Shutterbugs, Xiaohongshu et Video Number. L'outil prend en charge les modèles vocaux locaux et basés sur le...
Il y a 11 mois
03.2K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez : générer des livres audio, convertir des livres électroniques en livres audio avec Kokoro

Introduction générale Audiblez est un projet open source conçu pour convertir les livres électroniques (format .epub) en livres audio (format .m4b). Le projet utilise la technologie de synthèse vocale de haute qualité de Kokoro pour prendre en charge plusieurs langues et plusieurs voix. Les utilisateurs peuvent simplement...
Il y a 7 mois
03.2K
Novel:模仿Notion AI的开源写作编辑器

Novel : un éditeur d'écriture open source qui imite Notion AI

Introduction complète Il s'agit d'un projet open source développé par Steven Tey appelé Novel, c'est un éditeur de texte WYSIWYG de style Notion, intégrant une fonction d'auto-complétion AI qui peut aider les utilisateurs à améliorer l'efficacité de la saisie de texte. Le projet fournit une documentation détaillée et des instructions d'installation...
il y a 1 an
03.2K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice : outil de clonage vocal multilingue, sans échantillon, basé sur xtts_v2 pour Windows.

Description générale Clone Voice est un outil de clonage sonore open source qui fournit une interface web permettant aux utilisateurs de cloner des voix à partir de n'importe quel son ou enregistrement vocal personnel. L'outil est facile à utiliser, même sans GPU NVIDIA, et peut être utilisé avec une application pré-compilée...
Il y a 10 mois
03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic : portraits audio pour générer des vidéos parlantes (EchoMimicV2 accelerated installer)

Introduction générale EchoMimic est un projet open source conçu pour générer des animations de portraits réalistes pilotées par l'audio. Développé par la division Terminal Technologies d'Ant Group, le projet utilise des conditions de points de repère modifiables pour générer des vidéos de portraits dynamiques en utilisant une combinaison de points de repère audio et faciaux....
Il y a 7 mois
03.2K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen : un outil open source pour la génération automatique de graphes de connaissances à partir de texte simple

Introduction générale KGGen est un outil open source développé par le Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), hébergé sur GitHub, conçu pour générer automatiquement des graphes de connaissances à partir d'un texte arbitraire. Il utilise des algorithmes avancés de modélisation du langage et de...
Il y a 6 mois
03.2K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT : un cadre de collaboration multi-intelligence pour la création d'équipes de développement de logiciels d'IA pour la programmation en langage naturel

Introduction complète MetaGPT est un cadre innovant de corps multi-intelligence conçu pour simuler le fonctionnement d'une entreprise complète de logiciels d'IA. Créé par geekan (Alexander Wu), l'objectif du projet est de combiner des modèles GPT avec différents rôles en une entité collaborative...
il y a 5 mois
03.2K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库

DeepFace : une bibliothèque Python légère pour la reconnaissance faciale de l'âge, du sexe, des émotions et de la race

Introduction générale DeepFace est une bibliothèque Python légère pour la reconnaissance faciale et l'analyse des attributs faciaux (y compris l'âge, le sexe, l'émotion et l'ethnicité). Elle intègre plusieurs modèles avancés de reconnaissance faciale tels que VGG-Face, FaceNet, OpenFace, De...
Il y a 7 mois
03.2K
留痕(WeChatMsg):微信聊天记录导出与分析工具

Leave Trace (WeChatMsg) : Outil d'exportation et d'analyse des enregistrements de conversations sur WeChat

Introduction générale WeChatMsg est un projet open source situé sur la plateforme GitHub. L'outil vise à fournir aux utilisateurs de WeChat un moyen d'extraire et d'exporter les chats WeChat dans une variété de documents (HTML, Word, CSV), et à soutenir la génération de rapports annuels de visualisation des données de chat...
il y a 1 an
03.2K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG : Cadre de génération amélioré pour la recherche simplifiée, index de graphe d'entité rappelant les blocs de texte pertinents.

Une introduction complète MiniRAG est un cadre extrêmement simple de Génération Augmentée de Récupération (GAR) qui vise à permettre de bonnes performances de GAR même pour les petits modèles grâce à l'indexation de graphes hétérogènes et à la récupération topologique légère. Il a été développé par le Data Science Laboratory de l'Université de Hong Kong (HKUDS) pour ...
Il y a 7 mois
03.2K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader : logiciel libre de téléchargement de bandes dessinées, supportant les formats PDF, EPUB, CBR, CBZ.

Introduction générale Comics Downloader est un outil open source conçu pour aider les utilisateurs à télécharger des bandes dessinées et des comics à partir de divers sites Web. L'outil prend en charge une variété de formats de fichiers, y compris PDF, EPUB, CBR et CBZ, permettant aux utilisateurs de choisir en fonction de leurs besoins pour s'adapter...
Il y a 8 mois
03.2K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent : Collaboration multi-agents pour l'assistant d'exploitation des appareils mobiles

Introduction générale MobileAgent est un puissant assistant d'utilisation d'appareils mobiles conçu pour améliorer l'efficacité et l'automatisation de l'utilisation des appareils mobiles grâce à une collaboration multi-agents et à des modules de perception visuelle améliorés. Il est développé par l'équipe X-PLUG et supporte Android et ...
Il y a 7 mois
03.2K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker : Faire parler les photos | Audio Synchronisation de la bouche | Vidéo Synchronisation de la bouche synthétisée | Personnes numériques gratuites

Introduction générale SadTalker est un outil open source qui combine une simple photo de portrait avec un fichier audio pour créer des vidéos d'avatars parlants réalistes pour un large éventail de scénarios tels que des messages personnalisés, des contenus éducatifs et bien plus encore. L'utilisation révolutionnaire de technologies de modélisation 3D telles que ExpNet et PoseVA...
Il y a 6 mois
03.2K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI : un client de dialogue intelligent de bureau basé sur l'API Dify, qui fournit des capacités de dialogue IA de niveau entreprise.

Introduction Dify-WebUI est une application moderne de dialogue intelligent de bureau basée sur l'API Dify, conçue pour fournir aux entreprises de puissantes capacités de dialogue IA. L'application prend en charge une variété de couleurs de thème prédéfinies pour répondre aux besoins individuels des entreprises, et dispose d'une fonction de gestion de la base de connaissances...
Il y a 7 mois
03.2K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12 : un outil open source pour la détection de cibles en temps réel dans les images et les vidéos

Introduction complète YOLOv12 est un projet open source développé par l'utilisateur de GitHub sunsmarterjie , qui se concentre sur la technologie de détection de cible en temps réel . Le projet est basé sur la série de frameworks YOLO (You Only Look Once), l'introduction de la note ...
Il y a 6 mois
03.2K
OpenManus:MetaGPT推出的开源版Manus

OpenManus : la version open source de Manus par MetaGPT

Introduction générale OpenManus est un projet open source conçu pour aider les utilisateurs à faire fonctionner des intelligences localement avec des configurations simples pour réaliser diverses idées créatives. Il a été développé par les membres de la communauté MetaGPT @mannaandpoem, @XiangJinyu, @Mos...
il y a 5 mois
03.2K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind : Outil Open Source d'enregistrement et de synthèse de réunions intelligentes reposant sur OpenAI Whisper

Introduction générale MeetingMind est une application d'IA avancée conçue pour améliorer l'efficacité de la capture et du résumé des réunions d'affaires. L'application intègre la technologie Whisper d'OpenAI pour une conversion précise de la parole en texte et utilise IBM Watso...
Il y a 10 mois
03.2K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Watermark Removal:open source image watermark removal tool, picture watermark recovery original image

Introduction générale Watermark Removal est un projet open source qui utilise des techniques d'apprentissage automatique et d'apprentissage profond pour la restauration d'images, en particulier pour supprimer les filigranes des images. Le projet a été développé par Chimzuruoke Okafor et s'inspire de Con...
Il y a 6 mois
03.2K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI : un cadre d'intelligence collaborative multi-rôles pour simplifier les tâches complexes

Introduction CrewAI est un cadre avancé conçu pour orchestrer la collaboration entre les jeux de rôle et les agents d'intelligence artificielle autonomes. En facilitant l'intelligence collaborative, CrewAI permet aux agents de travailler ensemble de manière transparente pour résoudre des tâches complexes. Que vous construisiez une plateforme d'assistants intelligents, que vous automatisiez des équipes de service à la clientèle ou que vous...
Il y a 8 mois
03.2K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT Academic : Meilleur article académique Arxiv Traduction, correction d'erreurs et interprétation de codes

Introduction générale GPT Academic est une plate-forme interactive pour les grands modèles de langage optimisés pour la recherche universitaire. Elle fournit des outils pour des interfaces interactives pragmatiques avec les grands modèles de langage tels que GPT/GLM, spécifiquement optimisés pour la traduction, la lecture, le polissage et la rédaction de documents. Il utilise une conception modulaire...
Il y a 9 mois
03.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit : kit d'outils vocaux pour un déploiement local

Introduction complète Easy-Voice-Toolkit est une boîte à outils multifonctionnelle basée sur l'Open Source Speech Project, fournissant une large gamme d'outils audio automatisés pour la reconnaissance vocale, la transcription vocale, la conversion vocale, la création d'ensembles de données et l'entraînement de modèles. Les utilisateurs peuvent utiliser ces outils de manière sélective en fonction de leurs besoins...
Il y a 11 mois
03.1K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing : un assistant de dialogue vocal open source à faible latence pour la conversation et la communication naturelles

Introduction Bailing (Bailing) est un assistant de dialogue vocal open source conçu pour engager un dialogue naturel avec les utilisateurs par le biais de la parole. Le projet combine les technologies de reconnaissance vocale (ASR), de détection de l'activité vocale (VAD), de modélisation du langage (LLM) et de synthèse vocale (TTS) pour...
Il y a 7 mois
03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel : clone open-source du système d'intégration digital man, déploiement en un clic du client digital man gratuit

Introduction complète AigcPanel est un système de production d'intelligence artificielle pour tous les utilisateurs, développé avec la pile technologique electron+vue3+typescript, supportant le déploiement en un clic sur Windows. Le système est conçu pour être convivial, même...
Il y a 7 mois
03.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo : une plateforme intégrée pour connecter différents cadres d'intelligence artificielle afin de collaborer en temps réel

Introduction générale Mahilo est une plateforme d'intégration multi-intelligence open source, publiée sur GitHub par le développeur Jayesh Sharma, conçue pour aider les utilisateurs à connecter des intelligences IA provenant de différents cadres afin de soutenir la communication en temps réel, l'interaction homme-machine et la collaboration intelligente. Le ...
il y a 5 mois
03.1K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B : un modèle de synthèse vocale à source ouverte pour la génération et le clonage de la parole de haute qualité

Introduction générale Llasa-3B est un modèle de synthèse vocale open source développé par le laboratoire audio de l'université des sciences et technologies de Hong Kong (HKUST Audio). Le modèle est basé sur l'architecture Llama 3.2B, qui a été soigneusement réglée pour fournir une génération de parole de haute qualité qui prend non seulement en charge de multiples...
Il y a 6 mois
03.1K
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit by Ostris : Diffusion stable avec FLUX.1 Model Training Toolkit

Introduction générale AI Toolkit by Ostris est un ensemble d'outils d'IA open source axé sur la prise en charge des modèles Stable Diffusion et FLUX.1 pour les tâches d'entraînement et de génération d'images. La boîte à outils est créée et maintenue par le développeur Ostris, tor...
il y a 5 mois
03.1K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator : générateur de logos open source, utilisant l'intelligence artificielle pour générer des logos de marque professionnels

Introduction générale LogoCreator est un générateur de logos open source basé sur le modèle Together AI et Flux, qui vise à fournir des services de conception de logos rapides et professionnels pour les entreprises et les particuliers. Le projet est développé et open-source par le développeur Nutlope dans Git...
Il y a 8 mois
03.1K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight : rendu d'images de portraits en lumière naturelle (non publié)

Description générale SynthLight est un outil d'éclairage de portraits basé sur un modèle de diffusion. Il apprend à recalculer des images de visages synthétiques pour obtenir des ajustements d'effets d'éclairage sur des photos de portraits réels. L'outil utilise un moteur de rendu physique pour générer des ensembles de données qui simulent des transformations d'éclairage dans différentes conditions d'éclairage...
Il y a 7 mois
03.1K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit : Extraire la structure complexe du contenu PDF de l'outil open-source

Introduction complète PDF-Extract-Kit est un projet open source développé par l'équipe d'OpenDataLab, qui se concentre sur l'extraction efficace de contenu de haute qualité à partir de documents PDF complexes et diversifiés. Il intègre une technologie avancée d'analyse de documents pour prendre en charge la détection de la mise en page, la reconnaissance des formules ...
Il y a 6 mois
03.1K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT : AI Generated PPT, Génération de présentations

Introduction AiPPT est un outil de génération de PPT basé sur la technologie de l'intelligence artificielle, conçu pour aider les utilisateurs à créer rapidement des présentations professionnelles. Il génère automatiquement des diapositives riches en contenu et joliment conçues en saisissant des thèmes, en téléchargeant des fichiers ou en fournissant des URL, etc. Il prend en charge les graphiques natifs, les animations et les...
Il y a 6 mois
03.1K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI : Narration cinématographique et télévisuelle générée par le texte et outil de montage automatisé

Introduction générale NarratoAI est un outil entièrement automatisé qui intègre la narration de films et de vidéos, l'édition automatisée, le doublage et la génération de sous-titres. Il s'appuie sur la technologie de modélisation du langage à grande échelle (LLM) pour générer automatiquement des textes et éditer automatiquement des vidéos avec les voix off et les sous-titres correspondants,...
Il y a 11 mois
03.1K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix : emballage de la base de code dans un fichier texte pour la récupération de modèles de grande taille

Introduction générale Repomix (anciennement connu sous le nom de Repopack) est un outil open source conçu pour empaqueter une base de code entière dans un fichier unique, adapté à l'IA. Cet outil permet aux développeurs de mettre facilement leur base de code à la disposition de grands modèles de langage (tels que Claude, Chat...
Il y a 7 mois
03.1K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE : Transforme les paroles en un modèle de base d'une chanson complète, prenant en charge un large éventail de styles musicaux.

Introduction générale YuE est un modèle de base open source de génération de chansons complètes qui se concentre sur la transformation des paroles en chansons complètes. Contrairement à d'autres modèles qui ne génèrent que de courts extraits de musique non vocale, YuE est capable de générer des chansons complètes avec des voix principales et secondaires d'une durée pouvant atteindre plusieurs minutes. Le modèle aborde la génération de musique en...
Il y a 6 mois
03.1K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking : Système de synchronisation labiale et de montage vidéo piloté par le son

Introduction générale VideoReTalking est un système innovant qui permet à l'utilisateur de générer des vidéos faciales synchronisées avec les lèvres sur la base de l'audio d'entrée, produisant des vidéos de sortie de haute qualité et synchronisées avec les lèvres, même avec des émotions différentes. Le système décompose cet objectif en trois tâches consécutives : avec des expressions typiques...
Il y a 8 mois
03.1K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard : un cadre open source pour l'optimisation des projets de messages-guides afin d'améliorer la performance des tâches

Introduction complète PromptWizard est un framework open source développé par Microsoft qui utilise un mécanisme auto-évolutif permettant au modèle de générer, d'évaluer et d'améliorer les mots d'incitation et de générer des exemples de manière autonome, en améliorant la qualité du résultat grâce à un retour d'information continu. Il peut optimiser de manière autonome les mots d'incitation, générer et sélectionner des exemples appropriés et...
Il y a 8 mois
03.1K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB : Création de Smart Tables sur plusieurs bases de données, alternative Open Source à Airtable

Introduction générale NocoDB est une alternative open source à Airtable conçue pour fournir un outil de gestion de base de données en ligne puissant et facile à utiliser. Avec NocoDB, les utilisateurs peuvent facilement créer, lire, mettre à jour et supprimer des données de bases de données sans écrire de code. La plateforme prend en charge ...
Il y a 10 mois
03.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1 : une version open source du modèle OpenAI o1 basé sur Qwen2-7B-Instruire un réglage fin pour explorer des modèles d'inférence ouverts pour résoudre des problèmes complexes

Introduction Marco-o1 est un modèle de raisonnement ouvert développé par Alibaba International Digital Commerce Group (AIDC-AI) pour résoudre des problèmes complexes du monde réel. Le modèle combine le réglage fin de la chaîne de pensée (CoT), la recherche arborescente de Monte Carlo (MCTS) et des stratégies de raisonnement innovantes...
Il y a 8 mois
03.1K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI : un assistant de codage de l'IA en ligne de commande de terminal lancé par OpenAI

Introduction générale OpenAI Codex CLI est un outil de codage de terminal open source, développé par OpenAI, conçu pour les développeurs habitués aux terminaux. Il génère du code, édite des fichiers, exécute des commandes et intègre le contrôle de version Git par le biais de commandes en langage naturel.Cod...
Il y a 4 mois
03.1K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen : plateforme open source de production de cours sur l'homme numérique, clonage en un seul clic de vidéos de cours sur l'homme numérique (PPT)

Introduction Easegen est une plateforme open source de création de cours humains numériques qui vise à améliorer l'efficacité de la production et de la gestion du contenu pédagogique grâce à la technologie de l'intelligence artificielle. La plateforme fournit une solution unique allant de la production de cours à la gestion vidéo en passant par l'interrogation intelligente, ce qui permet aux utilisateurs de créer des cours vidéo numériques expliqués par l'homme...
Il y a 10 mois
03.1K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama : application locale de chat en temps réel basée sur Nuxt 3 et Ollama

Introduction ChatOllama est un projet d'application de chat en ligne open source basé sur un modèle de langue à grande échelle (LLM), prenant en charge de nombreux modèles de langue et la gestion d'une base de connaissances. Les utilisateurs peuvent utiliser la plateforme pour la gestion des modèles (affichage de la liste, téléchargement, suppression), le chat avec les modèles et d'autres fonctions. Le projet utilise ...
Il y a 10 mois
03.1K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle : outil d'IA permettant d'ajouter des gribouillis artistiques à des photos à l'aide de commandes textuelles

Introduction générale PhotoDoodle est un outil d'édition d'images open source, développé par ShowLab, qui se concentre sur l'édition artistique de photos grâce à la technologie de l'intelligence artificielle. Les utilisateurs peuvent ajouter un style de dessin animé, un effet 3D, de la lumière à des photos réelles en tapant simplement du texte...
il y a 5 mois
03.1K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI : un assistant IA hors ligne fonctionnant dans votre téléphone, adapté à DeepSeek-R1 (5.37GB)

Introduction générale Pocket AI (PocketPal AI version chinoise) est un puissant assistant d'intelligence artificielle hors ligne conçu pour permettre aux utilisateurs de parler à l'intelligence artificielle à tout moment et en tout lieu. Il est basé sur les petits modèles linguistiques (SLM) et fonctionne sur les téléphones portables sans connexion internet, spécialement adapté à l'expérience des utilisateurs chinois. Mouth...
Il y a 6 mois
03.1K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab : modèle d'IA dédié à la reconnaissance OCR, PDF to Markdown (open source/API)

Introduction complète Datalab propose une gamme de modèles d'IA avancés axés sur l'OCR, l'analyse de la mise en page, la conversion de PDF en Markdown et bien plus encore. Ces modèles sont non seulement très performants, mais aussi faciles à utiliser et open source. Les modèles Marker de la plateforme peuvent rapidement et précisément...
Il y a 9 mois
03.1K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式

CoAI.Dev (Chat Nio) : solution unique de B/C pour les applications d'agrégation d'IA avec une facturation flexible et la prise en charge d'un modèle de plan d'abonnement

Introduction générale CoAI.Dev (anciennement Chat Nio) est une plateforme de chat qui intègre plusieurs modèles d'IA et prend en charge le streaming distribué, la génération d'images, la synchronisation et le partage des conversations entre appareils. Elle met en œuvre un système d'abonnement et de facturation par jeton, un service de...
Il y a 9 mois
03.1K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat : client de dialogue IA qui prend en charge les sessions simultanées avec plusieurs chats

Introduction générale DeepChat est un projet d'assistant intelligent open source développé par l'équipe ThinkInAIXYZ sur GitHub. Il vise à connecter les utilisateurs avec le monde numérique grâce à une puissante technologie d'IA afin de fournir une expérience de chat efficace et naturelle. Il prend en charge Win...
il y a 5 mois
03.1K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S. : Assistant de code intelligent tenant compte du contexte, générateur et modificateur de code, support multi-IDE

Introduction générale J.A.R.V.I.S. (Just A Rather Very Intelligent System) est un assistant de code intelligent conçu pour aider les développeurs dans la génération de code, la modification et les discussions techniques en utilisant plusieurs modèles de langage de pointe....
Il y a 7 mois
03.1K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx) : projet open source qui imite Perplexity, intégrant un dialogue avec l'IA, une recherche sur le web, une interrogation sur la météo, etc.

Introduction générale MiniPerplx (renommé Scira) est un moteur de recherche minimaliste piloté par l'IA qui intègre une variété de fonctionnalités utiles pour fournir aux utilisateurs une gamme complète de services de recherche d'informations. Le projet utilise une pile technologique moderne comprenant Next.js, Tailwi...
Il y a 7 mois
03.1K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML : Concevoir facilement des emails réactifs, générer rapidement des emails marketing avec ChatGPT

Introduction générale MJML (Mail Junction Markup Language) est un framework open source développé par l'équipe Mailjet pour simplifier la création de modèles d'emails réactifs. Grâce au langage de balisage sémantique et à une riche bibliothèque de composants, les développeurs peuvent utiliser moins de code pour créer ...
Il y a 12 mois
03.1K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X : une boîte à outils pour la construction rapide d'interfaces de chat IA avec un support pour l'intégration de modèles et la gestion de flux de données.

Introduction complète Ant Design X est une boîte à outils ouverte à tous par Ant Group, conçue pour aider les développeurs à construire rapidement des interfaces de dialogue pilotées par l'IA. Il fournit un riche ensemble de composants et de modèles, prend en charge l'intégration de modèles compatibles avec les normes OpenAI, et convient à une variété d'applications telles que le service client intelligent, les assistants IA et d'autres...
Il y a 9 mois
03.1K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop : Application Intelligentsia de bureau pour contrôler les ordinateurs à l'aide du langage naturel

Introduction générale UI-TARS Desktop est une application d'agent d'interface graphique basée sur UI-TARS (Visual Language Model) développée par ByteDance. L'application permet aux utilisateurs de contrôler les ordinateurs par le biais du langage naturel pour une interaction homme-machine plus intuitive et plus efficace....
Il y a 7 mois
03.1K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin : une interface graphique Web pour interagir avec tous les modèles et API de l'OpenAI

Introduction générale Ortlin est une interface utilisateur graphique basée sur le web, conçue pour aider toute personne, technique ou non, à interagir facilement avec les API et les modèles sous-jacents de l'OpenAI. Il est entièrement gratuit et open source, ce qui permet aux utilisateurs de tirer parti de l'OpenAI en toute simplicité...
Il y a 10 mois
03.1K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

Conversion vocale basée sur la recherche WebUI : un cadre pour la conversion vocale basée sur la recherche simulant les voix de chant de la vie réelle

Introduction complète Conversion vocale basée sur l'extraction WebUI est un cadre de conversion vocale basé sur VITS, facile à utiliser, qui permet la conversion vocale entre n'importe quels locuteurs, y compris les reprises de chansons et les changements de voix en temps réel. Il a une faible ...
Il y a 10 mois
03.1K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX : conversion sans perte de PDF en HTML, en conservant le formatage du texte, adapté aux travaux universitaires et à la composition de magazines.

Introduction pdf2htmlEX est un outil open source conçu pour convertir les fichiers PDF au format HTML , en analysant le contenu du fichier PDF et en utilisant HTML + CSS pour restaurer avec précision son effet visuel , le document PDF sera converti en un navigateur ....
Il y a 9 mois
03.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku : génère des vidéos détaillées et cohérentes, idéales pour créer des publicités avec des personnages et des objets détaillés.

Introduction complète Goku est un modèle fédéré de génération d'images et de vidéos basé sur des techniques de transformation de flux conçues pour atteindre des performances de niveau industriel. Il intègre des techniques avancées de génération visuelle de haute qualité, y compris le regroupement de données à grain fin, la conception du modèle et la formulation de la transformation de flux....
Il y a 6 mois
03.1K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm : un cadre pour la collaboration entre clusters multi-intelligents

Quantum Swarm est un cadre d'intelligence artificielle open source axé sur le développement et la recherche de l'intelligence des populations d'IA. Le projet est maintenu par l'équipe Quarm AI sur GitHub et vise à fournir une plateforme flexible et efficace pour construire et tester des systèmes multi-intelligence.Quan...
Il y a 7 mois
03.1K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor : surveiller les activités des utilisateurs d'OpenWebUI, gérer les limites d'utilisation, supporter le déploiement en un clic.

Introduction générale OpenWebUI-Monitor est un tableau de bord permettant de surveiller les activités des utilisateurs d'OpenWebUI et de gérer les quotas d'utilisation. Il vous permet de définir efficacement les quotas d'utilisation, de visualiser les données des utilisateurs et les informations visuelles en temps réel, et supporte le déploiement en un clic pour faciliter la gestion et la surveillance des...
Il y a 9 mois
03.1K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk : générez des vidéos parlantes expressives avec une seule image d'avatar !

DreamTalk Introduction complète DreamTalk est un cadre de génération de têtes parlantes basé sur un modèle de diffusion et développé conjointement par l'université de Tsinghua, le groupe Alibaba et l'université des sciences et technologies de Huazhong. Il se compose principalement de trois parties : un réseau de réduction du bruit, un expert en lèvres conscient du style et un prédicteur de style, qui peut être basé sur...
Il y a 8 mois
03.1K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox : PDF, DOCX, conversion d'images en Markdown, modèle visuel OCR de haute précision

Introduction générale Zerox est un projet open source conçu pour convertir des documents PDF, DOCX, des images et d'autres documents au format Markdown par le biais de modèles visuels. Le projet est développé par l'équipe getomni-ai et fournit une solution OCR (Optical Character Recognition) simple et efficace....
Il y a 7 mois
03K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana : génération rapide d'images à haute résolution, modèle de très petite taille (0,6B), fonctionnement du GPU d'un ordinateur portable à profil bas.

Introduction générale Sana est un cadre efficace de génération d'images haute résolution développé par NVIDIA Labs, capable de générer des images d'une résolution allant jusqu'à 4096 × 4096 en quelques secondes....
Il y a 9 mois
03K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API d'extraction de texte (text-extract-api) : extraction visuelle d'informations textuelles, outil d'extraction de PDF anonymes

Introduction complète L'API d'extraction de texte (text-extract-api) est un outil puissant conçu pour extraire et analyser le contenu d'une variété de formats de documents (par exemple PDF, Word, PPTX, etc.). L'API utilise la technologie de pointe de la reconnaissance optique de caractères (OCR) et Ol...
Il y a 7 mois
03K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat : une plateforme de chat open source pour interagir avec des personnages d'IA personnalisés

Introduction générale Agnai Chat est une plateforme de chat IA open source qui permet aux utilisateurs de créer des personnages IA personnalisés pour une interaction à un ou plusieurs joueurs. Elle prend en charge un large éventail de services d'IA, notamment OpenAI, Claude, Kobold, etc., et convient au divertissement, aux jeux de rôle, à l'éducation ou...
Il y a 4 mois
03K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator : capturer automatiquement des informations pour générer des podcasts audio

Introduction générale AI Podcast Generator est un outil intelligent de génération de podcasts qui utilise une technologie d'intelligence artificielle avancée pour créer automatiquement un contenu audio attrayant à partir de sources Web. Le système génère des récits naturels en capturant des informations et en les convertissant en podcasts audio. Le projet est basé sur le projet Next...
Il y a 9 mois
03K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2 : un modèle expert de langage visuel pour une compréhension multimodale avancée

Introduction complète DeepSeek-VL2 est une série de modèles avancés de langage visuel avec mélange d'experts (MoE) qui améliorent de manière significative les performances de son prédécesseur, DeepSeek-VL. Les modèles sont utiles pour les questions-réponses visuelles, la reconnaissance...
Il y a 6 mois
03K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE) : cadre de génération de gestes du corps entier, cadre d'animation 3D pour générer des gestes du corps entier à partir de l'audio

Introduction complète PantoMatrix est un cadre avancé de génération de gestes du corps entier capable de générer des mouvements humains complets à partir de gestes audio et partiels, y compris des mouvements du visage, du corps partiel, de la main et du corps entier. Le cadre utilise les derniers ensembles de données multimodales et les techniques d'apprentissage profond pour fournir des...
Il y a 9 mois
03K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent : un cadre pour la création et le déploiement rapides d'intelligences IA par le biais du langage naturel

Introduction générale AutoAgent est un framework d'intelligence artificielle open source développé par le Data Intelligence Laboratory de l'Université de Hong Kong (HKUDS) et hébergé sur GitHub. Il permet aux utilisateurs de créer et de déployer rapidement des intelligences artificielles personnalisées en décrivant leurs besoins en langage purement naturel, sans aucune base de programmation....
Il y a 2 mois
03K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait : Outil d'animation pour générer des portraits dynamiques à partir d'images fixes et de vidéos

Introduction générale LivePortrait est un outil avancé d'animation de portraits dynamiques développé par Racer Technology. Il utilise une technologie d'IA innovante pour transformer des images fixes en animations vidéo vivantes. Que vous utilisiez des photos réelles, des styles d'animation ou des portraits artistiques, LivePo...
Il y a 9 mois
03K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI : Assistant conversationnel d'analyse de données avec accès direct aux réponses, aux requêtes SQL et aux rapports d'analyse

Introduction générale WrenAI est un assistant SQL AI open source conçu spécifiquement pour aider les équipes de données, les équipes de produits et les équipes commerciales à obtenir des informations sur les données par le biais d'un dialogue en langage naturel. Il est capable de convertir le langage naturel en requêtes SQL, de générer des graphiques, des feuilles de calcul et des rapports, de...
Il y a 7 mois
03K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan : outil de synthèse vocale multilingue rapide et contrôlable (plus de 7000 langues prises en charge)

Introduction générale IMS Toucan est une boîte à outils de synthèse vocale de pointe développée par l'Institut de traitement du langage naturel (IMS) de l'Université de Stuttgart, en Allemagne. Cette boîte à outils prend en charge plus de 7 000 langues. Elle est rapide, contrôlable et peu gourmande en ressources informatiques....
Il y a 6 mois
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing : Outil intelligent de doublage/traduction multilingue de vidéos par l'IA

Introduction complète Linly-Dubbing est un outil de doublage et de traduction multilingue intelligent conçu pour fournir aux utilisateurs des services de doublage vidéo et de traduction de sous-titres multilingues de haute qualité grâce à l'intégration d'une technologie d'intelligence artificielle avancée. Cet outil est particulièrement adapté à l'éducation internationale, à la localisation de contenu global et à d'autres scénarios, aidant...
Il y a 7 mois
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic : Extraction d'informations structurées pour les tableaux complexes

L'objectif de la reconnaissance de tableaux est d'analyser les tableaux dans les images, d'identifier avec précision les structures des tableaux et l'emplacement des cellules, et de les réduire à des formats de tableaux structurés (par exemple, HTML). À l'ère de l'information, un grand nombre de données tabulaires importantes existent encore à l'état non structuré (par exemple, des documents scannés avec des images de tableaux statistiques...).
il y a 5 mois
03K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator : une application de traduction vocale en temps réel pour Android, gratuite et hors ligne !

Introduction générale RTranslator est une application de traduction en temps réel hors ligne, gratuite et virtuellement open source, conçue pour les appareils Android. Les utilisateurs peuvent garder leur téléphone dans leur poche en connectant un casque Bluetooth et avoir une conversation avec d'autres personnes comme s'ils parlaient leur propre langue.RTransla...
Il y a 7 mois
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine : Prédire la probabilité d'événements futurs sur la base de la connaissance de la recherche

Introduction générale Forecast AI est une superbe plateforme de prévision basée sur une technologie avancée d'intelligence artificielle. Elle utilise de puissants algorithmes d'analyse de données et d'apprentissage automatique pour fournir aux utilisateurs des prédictions très précises sur les événements futurs. Qu'il s'agisse d'élections politiques, de tendances économiques ou d'événements sociaux, Forecast ...
Il y a 11 mois
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData : construire des intelligences IA avec de la mémoire, des connaissances et des outils

Introduction complète PhiData est un framework conçu pour développer des assistants intelligents. Il permet aux assistants intelligents d'engager des conversations à long terme, de fournir un contexte commercial précis et d'effectuer diverses opérations grâce à une mémoire améliorée, à l'intégration des connaissances et à des capacités d'invocation d'outils.
il y a 5 mois
03K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

Micro agent : intelligence de programmation IA qui génère automatiquement du code, le teste et le corrige.

Introduction générale Micro-Agent est un assistant de codage IA open source développé par Builder.io, conçu pour fournir aux développeurs la possibilité de générer et de tester automatiquement du code. Il génère des cas de test en comprenant les descriptions en langage naturel et itère le code jusqu'à ce que tous les tests soient réussis, réduisant ainsi les...
Il y a 7 mois
03K
Xorbits Inference:一键部署多种AI模型,分布式推理框架

Xorbits Inference : déploiement en un clic de plusieurs modèles d'IA, un cadre d'inférence distribué

Introduction complète Xorbits Inference (Xinference) est un cadre d'inférence distribué puissant et complet qui prend en charge l'inférence pour une large gamme de modèles d'intelligence artificielle tels que les grands modèles de langage (LLM), les modèles de reconnaissance vocale et les modèles multimodaux. Avec Xorbits I...
Il y a 11 mois
03K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily : un assistant IA pour générer des comptes rendus de réunions, transcrire et générer des résumés de réunions en temps réel.

Description générale Meetily est un assistant de réunion doté d'une intelligence artificielle, développé par Zackriya Solutions, qui capture l'audio des réunions en temps réel, effectue la transcription vocale et génère des résumés de réunion. Il est unique en ce sens que tout le traitement est effectué localement sur l'appareil, ce qui garantit la confidentialité de l'utilisateur...
Il y a 6 mois
03K