Projet open source sur l'IA

Total 1020 articles
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本

IOPaint : outil polyvalent de traitement d'images AI, permettant d'effacer, de développer, de remplacer des éléments et de dessiner du texte.

Introduction générale IOPaint est un outil de traitement d'images IA gratuit et open source qui permet d'effacer, de réparer et d'agrandir les images. Il utilise des modèles d'IA de pointe pour aider les utilisateurs à supprimer facilement les objets indésirables des images, à réparer les défauts, à ajouter un nouveau contenu et même à agrandir les images.IOPa...
Il y a 10 mois
011.2K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research : Collaboration multi-agents pour effectuer des recherches documentaires et générer des rapports de recherche

Introduction générale Auto-Deep-Research est un outil d'IA open-source développé par le Data Intelligence Laboratory de l'Université de Hong Kong (HKUDS), qui vise à aider les utilisateurs à automatiser les tâches de recherche approfondie. Il est construit sur le cadre AutoAgent et prend en charge de nombreux modèles de langage...
Il y a 4 mois
04.6K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent : intelligences interactives automatisées des médias sociaux qui recherchent, aiment et laissent des messages automatiquement.

Introduction générale Riona-AI-Agent est un outil d'automatisation innovant alimenté par l'IA et spécialement conçu pour gérer et optimiser les opérations des principales plateformes de médias sociaux. Le projet utilise des modèles d'IA avancés pour des plateformes telles qu'Instagram, Twitter et GitHub afin de fournir...
Il y a 6 mois
04.1K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio : client de bureau pour les assistants d'intelligence artificielle avec des modèles API/Web/locaux intégrés

Introduction générale Cherry Studio est un client de bureau qui prend en charge une large gamme de services LLM (Large Language Model) et qui est compatible avec les systèmes Windows, Mac et Linux. Il offre une multitude d'options de personnalisation et de fonctionnalités de pointe conçues pour aider les utilisateurs dans un grand nombre de domaines...
Il y a 6 mois
04.1K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作

FaceFusion : Outil d'amélioration de l'échange de visages sur vidéo | Synchronisation de la voix Mouvements de la bouche sur vidéo

Description générale FaceFusion est une plateforme cloud de pointe avec des capacités intégrées d'échange et d'amélioration du visage qui optimise le processus d'échange d'image à vidéo et d'image à image avec 5 modèles professionnels pour garantir un résultat sans faille. Elle optimise le processus d'échange d'image à vidéo et d'image à image avec 5 modèles professionnels pour garantir un résultat sans faille. En outre, elle améliore le visage avec 7 modèles en utilisant 3...
Il y a 6 mois
04.1K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice : projet open source de clonage de voix en 3 secondes lancé par Ali, avec prise en charge des étiquettes contrôlées par les émotions

Introduction CosyVoice est un modèle de génération de parole multilingue à grande échelle qui offre des capacités complètes, de l'inférence au déploiement en passant par l'entraînement. Développé par l'équipe FunAudioLLM, il vise à obtenir une parole de haute qualité grâce à des transformateurs autorégressifs avancés et des modèles de diffusion basés sur l'EDO...
Il y a 6 mois
03.9K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands : Assistant agent multi-intelligent piloté par l'IA pour le développement de logiciels, couvrant tous les types d'opérations des développeurs

Introduction générale OpenHands est un projet open source développé par l'équipe All-Hands-AI pour rationaliser le processus de développement de logiciels grâce à la technologie de l'IA. Anciennement connue sous le nom d'OpenDevin et maintenant rebaptisée OpenHands, la plateforme...
Il y a 7 mois
03.4K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO : Exécution de grappes d'IA distribuées à l'aide d'appareils domestiques inactifs, prise en charge de plusieurs moteurs d'inférence et découverte automatisée d'appareils.

Introduction générale Exo est un projet open source conçu pour faire fonctionner son propre cluster d'IA en utilisant des appareils de tous les jours (par exemple iPhone, iPad, Android, Mac, Linux, etc.). Grâce au partitionnement dynamique des modèles et à la découverte automatisée des appareils, Exo est capable d'unifier plusieurs appareils en un...
Il y a 8 mois
03.4K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt : téléchargeur universel de vidéos, YouTube, Vimeo, Twitter, Reddit, SoundCloud et plus encore !

Introduction générale Il m'arrive souvent de devoir télécharger des vidéos de YouTube et de Twitter, c'est pourquoi j'ai trouvé ce téléchargeur vidéo gratuit et sans publicité.Cobalt est un téléchargeur de médias open source conçu pour offrir une expérience de téléchargement conviviale. Il permet de télécharger du contenu vidéo et audio à partir de plusieurs plateformes, y compris...
Il y a 8 mois
03.3K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Analyseur vidéo : analyse le contenu des vidéos et génère des descriptions détaillées

Comprehensive Introduction Video Analyzer est un outil d'analyse vidéo complet qui combine des techniques de vision par ordinateur, de transcription audio et de traitement du langage naturel pour générer des descriptions détaillées du contenu vidéo. L'outil transcrit le contenu audio en extrayant les images clés de la vidéo...
Il y a 6 mois
03.3K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk : Cadre complet de génération de vidéos humaines numériques - du portrait à la vidéo - de la pose à la vidéo - de la synchronisation labiale

Introduction générale MuseV est un projet public sur GitHub visant à générer des vidéos d'avatars de longueur illimitée et de haute fidélité. Il est basé sur la technologie de diffusion et fournit Image2Video, Text2Image2Video, Video2Video...
Il y a 8 mois
03.3K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist : plugin d'assistant web pour le dialogue avec un modèle d'IA natif et l'extraction de documents

Introduction générale Page Assist est une extension de navigateur open source conçue pour fournir aux utilisateurs un moyen facile d'interagir avec des modèles d'IA locaux. Avec cette extension, les utilisateurs peuvent ouvrir une barre latérale sur n'importe quelle page web pour interagir avec des modèles d'IA locaux....
Il y a 4 mois
03.3K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee : un cadre RAG open source pour la construction de graphes de connaissances, l'apprentissage de prompts de base

Introduction générale Cognee est une solution de couche de données fiable conçue pour les applications et les agents d'intelligence artificielle. Conçu pour charger et construire des contextes LLM (Large Language Models) afin de créer des solutions d'IA précises et interprétables par le biais de graphes de connaissances et de magasins de vecteurs. Le cadre favorise la réduction des coûts, l'interprétation...
Il y a 7 mois
03.3K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify : plateforme de développement d'applications d'IA générative, orchestration visuelle, support de déploiement privé.

Introduction complète Dify est une plateforme open source de développement d'applications d'IA générative conçue pour aider les développeurs à créer et à exploiter rapidement des applications d'IA natives basées sur de grands modèles de langage (LLM). La plateforme fournit tout, de la construction d'agents à l'orchestration de flux de travail d'IA, en passant par l'extraction de RAG...
Il y a 7 mois
03.3K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram : Visualisez la structure de votre base de code GitHub et transformez votre dépôt de code en un diagramme d'architecture de système interactif.

Introduction générale GitDiagram est un outil innovant de visualisation de la base de code GitHub qui transforme rapidement n'importe quel dépôt GitHub en un diagramme interactif de l'architecture du système. Il utilise une technologie d'IA avancée (Claude 3.5 Sonnet) pour fournir aux développeurs...
Il y a 7 mois
03.2K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue : un assistant de code IA open source qui s'intègre à VS Code et personnalise les modèles et l'intégration.

Introduction générale Continue est un assistant de code IA open source conçu pour améliorer l'efficacité des développeurs de logiciels. Ses principales fonctionnalités comprennent l'autocomplétion de code, l'optimisation de code et des suggestions de code intelligentes pour VS Code et JetBrains IDE....
Il y a 6 mois
03.1K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR : Extraction de texte à partir d'images à l'aide de modèles visuels dans Ollama

Introduction Ollama OCR est une puissante boîte à outils de reconnaissance optique de caractères (OCR) qui utilise le modèle de langage visuel de pointe fourni par la plate-forme Ollama pour extraire du texte à partir d'images. Le projet est disponible sous la forme d'un paquetage Python et fournit des...
Il y a 7 mois
03.1K
Wav2Lip:开源高精度口型同步生成工具(推荐)

Wav2Lip : outil open source de génération de synchronisation labiale de haute précision (recommandé)

Introduction générale Wav2Lip est un outil open-source de génération de synchronisation labiale de haute précision conçu pour synchroniser avec précision un fichier audio arbitraire avec la synchronisation labiale d'une vidéo. L'outil a été développé par Rudrabha Mukhopadhyay et al. dans ACM Multimedia 20...
Il y a 7 mois
03.1K
Smolagents : projet open source pour le développement rapide d'intelligences IA et la construction légère d'intelligences

Smolagents : projet open source pour le développement rapide d'intelligences IA et la construction légère d'intelligences

Introduction complète Smolagents est une bibliothèque d'agents intelligents légère développée par HuggingFace qui se concentre sur la simplification du processus de développement des systèmes d'agents d'intelligence artificielle. Le projet est connu pour la simplicité de sa philosophie de conception, avec seulement environ 1000 lignes de code de base, tout en offrant de puissantes capacités d'intégration de fonctionnalités. Il est le plus ...
Il y a 7 mois
03.1K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI : un cadre open source pour l'exécution d'intelligences IA pour naviguer sur le web, permettant à l'IA de manipuler automatiquement les pages web.

Introduction générale Browser Use Web UI est un projet open source innovant visant à fournir aux agents d'intelligence artificielle des capacités d'interaction avec le navigateur en tant qu'outil d'interface graphique. Le projet s'appuie sur le framework browser-use core, construit avec Gradio ...
Il y a 2 mois
03.1K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate : outil de traduction IA qui préserve la typographie complète des PDF

Introduction complète PDFMathTranslate est un outil open source axé sur la traduction de documents scientifiques. Les documents PDF peuvent être traduits dans leur intégralité et générer une version bilingue. Il utilise la technologie de l'IA pour conserver la mise en page originale du document, y compris les formules, les diagrammes, les tables des matières et les notes, ...
Il y a 2 mois
03.1K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本

Réinitialisation du curseur : script permettant de réinitialiser l'identifiant du dispositif pour les versions 0.45.x et supérieures du curseur.

Description générale Cursor Reset est un outil de script PowerShell pour réinitialiser les identifiants de périphériques dans l'IDE Cursor, supportant la version 0.45.x de Cursor. L'outil est conçu pour aider les utilisateurs à réinitialiser les identifiants de périphériques dans l'IDE Cursor...
Il y a 6 mois
03.1K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip : outil de synchronisation labiale vidéo de haute qualité, optimisé pour Wav2Lip

Introduction générale Easy-Wav2Lip est un outil amélioré basé sur Wav2Lip conçu pour simplifier le processus de synchronisation labiale des vidéos. L'outil offre une configuration et une implémentation plus simples avec un support pour Google Colab et une installation locale. En optimisant l'algorithme, Ea...
Il y a 8 mois
03.1K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI : Un cadre de travail Low-Code Multi-Intelligent Body pour simplifier les solutions d'automatisation des tâches complexes

Introduction complète PraisonAI est un framework multi-intelligence prêt à l'emploi pour les environnements de production, conçu pour créer des intelligences IA afin d'automatiser et de résoudre des problèmes allant de tâches simples à des défis complexes. Le framework fournit une solution low-code qui simplifie la construction de systèmes LLM à corps multi-intelligents et...
Il y a 6 mois
03K
XHS-Downloader:免费小红书数据采集工具,支持笔记批量下载、视频提取、图片去水印

XHS-Downloader : outil gratuit de collecte de données Xiaohongshu, supportant le téléchargement par lots de notes, l'extraction de vidéos, le tatouage d'images.

Introduction générale XHS-Downloader est un outil open source conçu pour les utilisateurs de Xiaohongshu afin de faciliter l'extraction et le téléchargement d'images et de vidéos sans filigrane sur Xiaohongshu. L'outil offre une variété de fonctionnalités, y compris la récupération des cookies des navigateurs, la prise en charge des opérations en ligne de commande, le téléchargement par lots...
Il y a 12 mois
03K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

HeyGem : le produit open source Heygen Digital Human Pincushion de Silicon Intelligence

Introduction générale HeyGem est un outil de composition vidéo entièrement hors ligne conçu pour les systèmes Windows, développé par l'équipe GuijiAI (Silicon Intelligence) et ouvert sur GitHub. Il utilise des algorithmes d'intelligence artificielle avancés pour cloner avec précision l'apparence et la voix de l'utilisateur...
Il y a 2 mois
03K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型

Kolors Virtual Try On : Essais virtuels efficaces et habillage des mannequins, modèles générant du texte à l'image

Introduction générale Kolors Virtual Try-On est une application d'essayage virtuel créée par l'équipe de Kwai-Kolors sur la plateforme Hugging Face. L'application utilise une technologie avancée d'intelligence artificielle pour aider les utilisateurs à...
Il y a 8 mois
03K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use : construction d'outils d'automatisation Web intelligents pour que les intelligents IA puissent facilement utiliser les navigateurs

Introduction complète Browser-Use est un outil d'automatisation web open source innovant spécialement conçu pour permettre aux modèles de langage (LLM) d'interagir naturellement avec les sites web. Il fournit un cadre puissant et flexible qui prend en charge une large gamme de modèles de langage courants, y compris GPT-4, Claud...
Il y a 8 mois
03K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR : boîte à outils de reconnaissance vocale open source, séparation du locuteur / reconnaissance vocale de dialogues multi-personnes

Introduction complète FunASR est une boîte à outils de reconnaissance vocale open-source développée par l'Alibaba Dharmo Academy pour faire le lien entre la recherche académique et les applications industrielles. Il prend en charge un large éventail de fonctions de reconnaissance vocale, notamment la reconnaissance de la parole (ASR), la détection des terminaisons vocales (VAD), la récupération de la ponctuation, la modélisation de la langue, la...
Il y a 10 mois
03K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI : Analyse et marquage automatiques des documents à l'aide de l'IA pour le système de gestion documentaire paperless-ngx

Introduction générale Paperless-AI est un outil innovant d'analyse de l'automatisation des documents conçu spécifiquement pour le système de gestion documentaire Paperless-ngx. Il combine intelligemment l'API OpenAI avec une variété de modèles d'IA avancés tels que Ollama...
Il y a 7 mois
03K
TableGPT2:表格数据集成的多模态模型

TableGPT2 : Un modèle multimodal pour l'intégration de données tabulaires

Introduction TableGPT2 est un modèle multimodal développé par une équipe de l'Université de Zhejiang, qui se concentre sur l'intégration et le traitement de données tabulaires. Le modèle est pré-entraîné et affiné pour être capable d'effectuer des tâches liées aux données tabulaires tout en conservant de solides capacités de langage et de codage à usage général.TableGPT2 est un modèle multimodal développé par une équipe de l'Université de Zhejiang...
Il y a 9 mois
03K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI Portrait Master version chinoise : Outil de mots clés pour optimiser la génération de portraits

Introduction générale ComfyUI Portrait Master version chinoise est un outil de génération de mots-clés pour les portraits conçu pour les créateurs d'images d'IA. L'outil aide les utilisateurs à générer des portraits de haute qualité en optimisant les mots-clés. Les utilisateurs peuvent choisir différents objectifs en fonction de la demande...
Il y a 11 mois
03K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB : Plateforme d'analyse de données financières open source qui intègre des ensembles de données privées et l'IA pour améliorer la prise de décision en matière d'investissement.

Introduction générale OpenBB est une plateforme d'analyse de données financières gratuite et entièrement open source conçue pour fournir un accès facile aux données financières et aux outils d'analyse pour tous. La plateforme intègre plus de 100 sources de données différentes couvrant les actions, les options, les cryptocurrencies, le forex, les indicateurs macroéconomiques, les...
Il y a 7 mois
03K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D) : génération d'actifs 3D haute résolution, flux de travail multiples pour la génération de matériaux 3D

Introduction complète Tencent Hunyuan3D (Hunyuan3D 2.0) est un système avancé de composition 3D à grande échelle de Tencent conçu pour générer des ressources 3D texturées en haute résolution. Le système se compose de deux éléments principaux : Hunyuan3D-DiT, un modèle de génération de formes à grande échelle, et Hunyuan3D-DiT, un modèle de...
Il y a 7 mois
02.9K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools : outil de conversion de la parole en sous-titres, client léger avec interfaces intégrées pour Cutscene, Racer et Must-Cut

Introduction AsrTools est un outil de synthèse vocale intelligent avec des interfaces intégrées de grands acteurs comme Cutscene, QuickScope, MustCut, etc. Il ne nécessite pas de GPU ou de configuration encombrante, et supporte un traitement par lots efficace et multithread. Il est basé sur le développement PyQt5, une interface belle et conviviale, capable de produire des mots aux formats SRT et TXT...
Il y a 10 mois
02.9K
Marker:快速将PDF转换为Markdown的开源工具

Marker : conversion rapide de PDF en Markdown outils open source

Introduction générale Marker est un outil de traitement de documents basé sur l'apprentissage profond, conçu pour convertir rapidement et précisément des fichiers PDF au format Markdown. Il prend en charge un large éventail de types de documents et est particulièrement optimisé pour la conversion de livres et d'articles scientifiques. Il prend en charge un large éventail de types de documents et est particulièrement optimisé pour la conversion de livres et d'articles scientifiques....
il y a 5 mois
02.9K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund : système de négociation automatisé open source qui utilise des intelligences multiples pour prendre des décisions complexes en matière de négociation de fonds spéculatifs.

Introduction générale AI Hedge Fund est un fonds spéculatif d'intelligence artificielle qui utilise un système multi-agents pour prendre des décisions de trading. Le système travaille en tandem avec de multiples agents spécialisés, y compris des agents de données de marché, des agents quantitatifs, des agents de gestion du risque et des agents de gestion de portefeuille, afin de réaliser des transactions complexes....
Il y a 7 mois
02.9K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS : Construire des multi-intelligences exécutées de manière autonome, un cadre de développement d'organismes intelligents d'IA entièrement fonctionnel et open source

Introduction générale Eliza est un cadre de développement avancé de corps intelligents multiples (multi-agents), destiné à simplifier la construction et le déploiement de processus de corps intelligents autonomes (agents autonomes). Il prend en charge le déploiement de plusieurs corps intelligents avec différents paramètres de rôle, ce qui permet de ...
Il y a 7 mois
02.9K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序

Chatbot UI : une application de chat IA open-source qui imite l'interface et les fonctionnalités de ChatGPT

Introduction générale Chatbot UI est un projet open source conçu pour aider les développeurs à créer des interfaces conversationnelles personnalisées et intelligentes. Le projet fournit une série de composants d'interface et de fonctionnalités interactives qui peuvent être facilement intégrés dans le système Chatbot existant afin de fournir aux utilisateurs un corps de dialogue plus fluide et plus intelligent....
Il y a 11 mois
02.9K
Surya:专业多语言文档OCR工具,开源本地部署

Surya : Outil professionnel d'OCR de documents multilingues, Déploiement natif Open Source

Introduction complète Surya est une boîte à outils d'OCR de documents multilingues open source qui prend en charge la reconnaissance de texte dans plus de 90 langues. Il effectue non seulement la détection de texte ligne par ligne, mais aussi l'analyse de la mise en page, la détection de l'ordre de lecture et la reconnaissance de tableaux....
Il y a 10 mois
02.9K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents : A Multi-Intelligent Body Speech Interaction Application (OpenAI Example)

Introduction générale OpenAI Realtime Agents est un projet open source qui vise à montrer comment l'API temps réel d'OpenAI peut être utilisée pour construire des applications vocales multi-intelligentes. Il fournit un modèle de corps intelligent de haut niveau (emprunté à OpenAI Swarm) qui permet...
Il y a 7 mois
02.9K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow : un outil à code bas pour construire des intelligences et des flux de travail d'IA puissants

Introduction générale Langflow est un outil à code bas conçu pour les développeurs afin de construire de puissants agents d'intelligence artificielle et des flux de travail. Il supporte l'utilisation de n'importe quelle API, modèle ou base de données, simplifiant ainsi le développement d'applications complexes d'IA.
Il y a 8 mois
02.9K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Interface web de génération de texte : interface de chat basée sur un grand modèle de langage Gradio avec prise en charge de plusieurs services dorsaux.

Introduction générale L'interface web de génération de texte est une interface web basée sur Gradio et conçue pour le Grand Modèle de Langage (LLM). Elle supporte une variété de backends de génération de texte, y compris Transformers, llama.cp...
Il y a 9 mois
02.9K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary : un projet open source pour améliorer la mémoire à long terme de l'agent à l'aide de graphes de connaissances

Introduction générale Memary est un projet open source innovant visant à fournir des solutions de gestion de la mémoire à long terme pour les intelligences autonomes. Le projet aide les intelligences à dépasser les limites des fenêtres contextuelles traditionnelles pour obtenir des expériences d'interaction plus intelligentes grâce aux graphes de connaissances et aux modules de mémoire spécialisés....
Il y a 7 mois
02.9K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Gemini-OpenAI : Génération inverse d'adresses Gemini contournant les restrictions régionales et convertissant en API compatibles avec l'OpenAI

Introduction générale L'agent Gemini OpenAI API est un point d'extrémité gratuit et sans maintenance de serveur conforme à OpenAI. Les utilisateurs peuvent facilement le déployer sur des plateformes telles que Vercel, Netlify et Cloudflare pour un usage personnel. Le projet ...
Il y a 7 mois
02.8K
Screenshot to Code:将截图转换为干净前端代码的AI工具

Screenshot to Code : outil AI permettant de convertir des captures d'écran en code frontal propre

Introduction générale Screenshot-to-Code est un outil open source qui utilise l'intelligence artificielle pour convertir des captures d'écran, des ébauches de conception et des conceptions Figma en un code propre et fonctionnel. L'outil prend en charge plusieurs piles technologiques frontales, y compris HTML, Tailwind CS...
Il y a 9 mois
02.8K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG : Un cadre professionnel de questions-réponses sur les bases de connaissances pour la recherche hybride de graphes de connaissances et de vecteurs

Introduction KAG (Knowledge Augmented Generation) est un cadre de raisonnement et de recherche guidé par la forme logique, basé sur le moteur OpenSPG et les grands modèles de langage (LLM). Le cadre est spécifiquement conçu pour construire des bases de connaissances professionnelles...
Il y a 8 mois
02.8K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow : un moteur RAG open source basé sur la compréhension profonde des documents, fournissant des flux de travail de génération améliorés par la recherche.

Introduction complète RAGFlow est un moteur de Génération Augmentée de Récupération (RAG) open source basé sur une technologie de compréhension profonde des documents. Il fournit un flux de travail RAG efficace pour les entreprises de toutes tailles, en incorporant un modèle de langage à grande échelle (LLM) qui peut fournir des données dans des formats complexes basés sur des...
Il y a 7 mois
02.8K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU : extraction de documents PDF et conversion au format Markdown multimodal, prise en charge de la numérisation OCR des livres électroniques

Introduction complète MinerU est un outil d'extraction de données open source développé par l'équipe OpenDataLab du Shanghai Artificial Intelligence Laboratory, qui se concentre sur l'extraction efficace du contenu de documents PDF complexes, de pages web et de livres électroniques. Il est capable de prendre des PDF multimodaux contenant des images, des formules, des tableaux et d'autres éléments...
Il y a 10 mois
02.8K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify : l'outil open source classique pour coloriser les photos et vidéos en noir et blanc à l'aide de techniques d'IA

Introduction complète DeOldify est un projet open source basé sur une technologie d'apprentissage profond dédiée à la coloration intelligente et à la restauration de photos et de vidéos en noir et blanc. Le projet utilise une méthode d'apprentissage NoGAN innovante pour résoudre avec succès les défauts communs des réseaux GAN traditionnels dans le processus de coloration d'image...
Il y a 8 mois
02.8K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

AutoGen Studio : une interface facile à utiliser pour le système multi-agents AutoGen

Description générale AutoGen Studio 2.0 est une interface utilisateur basée sur AutoGen conçue pour simplifier le processus de création et de gestion de solutions multi-agents. La plateforme permet aux utilisateurs de définir et de modifier de manière déclarative les agents et leurs flux de travail à travers une interface intuitive...
Il y a 7 mois
02.8K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer : lecteur vidéo qui génère des sous-titres en temps réel avec traduction bilingue

Introduction générale LLPlayer est un lecteur multimédia open source pour les apprenants de langues, hébergé sur GitHub et créé par le développeur umlx5h. Il intègre une variété de fonctionnalités utiles telles que l'affichage des sous-titres bilingues, les sous-titres générés automatiquement par l'IA, la traduction en temps réel et la recherche de mots...
Il y a 2 mois
02.8K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr : un service tout-en-un qui utilise des modèles visuels pour l'ingestion de documents et le découpage intelligent basé sur la hiérarchie des paragraphes du texte.

Introduction générale Chunkr est une API auto-hébergée dédiée à la conversion de fichiers PDF, PPTX, DOCX et Excel en données utilisables dans RAG (Retrieval Augmented Generation) et LLM (Large Language Modelling). Le projet a été développé par Lumina...
Il y a 8 mois
02.8K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest : Convertir rapidement les dépôts de code Github en texte adapté à la compréhension du LLM

Introduction générale GitIngest est un outil open source conçu pour transformer les dépôts de code GitHub en texte adapté aux indices du Large Language Model (LLM). Avec une simple opération, les utilisateurs peuvent extraire et formater le contenu de n'importe quel dépôt GitHub pour qu'il corresponde au ...
Il y a 8 mois
02.7K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI : outil open source d'exploration asynchrone du web pour extraire des données structurées sans LLM

Introduction complète Crawl4AI est un outil d'exploration du web asynchrone open source conçu pour les grands modèles de langage (LLM) et les applications d'intelligence artificielle (IA). Il simplifie le processus d'exploration du web et d'extraction de données, supporte l'exploration efficace du web et fournit des formats de sortie adaptés aux LLM pour...
Il y a 9 mois
02.7K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync : un outil open source pour générer des vidéos avec synchronisation labiale directement à partir de l'audio

Introduction générale LatentSync est un outil open source développé par ByteDance et hébergé sur GitHub. Il pilote les mouvements des lèvres des personnages d'une vidéo directement à travers l'audio, de sorte que la forme de la bouche corresponde précisément à la voix. Le projet est basé sur Stable Di...
Il y a 2 mois
02.7K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio : génération d'effets sonores synchronisés et de bandes sonores pour des séquences vidéo, outil de coformation multimodale vidéo/audio

Introduction générale MMAudio est un projet open source visant à générer un son synchronisé de haute qualité par le biais d'une formation multimodale conjointe. Développé par Ho Kei Cheng et al. à l'Université chinoise de Hong Kong, la fonction principale du projet est de générer de l'audio synchronisé à partir d'une vidéo et/ou d'un texte....
Il y a 8 mois
02.7K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI Chatbot : créez votre compagnon de chat IA, un dialogue vocal facile et une interaction intelligente.

Introduction complète Xiaozhi AI Chatbot est un projet open source basé sur la carte de développement ESP32, conçu pour aider les utilisateurs à construire leur propre compagnon de chat IA. Le projet a été développé par Shrimp et est principalement utilisé à des fins pédagogiques pour aider plus de gens à se lancer dans le développement de matériel d'IA et à comprendre comment appliquer de grands modèles de langage à des...
il y a 5 mois
02.7K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose : des intelligences de programmation évolutives à source ouverte qui automatisent les tâches de programmation à part entière

Introduction générale Goose est un outil d'agent IA open source développé par Block, Inc. et conçu pour aider les développeurs à automatiser les tâches de développement quotidiennes. Il prend en charge une large gamme de grands modèles de langage (LLM) et interagit avec les utilisateurs via la ligne de commande ou les interfaces d'application de bureau....
Il y a 6 mois
02.7K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI : outil en ligne de commande permettant d'utiliser les services MCP dans n'importe quel grand modèle, sans dépendre de Claude.

Introduction complète Le Model Context Provider CLI (mcp-cli) est un outil de ligne de commande au niveau du protocole pour interagir avec un serveur de fournisseur de contexte de modèle. L'outil permet aux utilisateurs d'envoyer des commandes, d'interroger des données et d'interagir avec diverses ressources fournies par le serveur...
il y a 5 mois
02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI : projet open source qui permet à l'IA de prendre le contrôle d'ordinateurs à distance et de les commander à l'aide du langage naturel

Introduction générale NeoAI est un assistant IA open source innovant qui permet aux utilisateurs de contrôler et de gérer facilement leurs ordinateurs par le biais d'un dialogue en langage naturel. Sans écrire de code, les utilisateurs peuvent rechercher des fichiers, automatiser des tâches, gérer des périphériques et bien plus encore grâce à un simple dialogue quotidien.
Il y a 7 mois
02.7K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer : restauration d'images et de vidéos, restauration de vieilles photos, offre une version de déploiement en un clic

CodeFormer Introduction générale CodeFormer est une base de code pour la réparation robuste de visages aveugles, développée par une équipe de chercheurs du S-Lab, Nanyang Technological University et présentée à NeurIPS 2022. Le projet utilise un transformateur de recherche de codebook (C...
Il y a 11 mois
02.7K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR : Un cadre unifié pour l'implémentation de la réparation de visages vidéo, la réparation de vidéos en noir et blanc, de portraits flous et de vieilles vidéos

Introduction SVFR (Stable Video Face Restoration) est un cadre unifié pour la restauration de visages vidéo qui prend en charge la restauration de base des visages (BFR), la coloration, la réparation et leurs tâches combinées. Le cadre utilise des antécédents génératifs et cinématiques en unifiant...
Il y a 7 mois
02.7K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook : convertir des livres électroniques en livres audio, outil open source avec support multilingue et clonage de voix

Introduction générale ebook2audiobook est un puissant outil open source de conversion de livres électroniques en livres audio. Il est capable de convertir des livres électroniques dans plusieurs formats en livres audio avec des marqueurs de chapitres et des métadonnées. L'outil utilise Calibre pour la conversion des formats de livres électroniques en utilisant Co...
Il y a 7 mois
02.7K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen : un modèle unifié de génération d'images avec des entrées multimodales pour générer des images cohérentes avec les personnages

Introduction générale OmniGen est un modèle "universel" de génération d'images développé par VectorSpaceLab qui permet aux utilisateurs de créer des effets visuels variés et riches en contexte avec de simples invites textuelles ou des entrées multimodales. Il est particulièrement bien adapté aux applications qui doivent reconnaître...
Il y a 9 mois
02.7K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT : une plateforme de développement low-code pour des applications d'IA générative de niveau entreprise

Introduction BuffGPT est une plateforme open source de développement d'applications d'IA basée sur le Large Language Model (LLM), offrant des fonctionnalités prêtes à l'emploi telles que le traitement des données, l'invocation de modèles, la récupération de RAG et l'orchestration visuelle de flux de travail afin d'aider les utilisateurs à construire et à exploiter facilement des applications d'IA générative. La plateforme prend en charge...
il y a 5 mois
02.6K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS : modèle de génération d'actifs 3D développé par Microsoft avec prise en charge de plusieurs formats et souplesse d'édition.

Introduction générale TRELLIS est un modèle de génération de ressources 3D à grande échelle développé par Microsoft. Il est capable de recevoir des invites sous forme de texte ou d'image et de générer des ressources 3D de haute qualité dans divers formats, tels que des champs radiaux, des gaussiennes 3D et des maillages....
Il y a 8 mois
02.6K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker : Déploiement des API de synthèse vocale de Microsoft à l'aide de Cloudflare, d'un format compatible avec OpenAI et d'une interface Web packagée

Introduction générale Edge TTS Worker (qui s'appuie sur edge-tts) est un service proxy déployé sur Cloudflare Worker qui encapsule le service Microsoft Edge TTS dans un format compatible avec OpenAI ...
Il y a 7 mois
02.6K