Projet open source sur l'IA

Total 1020 articles
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR : Extraction de texte à partir d'images à l'aide de modèles visuels dans Ollama

Introduction Ollama OCR est une puissante boîte à outils de reconnaissance optique de caractères (OCR) qui utilise le modèle de langage visuel de pointe fourni par la plate-forme Ollama pour extraire du texte à partir d'images. Le projet est disponible sous la forme d'un paquetage Python et fournit des...
Il y a 7 mois
04.4K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT : Outil d'essayage virtuel IA haute fidélité pour une meilleure authenticité des détails du vêtement

Introduction FitDiT est un système d'essayage virtuel haute fidélité basé sur les transformateurs de diffusion (Diffusion Transformers). Développé par le Tencent AI Lab, le projet vise à remédier aux limites des systèmes d'essayage virtuels traditionnels en montrant les détails des vêtements.
Il y a 7 mois
02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model : Vidéo de référence de la carte de portrait statique Vidéo de génération de mouvement de portrait

Introduction générale Thin-Plate-Spline-Motion-Model est un projet révolutionnaire de génération d'animations d'images présenté à la CVPR 2022. Le projet est basé sur la théorie des transformées splines à plaques minces et est capable d'obtenir un mouvement de haute qualité à partir d'images...
Il y a 7 mois
02.7K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX : Des personnes numériques intelligentes pour une interaction en temps réel, permettant un déploiement multiplateforme en un seul clic

Introduction générale DUIX (Dialogue User Interface System) est une plateforme d'interaction humaine numérique alimentée par l'IA et créée par Silicon Intelligence. Grâce aux capacités d'interaction humaine numérique open source, les développeurs peuvent facilement intégrer des modèles à grande échelle, la reconnaissance automatique de la parole (ASR)...
Il y a 7 mois
03.7K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

Fay Digital Human Framework : intégration de modèles linguistiques et de personnages numériques en 3D pour soutenir une variété de scénarios d'application.

Introduction complète Fay est une structure open source d'humain numérique virtuel en 3D qui intègre des modèles de langage et des personnages numériques pour une variété de scénarios d'application, tels que des guides d'achat virtuels, des présentateurs virtuels, des assistants, des serveurs, des enseignants et des assistants mobiles vocaux ou textuels....
Il y a 7 mois
03.1K
MOFA Video:运动场适配技术将静态图像转换为视频

Vidéo MOFA : la technologie d'adaptation du champ de mouvement convertit les images fixes en vidéo

Introduction générale MOFA-Video est un outil de génération d'animations d'images de pointe qui utilise des techniques génératives d'adaptation du champ de mouvement pour convertir des images statiques en vidéos dynamiques. Il a été développé en collaboration avec l'Université de Tokyo et le Tencent AI Lab, et sera présenté à la Conférence européenne sur la vision...
Il y a 7 mois
02.6K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex : assistant d'enregistrement de réunion IA open source, enregistrement automatique du contenu de la réunion pour générer des résumés

Introduction générale Amurex est un assistant de réunion IA open source développé par The Personal AI Company, conçu pour améliorer l'efficacité des réunions grâce à des fonctions intelligentes. Amurex est capable de fournir des conseils en temps réel, de générer des résumés intelligents, d'enregistrer le contenu de la réunion et d'envoyer automatiquement des...
Il y a 7 mois
03.4K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Agent Laboratory : assistant automatisé de rédaction de codes et d'études pour les chercheurs

Introduction complète Agent Laboratory est un flux de travail de recherche autonome de bout en bout conçu pour aider les chercheurs à concrétiser leurs idées de recherche. Le système se compose d'agents dédiés pilotés par des modèles de langage à grande échelle qui prennent en charge l'ensemble du flux de travail de la recherche - de la réalisation d'analyses documentaires et de l'élaboration de plans à l'exécution de...
Il y a 4 mois
02.8K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S. : Assistant de code intelligent tenant compte du contexte, générateur et modificateur de code, support multi-IDE

Introduction générale J.A.R.V.I.S. (Just A Rather Very Intelligent System) est un assistant de code intelligent conçu pour aider les développeurs dans la génération de code, la modification et les discussions techniques en utilisant plusieurs modèles de langage de pointe....
Il y a 7 mois
03.4K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Système d'investissement IA : système automatisé de prise de décision en matière d'investissement en actions A, utilisant un système multi-intelligence pour analyser les données du marché.

Introduction complète A_Share_investment_Agent est un outil d'aide à la décision d'investissement en actions A basé sur un système de multi-intelligence. Le système est conçu pour analyser les données du marché, calculer la valeur intrinsèque des actions, analyser le sentiment du marché et les données fondamentales par le biais de multiples intelligences collaboratives pour...
Il y a 7 mois
02.6K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

Chercheur d'entreprise : outil de recherche d'entreprise, saisissez l'adresse web d'une entreprise pour obtenir des informations de recherche détaillées.

Description générale Company Researcher (Company Researcher) est un outil gratuit et open source conçu pour aider les utilisateurs à obtenir une vue d'ensemble rapide et complète de n'importe quelle entreprise. Il suffit d'entrer l'URL de l'entreprise et l'outil rassemblera des informations complètes sur le web, présentant des informations sur l'organisation, ses produits...
Il y a 4 mois
02.2K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast : Transformez vos dépôts GitHub en podcasts et écoutez les mises à jour de code à tout moment, où que vous soyez !

Introduction générale GitPodcast est un outil innovant conçu pour transformer les dépôts GitHub en podcasts, permettant aux développeurs d'écouter les mises à jour de code à tout moment et en tout lieu. En utilisant OpenAI et Azure Speech SDK, GitPodcast...
Il y a 7 mois
02.4K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI : Analyse et marquage automatiques des documents à l'aide de l'IA pour le système de gestion documentaire paperless-ngx

Introduction générale Paperless-AI est un outil innovant d'analyse de l'automatisation des documents conçu spécifiquement pour le système de gestion documentaire Paperless-ngx. Il combine intelligemment l'API OpenAI avec une variété de modèles d'IA avancés tels que Ollama...
Il y a 7 mois
04.9K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos : World Base Model, une plateforme pour la construction de modèles de base d'IA du monde physique

Introduction complète NVIDIA Cosmos est une plateforme de modélisation basée sur le monde pour les développeurs, spécialement conçue pour aider les développeurs d'IA physique à construire leurs systèmes d'IA physique mieux et plus rapidement. La plateforme propose une gamme de modèles pré-entraînés, dont des modèles de diffusion et des modèles autorégressifs...
Il y a 7 mois
02.7K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow : Construire des mini-intelligences LLM avec une "Directed Graph Structure" en 100 lignes de code

Introduction générale miniLLMFlow est un cadre de développement minimaliste de Large Language Model (LLM) qui ne contient que 100 lignes de code, démontrant la philosophie de conception de "garder les choses simples". Le cadre est spécifiquement conçu pour permettre aux assistants IA (par exemple ChatGPT, Claude, etc.) de...
Il y a 7 mois
02.8K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI Chatbot : créez votre compagnon de chat IA, un dialogue vocal facile et une interaction intelligente.

Introduction complète Xiaozhi AI Chatbot est un projet open source basé sur la carte de développement ESP32, conçu pour aider les utilisateurs à construire leur propre compagnon de chat IA. Le projet a été développé par Shrimp et est principalement utilisé à des fins pédagogiques pour aider plus de gens à se lancer dans le développement de matériel d'IA et à comprendre comment appliquer de grands modèles de langage à des...
il y a 5 mois
03.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js : un modèle Next.js pour construire des applications d'IA de dialogue vocal en temps réel

Introduction complète OpenAI Realtime API Next.js est un projet open source basé sur le framework Next.js , conçu pour aider les développeurs à créer rapidement des applications d'IA vocale en temps réel. Le projet intègre l'API en temps réel d'OpenAI et la technologie WebRTC...
Il y a 7 mois
02.6K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件

Auto-Coder.Chat : Assistant de programmation assisté par l'IA, basé sur la ligne de commande du terminal, avec plug-in VSCode

Introduction générale Auto-Coder.Chat est un outil de programmation assisté par l'IA, basé sur un terminal, conçu pour améliorer l'efficacité de la programmation des développeurs par des moyens intelligents. L'outil peut être utilisé avec n'importe quel IDE pour permettre la programmation assistée par l'IA dans les outils de développement....
Il y a 4 mois
02.7K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI : Assistant conversationnel d'analyse de données avec accès direct aux réponses, aux requêtes SQL et aux rapports d'analyse

Introduction générale WrenAI est un assistant SQL AI open source conçu spécifiquement pour aider les équipes de données, les équipes de produits et les équipes commerciales à obtenir des informations sur les données par le biais d'un dialogue en langage naturel. Il est capable de convertir le langage naturel en requêtes SQL, de générer des graphiques, des feuilles de calcul et des rapports, de...
Il y a 7 mois
03.4K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

Activepieces : automatisation du flux de travail par l'IA, outil de planification des tâches pour les utilisateurs non techniques, remplacement de Zapier en open source.

Introduction générale Activepieces est une plateforme de workflow d'automatisation tout-en-un, open source, dont l'objectif est de fournir des solutions d'automatisation intuitives et puissantes pour les entreprises et les utilisateurs individuels. Développée en TypeScript, la plateforme est extrêmement évolutive et prend en charge plus de 200 services intégrés...
Il y a 7 mois
02.7K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT : modèle de transfert de maquillage hiérarchique autosupervisé, maquillage virtuel, migration du maquillage vers de nouveaux portraits.

Introduction SHMT (Self-supervised Hierarchical Makeup Transfer) est un projet de migration hiérarchique de maquillage auto-supervisé basé sur un modèle de diffusion latent, visant à obtenir des effets de maquillage de haute qualité grâce à des méthodes d'apprentissage non supervisées....
Il y a 7 mois
02.9K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA : Open Source Multimodal Large Language Models for Real-Time Visual and Speech Interaction (modèles multimodaux de langage à grande échelle pour l'interaction visuelle et vocale en temps réel)

Introduction générale VITA est un projet open source de modélisation interactive multimodale du langage, pionnier dans la capacité à réaliser une véritable interaction multimodale complète. Le projet a lancé VITA-1.0 en août 2024, inaugurant le premier modèle de langage interactif entièrement modal en open source....
Il y a 7 mois
03.1K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Trend Finder : Suivi des tendances des médias sociaux, des sujets en vogue et des nouveaux articles en temps réel pour la prise de décisions marketing.

Introduction générale Trend Finder est un outil puissant conçu pour aider les utilisateurs à suivre les sujets tendance et les tendances sur les médias sociaux en temps réel. En collectant et en analysant les posts des principaux influenceurs, Trend Finder est capable de détecter les nouvelles tendances ou les...
Il y a 7 mois
02.9K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi : génération et traduction automatiques de sous-titres multilingues pour les vidéos à l'aide de l'IA

Introduction générale AI no jimaku gumi (AI no subtitle group) est un puissant outil de traitement des sous-titres vidéo en ligne de commande qui permet d'automatiser les fonctions d'extraction, de transcription et de traduction des sous-titres vidéo. L'outil intègre des technologies d'IA avancées, notamment la parole Whisper...
Il y a 7 mois
02.5K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter : un outil de conversion audio en temps réel pour la traduction du chinois vers l'anglais basé sur le modèle multimodal Gemini

TransRouter est un outil de traduction vocale en temps réel basé sur le modèle Gemini de Google, spécialement conçu pour la traduction vocale en temps réel entre l'anglais et le chinois. L'outil s'intègre de manière transparente dans les logiciels de vidéoconférence tels que Zoom, fournissant un outil puissant pour...
Il y a 7 mois
03.1K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm : implémentation open source de NotebookLM basée sur Deepseek-V3 et PlayHT TTS

Introduction générale Open Source NotebookLM est un projet innovant d'intelligence artificielle qui combine les capacités de compréhension du langage de Deepseek-V3 avec la technologie de synthèse vocale de PlayHT, dans le but de créer un système de dialogue intelligent pour la prise de notes. Le projet a été développé par Build Fast...
Il y a 7 mois
02.7K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research : générer des recherches sur l'IA à partir du contenu des recherches sur le web

Introduction générale Open Deep Research est un outil open source de génération de rapports de recherche pilotés par l'IA qui constitue une alternative open source aux capacités de recherche approfondie de Google Gemini. Le projet est développé en TypeScript et basé sur Next.js 1...
Il y a 4 mois
02.8K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Vision is All You Need : Building an Intelligent Document Retrieval System Using Visual Language Models (Vision RAG) (La vision est tout ce dont vous avez besoin : construire un système intelligent de recherche de documents en utilisant des modèles de langage visuel)

Introduction globale Vision-is-all-you-need est un projet de démonstration d'un système visuel innovant RAG (Retrieval Augmented Generation) qui innove en appliquant la modélisation du langage visuel (VLM) au domaine du traitement des documents. Contrairement aux méthodes traditionnelles de regroupement de textes, le système permet directement...
Il y a 7 mois
03.2K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx) : projet open source qui imite Perplexity, intégrant un dialogue avec l'IA, une recherche sur le web, une interrogation sur la météo, etc.

Introduction générale MiniPerplx (renommé Scira) est un moteur de recherche minimaliste piloté par l'IA qui intègre une variété de fonctionnalités utiles pour fournir aux utilisateurs une gamme complète de services de recherche d'informations. Le projet utilise une pile technologique moderne comprenant Next.js, Tailwi...
Il y a 7 mois
03.2K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM : service de raisonnement LLM reposant sur des données externes de graphe de connaissances en temps réel

Introduction complète Diffbot LLM Reasoning Server est un système innovant de modélisation du langage à grande échelle avec des optimisations et des améliorations spéciales basées sur l'architecture du modèle LLama. La caractéristique la plus importante du projet est l'intégration d'un graphe de connaissances en temps réel avec une génération...
Il y a 7 mois
02.9K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush : Ajouter de l'illumination aux images avec des outils de peinture intelligents

Introduction générale LuminaBrush est un outil interactif innovant d'édition d'images pour les effets de lumière, alimenté par la technologie de l'intelligence artificielle. Le projet utilise un cadre en deux étapes pour traiter les images : la première étape transforme l'image d'entrée en un aspect "uniformément éclairé", tandis que la seconde étape génère...
Il y a 7 mois
03.5K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT : un cadre de collaboration multi-intelligence pour la création d'équipes de développement de logiciels d'IA pour la programmation en langage naturel

Introduction complète MetaGPT est un cadre innovant de corps multi-intelligence conçu pour simuler le fonctionnement d'une entreprise complète de logiciels d'IA. Créé par geekan (Alexander Wu), l'objectif du projet est de combiner des modèles GPT avec différents rôles en une entité collaborative...
il y a 5 mois
03.5K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集

Générateur llms.txt : capturez rapidement le contenu d'un site web et générez des ensembles de données textuelles de formation LLM.

Introduction complète llmstxt-generator est un outil professionnel d'extraction et d'intégration de contenu web dédié à la préparation d'ensembles de données textuelles de haute qualité pour l'entraînement et l'inférence dans le cadre de la modélisation du langage étendu (LLM). L'outil a été développé par Mendable AI en utilisant @firec...
Il y a 7 mois
03K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F : Accès gratuit à GPT-4, Llama-3 et à de nombreux autres modèles d'IA via Raycast !

Introduction générale Raycast-G4F (GPT4Free) est une puissante extension Raycast qui donne aux utilisateurs un accès gratuit à un large éventail de modèles d'IA avancés, notamment GPT-4 et Llama-3. L'extension ne se contente pas de fournir des dialogues en temps réel...
Il y a 7 mois
03.1K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent : assistant de clonage vocal IA de bout en bout, assistant de dialogue vocal en temps réel, projet dérivé de Fish Speech

Introduction complète Projet de dérivation de la parole de Fish Fish Agent est un système révolutionnaire de clonage de la parole de bout en bout développé sur la base de l'architecture du modèle V0.1 3B. En tant que système de traitement de clones de parole de bout en bout, sa caractéristique la plus importante est l'utilisation de...
Il y a 7 mois
03.2K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip : montage intelligent de contenus vidéo en courts métrages, facilité d'extraction et de découpage précis de clips vidéo

Introduction complète FunClip est un outil d'édition vidéo automatisé et localisé, entièrement open source, développé par le TONGYI Speech Lab de l'Alibaba Dharma Institute. L'outil intègre le modèle de reconnaissance vocale Paraformer-Large de qualité industrielle, qui peut identifier avec précision la parole dans la vidéo...
Il y a 7 mois
03.7K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI : un client de dialogue intelligent de bureau basé sur l'API Dify, qui fournit des capacités de dialogue IA de niveau entreprise.

Introduction Dify-WebUI est une application moderne de dialogue intelligent de bureau basée sur l'API Dify, conçue pour fournir aux entreprises de puissantes capacités de dialogue IA. L'application prend en charge une variété de couleurs de thème prédéfinies pour répondre aux besoins individuels des entreprises, et dispose d'une fonction de gestion de la base de connaissances...
Il y a 7 mois
03.5K
小红书AI运营助手:自动生成和发布小红书文章

Xiaohongshu AI operation assistant : générer et publier automatiquement des articles Xiaohongshu

Introduction complète Xiaohongshu AI Operation Assistant (xhsaipublisher) est un outil d'automatisation conçu pour la publication d'articles sur la plateforme Xiaohongshu. Le projet combine une interface utilisateur graphique avec des scripts d'automatisation pour générer du contenu à l'aide de la technologie big model et pour se connecter et publier automatiquement via le navigateur...
Il y a 7 mois
03.8K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

Editeur WeChat Markdown : outils de mise en page graphique WeChat simples et efficaces, une clé pour coller l'article au numéro public WeChat

Introduction complète WeChat Markdown Editor (WeChat Markdown Editor) est un outil de mise en page graphique WeChat très concis conçu pour aider les utilisateurs à créer facilement de beaux messages WeChat. L'éditeur prend en charge tous les ...
Il y a 7 mois
02.7K
Orchestra : Création d'équipes d'IA intelligentes pour un développement collaboratif multi-intelligence plus facile et plus efficace

Orchestra : Création d'équipes d'IA intelligentes pour un développement collaboratif multi-intelligence plus facile et plus efficace

Orchestra est un framework Python innovant et léger qui se concentre sur la construction de systèmes collaboratifs multi-intelligences basés sur le Large Language Model (LLM). Il utilise une méthode unique d'organisation des intelligences afin que plusieurs intelligences IA puissent travailler en harmonie comme dans un orchestre symphonique. En modélisant ...
Il y a 7 mois
02.1K
GraphAgent:构建知识图谱,自动化任务规划与执行

GraphAgent : construire des graphes de connaissances pour automatiser la planification et l'exécution des tâches

Introduction complète GraphAgent est un système automatisé intelligent qui intègre la génération de graphes, la planification et l'exécution de tâches. Il est capable de traiter des données structurées et non structurées, de construire des graphes de dépendance sémantique complexes et d'exécuter efficacement les tâches de l'utilisateur grâce à l'auto-planification et à l'adaptation des outils.
Il y a 7 mois
02.3K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集

Harbor : un ensemble d'outils conteneurisés pour déployer des environnements de développement LLM locaux en un seul clic et pour gérer et exécuter facilement des services d'IA.

Introduction générale Harbor est un ensemble d'outils LLM conteneurisés révolutionnaires visant à simplifier le déploiement et la gestion d'environnements de développement d'IA locaux. Il permet aux développeurs de disposer d'une interface de ligne de commande (CLI) propre et d'une application d'accompagnement à lancer et à gérer en un seul clic, y compris les backends LLM, les interfaces API, les...
Il y a 7 mois
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker : extraction et catégorisation de documents en données structurées pour optimiser le processus de traitement des documents

Introduction ExtractThinker est un outil flexible d'intelligence documentaire qui extrait et classifie des données structurées à partir de documents en utilisant de grands modèles de langage (LLM), fournissant un flux de travail de traitement de documents transparent de type ORM. Il prend en charge une variété de chargeurs de documents, y compris Tess...
Il y a 7 mois
02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI : projet open source qui permet à l'IA de prendre le contrôle d'ordinateurs à distance et de les commander à l'aide du langage naturel

Introduction générale NeoAI est un assistant IA open source innovant qui permet aux utilisateurs de contrôler et de gérer facilement leurs ordinateurs par le biais d'un dialogue en langage naturel. Sans écrire de code, les utilisateurs peuvent rechercher des fichiers, automatiser des tâches, gérer des périphériques et bien plus encore grâce à un simple dialogue quotidien.
Il y a 7 mois
04.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone : outil d'IA permettant d'extraire les vêtements d'une personne sous la forme d'une image d'affichage de vêtements en mosaïque

Introduction complète TryOffAnyone est un outil de traitement d'images par IA spécialement conçu pour résoudre les problèmes de présentation des vêtements dans le secteur du commerce électronique. Il est capable de convertir intelligemment des photos de personnes réelles portant des vêtements en images à effet d'affichage plat. Cette technologie est basée sur la dernière technologie Latent Dif...
Il y a 7 mois
02.7K
Agentarium : gestion et coordination des interactions entre plusieurs intelligences IA

Agentarium : gestion et coordination des interactions entre plusieurs intelligences IA

Introduction générale Agentarium est un puissant framework Python dédié à la gestion et à l'orchestration d'agents intelligents d'IA (Agents). Le framework fournit un moyen flexible et intuitif de créer, gérer et orchestrer les interactions entre plusieurs agents d'IA. Il utilise A...
Il y a 7 mois
03.1K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX Video (LTXV) : un modèle open-source pour la génération de vidéos en temps réel qui produit des vidéos de haute qualité

Introduction générale LTX-Video est le premier modèle de génération vidéo en temps réel basé sur le DiT (Diffusion Transformer) développé par Lightricks. Le modèle est capable de générer une haute qualité à une résolution de 768x512 à 24 images par seconde...
Il y a 7 mois
04.1K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

ScrapeGraphAI : un seul mot pour l'exploration du web, pas besoin d'écrire des règles outil intelligent d'extraction de contenu web

Introduction complète ScrapeGraphAI est une bibliothèque innovante de scraping web en Python qui combine astucieusement le Large Language Modelling (LLM) et la Direct Graph Logic pour créer des pipelines de scraping pour les sites web et les documents locaux. Ce qui rend cet outil unique est son niveau parfait de simplicité et de puissance...
Il y a 7 mois
02.2K
AnkiAIUtils : Anki Flashcard Learning AI Toolset, un assistant intelligent qui optimise automatiquement les cartes mémoire

AnkiAIUtils : Anki Flashcard Learning AI Toolset, un assistant intelligent qui optimise automatiquement les cartes mémoire

Description générale AnkiAIUtils est un ensemble d'outils améliorés par l'IA et conçus pour le système d'apprentissage Anki. Développé par un étudiant en médecine, l'outil est conçu pour améliorer automatiquement les cartes avec lesquelles les utilisateurs ont des difficultés au cours du processus d'apprentissage grâce à la technologie de l'IA. Il fournit intelligemment aux utilisateurs des...
Il y a 7 mois
02.9K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter : Générer des illustrations graphiques continues et cohérentes basées sur une longue histoire.

Introduction générale Story-Adapter est un cadre innovant de visualisation d'histoires qui convertit des histoires textuelles en séquences d'images cohérentes. Développé par des chercheurs, ce projet utilise une approche itérative qui ne nécessite aucune formation pour générer des illustrations d'histoires de haute qualité. Le cadre se caractérise par sa capacité à gérer de longues...
Il y a 7 mois
02.8K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram : Visualisez la structure de votre base de code GitHub et transformez votre dépôt de code en un diagramme d'architecture de système interactif.

Introduction générale GitDiagram est un outil innovant de visualisation de la base de code GitHub qui transforme rapidement n'importe quel dépôt GitHub en un diagramme interactif de l'architecture du système. Il utilise une technologie d'IA avancée (Claude 3.5 Sonnet) pour fournir aux développeurs...
Il y a 7 mois
04.5K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS : Construire des multi-intelligences exécutées de manière autonome, un cadre de développement d'organismes intelligents d'IA entièrement fonctionnel et open source

Introduction générale Eliza est un cadre de développement avancé de corps intelligents multiples (multi-agents), destiné à simplifier la construction et le déploiement de processus de corps intelligents autonomes (agents autonomes). Il prend en charge le déploiement de plusieurs corps intelligents avec différents paramètres de rôle, ce qui permet de ...
Il y a 7 mois
04.1K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook : convertir des livres électroniques en livres audio, outil open source avec support multilingue et clonage de voix

Introduction générale ebook2audiobook est un puissant outil open source de conversion de livres électroniques en livres audio. Il est capable de convertir des livres électroniques dans plusieurs formats en livres audio avec des marqueurs de chapitres et des métadonnées. L'outil utilise Calibre pour la conversion des formats de livres électroniques en utilisant Co...
Il y a 7 mois
03.7K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary : un projet open source pour améliorer la mémoire à long terme de l'agent à l'aide de graphes de connaissances

Introduction générale Memary est un projet open source innovant visant à fournir des solutions de gestion de la mémoire à long terme pour les intelligences autonomes. Le projet aide les intelligences à dépasser les limites des fenêtres contextuelles traditionnelles pour obtenir des expériences d'interaction plus intelligentes grâce aux graphes de connaissances et aux modules de mémoire spécialisés....
Il y a 7 mois
04.4K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

L'IA lit les livres : l'IA lit les livres PDF page par page, extrait automatiquement les points clés de la connaissance et génère des résumés.

Introduction AI-reads-books-page-by-page est un outil d'analyse intelligente de livres PDF basé sur Python, qui peut automatiser l'analyse page par page de livres PDF, extraire les points de connaissance clés et, après l'intervalle de page spécifié, générer des...
Il y a 7 mois
03.5K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty : Découvrez un éditeur de code alimenté par l'IA, faites de chaque conversation un commit Git !

Introduction générale Melty est un éditeur de code IA révolutionnaire qui combine les conversations par chat avec le contrôle de version Git. Développé par Charlie et Jackson de Replicate, cet outil vise à résoudre les problèmes des outils traditionnels de codage de l'IA. Son plus grand ...
Il y a 7 mois
02.6K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide : extension d'aide à l'IA qui améliore l'expérience de développement de VSCode avec l'annotation, la conversion et le code généré par l'interface utilisateur en un seul clic.

Introduction générale AIDE (AI-assisted Development Extension) est une puissante extension de développement assistée par l'IA pour VSCode, qui se concentre sur la fourniture d'une assistance unique et utile à la programmation de l'IA. Elle est différente de GitHu...
Il y a 7 mois
03K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText : génère et édite du texte multilingue dans l'image, avec la possibilité de générer plusieurs lignes de chinois dans l'image.

Introduction complète AnyText est un outil révolutionnaire de génération et d'édition de textes visuels multilingues, développé sur la base du modèle de diffusion. Il génère des textes multilingues naturels et de haute qualité dans des images et offre des capacités d'édition de texte flexibles. Il a été développé par une équipe de chercheurs et présenté à l'ICLR 2024...
Il y a 7 mois
03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel : clone open-source du système d'intégration digital man, déploiement en un clic du client digital man gratuit

Introduction complète AigcPanel est un système de production d'intelligence artificielle pour tous les utilisateurs, développé avec la pile technologique electron+vue3+typescript, supportant le déploiement en un clic sur Windows. Le système est conçu pour être convivial, même...
Il y a 7 mois
03.3K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery : Windows Native AI Model Development Toolset, End-Side Model Integration into Windows Applications (en anglais)

Introduction générale AI Dev Gallery est une application d'outils de développement d'IA de Microsoft (actuellement en avant-première publique) conçue pour les développeurs Windows. Elle fournit une plateforme complète pour aider les développeurs à intégrer facilement des fonctionnalités d'IA dans leurs...
Il y a 7 mois
02.8K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker : Déploiement des API de synthèse vocale de Microsoft à l'aide de Cloudflare, d'un format compatible avec OpenAI et d'une interface Web packagée

Introduction générale Edge TTS Worker (qui s'appuie sur edge-tts) est un service proxy déployé sur Cloudflare Worker qui encapsule le service Microsoft Edge TTS dans un format compatible avec OpenAI ...
Il y a 8 mois
04K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX : reconnaissance vocale automatique séparée du locuteur, fournissant des horodatages très précis au niveau des mots.

Introduction générale BetterWhisperX est une version optimisée du projet WhisperX visant à fournir des services de reconnaissance automatique de la parole (ASR) efficaces et précis. En tant que dérivé amélioré de WhisperX, le projet a été développé par Federico ...
Il y a 8 mois
03K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilot backend proxy service : reprendre le serveur de plugin GitHub Copilot avec d'autres modèles

Introduction générale Le Copilot Backend Agent Service est un projet open source conçu pour gérer le serveur de plugins GitHub Copilot en s'appuyant sur d'autres modèles FIM tels que DeepSeek, tout en prenant en charge plusieurs personnes partageant des comptes officiels. Le service supporte une variété d'IDE, y compris V...
Il y a 8 mois
02.8K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance : l'API du modèle Gemini est compatible avec le format OpenAI, ce qui permet de lever les restrictions régionales et de prendre en charge l'interrogation de clés multi-API.

Introduction complète Gemini Balance est un service proxy d'API OpenAI développé sur la base du framework FastAPI, visant à fournir une gestion efficace des clés multi-API et des fonctionnalités d'optimisation. Le projet prend en charge les appels de modèle Gemini, et les principales...
Il y a 4 mois
02.9K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW : un client d'intelligence artificielle complet, léger et multiplateforme avec des plug-ins extensibles

Introduction complète AIaW (AI as Workspace) est un client d'IA de nouvelle génération conçu pour fournir des solutions complètes, légères et extensibles. La plateforme prend en charge un large éventail de fournisseurs de services, dont OpenAI, Anthropic et Google, et est capable de...
Il y a 8 mois
02.7K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词

DeepSeek Engineer : un assistant de codage expérimental basé sur l'API DeepSeek, avec des mots repères.

Description générale DeepSeek Engineer est un puissant outil d'aide à la programmation basé sur l'API DeepSeek qui interagit avec l'utilisateur par le biais d'une interface de ligne de commande intuitive pour l'aider dans une variété de tâches de développement de logiciels. L'outil combine la puissance de la modélisation du langage à grande échelle avec...
Il y a 6 mois
03K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat : Interface de chat Web simple avec modèles d'IA multiplateformes intégrés (sans déploiement)

Introduction générale OrionChat est une interface de chat en IA basée sur le web qui fournit aux utilisateurs une plateforme unifiée pour interagir avec plusieurs modèles d'IA grand public. Le projet prend en charge un large éventail de modèles d'IA, notamment Ollama (exécuté localement), OpenAI GPT, Google Gemi...
Il y a 8 mois
02.6K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit : Twitter Data Crawl and Analytics pour les données des utilisateurs et les tweets de X

Introduction générale X-Kit est un outil open source conçu pour explorer et analyser les données et les tweets des utilisateurs de X (anciennement Twitter). Développé par l'utilisateur GitHub xiaoxiunique, l'outil est conçu pour aider les utilisateurs à automatiser le processus d'obtention d'informations de base et de tweets sur un utilisateur X donné et...
Il y a 8 mois
03K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

AI2SRT : Création de courtes vidéos narrées ou de résumés vidéo pour de longues vidéos en un clic à l'aide des modèles Gemini

Introduction AI2SRT est un projet open source qui utilise le grand modèle GeminiAI pour générer en un clic de courtes vidéos narrées et des résumés vidéo pour de longues vidéos, tout en prenant en charge les sous-titres de transcription audio et vidéo. Le projet vise à simplifier le processus de création de contenu vidéo et à fournir des fonctions efficaces de génération et de traduction de sous-titres. Les utilisateurs peuvent passer...
Il y a 8 mois
03.1K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent : le modèle de langage visuel intelligent Open Source de Smart Spectrum pour l'automatisation des interfaces graphiques

Introduction complète CogAgent est un modèle de langage visuel open source développé par le groupe de recherche sur l'exploration des données de l'université de Tsinghua (THUDM), visant à automatiser le fonctionnement de l'interface utilisateur graphique (GUI) sur toutes les plates-formes. Le modèle est basé sur CogVLM (GLM-4V-9B) et prend en charge les...
Il y a 8 mois
02.9K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose : production de vidéos avec contrôle précis de la posture humaine, création de dames dansantes

Introduction générale DisPose est un projet d'intelligence artificielle open source innovant axé sur la génération d'animations d'images de personnages contrôlées. Développé par une équipe de chercheurs et mis à disposition sur GitHub, le projet utilise des techniques avancées d'apprentissage profond pour obtenir un contrôle précis de l'animation des personnages en décomposant les informations de pose du squelette.D...
Il y a 8 mois
02.5K
Smolagents : projet open source pour le développement rapide d'intelligences IA et la construction légère d'intelligences

Smolagents : projet open source pour le développement rapide d'intelligences IA et la construction légère d'intelligences

Introduction complète Smolagents est une bibliothèque d'agents intelligents légère développée par HuggingFace qui se concentre sur la simplification du processus de développement des systèmes d'agents d'intelligence artificielle. Le projet est connu pour la simplicité de sa philosophie de conception, avec seulement environ 1000 lignes de code de base, tout en offrant de puissantes capacités d'intégration de fonctionnalités. Il est le plus ...
Il y a 7 mois
04.2K
Vision Parse : Conversion intelligente de documents PDF au format Markdown à l'aide de modèles de langage visuel

Vision Parse : Conversion intelligente de documents PDF au format Markdown à l'aide de modèles de langage visuel

Introduction Vision Parse est un outil révolutionnaire de traitement de documents, il combine astucieusement la technologie la plus avancée des modèles de langage visuel (Vision Language Models), la capacité de convertir intelligemment des documents PDF en format Markdown de haute qualité...
Il y a 8 mois
02.8K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR : Projet open source de super-résolution d'images pour améliorer la qualité de la résolution d'images

Introduction générale InvSR est un projet innovant de super-résolution d'images à code source ouvert basé sur des techniques d'inversion de diffusion capables de convertir des images à faible résolution en images de haute qualité et à haute résolution. Le projet exploite la riche connaissance préalable de l'image intégrée dans les modèles de diffusion à grande échelle pré-entraînés, par le biais d'un mécanisme d'échantillonnage flexible, pour...
Il y a 8 mois
03.5K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity : modélisation autorégressive bitwise de la génération d'images à haute résolution pour une génération d'images à haute résolution illimitée

Introduction générale Infinity est un cadre révolutionnaire de génération d'images haute résolution développé par l'équipe de FoundationVision. Le projet dépasse les limites des modèles traditionnels de génération d'images grâce à une approche innovante de modélisation autorégressive visuelle au niveau du bit....
Il y a 8 mois
03.5K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme : Assistant de programmation intelligent fonctionnant dans un terminal de ligne de commande, alternative localisée à l'interprète de code ChatGPT

Introduction générale GPTMe est un outil révolutionnaire d'assistance à l'IA pour les terminaux, conçu pour améliorer l'efficacité du travail des développeurs. Il combine parfaitement de puissantes capacités d'IA avec l'environnement du terminal, prenant en charge diverses fonctions telles que l'exécution de code, l'édition de fichiers, la navigation sur le web et la reconnaissance visuelle. Comme la résolution de code ChatGPT...
Il y a 8 mois
02.9K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

ChatGPT Service Degradation Monitoring Tool : Détection des dégradations du service ChatGPT

Introduction complète L'outil de surveillance de la dégradation du service ChatGPT est un projet open source conçu pour aider les utilisateurs à détecter si leur service ChatGPT a été dégradé en raison d'IP à haut risque. L'outil analyse les valeurs de difficulté de la preuve de travail (PoW) pour déterminer si les utilisateurs...
Il y a 8 mois
02.8K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator : générateur de logos open source, utilisant l'intelligence artificielle pour générer des logos de marque professionnels

Introduction générale LogoCreator est un générateur de logos open source basé sur le modèle Together AI et Flux, qui vise à fournir des services de conception de logos rapides et professionnels pour les entreprises et les particuliers. Le projet est développé et open-source par le développeur Nutlope dans Git...
Il y a 8 mois
03.3K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG : Un cadre professionnel de questions-réponses sur les bases de connaissances pour la recherche hybride de graphes de connaissances et de vecteurs

Introduction KAG (Knowledge Augmented Generation) est un cadre de raisonnement et de recherche guidé par la forme logique, basé sur le moteur OpenSPG et les grands modèles de langage (LLM). Le cadre est spécifiquement conçu pour construire des bases de connaissances professionnelles...
Il y a 8 mois
04.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal : outil open source avancé d'intégration et d'extraction de filigranes vidéo cachés pour protéger les droits d'auteur des vidéos

Introduction générale VideoSeal est un outil de tatouage vidéo open source développé par Facebook Research, conçu pour permettre l'intégration et l'extraction efficaces de tatouages vidéo. L'outil prend en charge les modèles open source les plus récents et contient des modèles pré-entraînés, un code d'entraînement, un code d'inférence et des outils d'évaluation...
Il y a 8 mois
02.8K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库

Languine : traduction d'applications à l'aide de l'IA, compatible avec toutes les principales bibliothèques i18n

Introduction générale Languine est un puissant outil de traduction développé par Midday pour aider les développeurs à rationaliser le processus de localisation de leurs applications. Avec Languine, les développeurs peuvent tirer parti de la technologie de l'IA pour générer rapidement des traductions précises et contextualisées....
Il y a 8 mois
02.9K