Projet open source sur l'IA

Total 1020 articles
TubeTube:自部署YouTube视频下载工具

TubeTube : outil de téléchargement de vidéos YouTube à déploiement automatique

Introduction générale TubeTube est un outil open source de téléchargement de vidéos YouTube développé par MattBlackOnly. L'outil utilise yt-dlp comme moteur de téléchargement principal, supporte les téléchargements multi-threads et est capable de télécharger rapidement plusieurs vidéos en même temps. Les utilisateurs peuvent yam...
Il y a 6 mois
02.5K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch : un outil de visualisation pour le suivi et l'optimisation des processus LLM basé sur le cadre DSPy

Introduction complète LangWatch est une plateforme complète conçue pour les opérations des grands modèles de langue (LLM), offrant des services de surveillance, d'analyse, d'évaluation, de gestion des ensembles de données et d'optimisation des indices. La plateforme est basée sur le cadre DSPy de l'Université de Stanford et est conçue pour aider les utilisateurs à mieux gérer et optimiser...
Il y a 7 mois
02K
PR Agent:自动化拉取请求分析工具

PR Agent : outil d'analyse automatisée des demandes d'extraction

Introduction générale PR-Agent est un outil open source développé par Qodo pour automatiser le traitement des pull requests (demandes d'extraction) grâce à la technologie de l'IA. L'outil est capable de fournir des commentaires, des suggestions et des analyses automatisés pour aider les développeurs à effectuer des revues de code plus efficacement...
Il y a 7 mois
02.4K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT : Plate-forme Open Source de modélisation financière en Big Language pour l'analyse et la prédiction financières

Introduction générale FinGPT est une plateforme open source de modélisation des grands langages financiers développée par la Fondation AI4Finance, conçue pour le secteur financier afin de résoudre des tâches financières complexes et de stimuler l'innovation dans la fintech....
Il y a 7 mois
02.6K
Coding Agent:基于Langgraph构建的简单编程助手

Coding Agent : un assistant de programmation simple construit sur Langgraph

Introduction générale Coding Agent est un assistant de programmation intelligent développé par AbhinavTheDev, conçu pour aider les développeurs à améliorer leur efficacité de programmation. L'outil utilise la technologie de l'intelligence artificielle pour générer automatiquement du code, fournir des suggestions de programmation et aider les développeurs à...
Il y a 7 mois
02.6K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas : évaluation du rappel RAG, de la précision de l'AQ et de la corrélation des réponses

Introduction complète Ragas est un outil spécialement conçu pour évaluer et optimiser les systèmes de génération augmentée de recherche (RAG). Il fournit un ensemble complet de mesures d'évaluation en analysant les relations entre les requêtes, les contextes de recherche et les réponses générées. Ces mesures comprennent la fidélité, la pertinence de la réponse, la pertinence du contexte, l'on...
Il y a 7 mois
03K
VeighNa:国内流行的开源量化交易框架

VeighNa : un cadre de négociation quantitative open source populaire en Chine

Introduction complète VeighNa est une plateforme de trading quantitatif open source basée sur Python, développée à l'origine par des traders privés nationaux et lancée officiellement en 2015. Il a évolué d'un simple paquet d'interface de négociation à un cadre de développement de négociation entièrement fonctionnel. Les utilisateurs comprennent des fonds d'investissement privés, des certificats...
il y a 5 mois
03.8K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter : l'alternative open source et non censurée de Character.AI

Introduction générale OpenCharacter est un outil de création de personnages open source conçu pour fournir aux utilisateurs une expérience de création et d'interaction de personnages IA non filtrée et illimitée en tant qu'alternative à Character.AI. Les utilisateurs peuvent créer et faire fonctionner leurs propres personnages en utilisant des modèles natifs, ou...
Il y a 7 mois
03.6K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频

Kit de démarrage vidéo sur l'IA : création et édition de vidéos sur l'IA dans le navigateur, en toute fluidité

Introduction générale Video Starter Kit (Video Starter Kit) est un projet open source publié par fal-ai-community pour montrer comment utiliser des modèles d'IA pour la production de vidéos dans le navigateur. Il fournit des outils pour convertir des images en vidéo à partir de...
Il y a 7 mois
02.9K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot : un cadre open source pour exécuter efficacement des tâches d'IA et de traitement par lots dans n'importe quel nuage.

Introduction générale SkyPilot est un framework open source initié par le Sky Computing Lab de l'Université de Californie, Berkeley, conçu pour aider les utilisateurs à exécuter efficacement des tâches d'intelligence artificielle et de traitement par lots sur n'importe quelle infrastructure en nuage. Il prend en charge plus de 14 services en nuage (dont ...
Il y a 6 mois
02K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge : le moyen le plus rapide d'exécuter et d'affiner LLM localement !

Introduction générale LlamaEdge est un projet open source conçu pour simplifier le processus d'exécution et d'ajustement des grands modèles de langage (LLM) sur les appareils locaux ou périphériques. Le projet prend en charge la famille de modèles Llama2 et fournit des services API compatibles avec l'OpenAI qui permettent aux utilisateurs de créer et d'exécuter...
Il y a 7 mois
02.5K
AutoGen:微软开发的多智能体对话框架

AutoGen : un cadre de dialogue corporel multi-intelligent développé par Microsoft

Introduction générale AutoGen est un framework open source développé par une équipe de chercheurs de Microsoft, dont l'objectif est de simplifier la construction d'applications à grand modèle de langage (LLM) par le biais d'un dialogue corporel multi-intelligent. Il permet aux développeurs de créer des agents d'intelligence artificielle capables de dialoguer entre eux et de collaborer pour résoudre des tâches. Cette approche améliore non seulement les performances des LLM...
Il y a 7 mois
03.4K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist : plugin d'assistant web pour le dialogue avec un modèle d'IA natif et l'extraction de documents

Introduction générale Page Assist est une extension de navigateur open source conçue pour fournir aux utilisateurs un moyen facile d'interagir avec des modèles d'IA locaux. Avec cette extension, les utilisateurs peuvent ouvrir une barre latérale sur n'importe quelle page web pour interagir avec des modèles d'IA locaux....
Il y a 4 mois
04.6K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent : Collaboration multi-agents pour l'assistant d'exploitation des appareils mobiles

Introduction générale MobileAgent est un puissant assistant d'utilisation d'appareils mobiles conçu pour améliorer l'efficacité et l'automatisation de l'utilisation des appareils mobiles grâce à une collaboration multi-agents et à des modules de perception visuelle améliorés. Il est développé par l'équipe X-PLUG et supporte Android et ...
Il y a 7 mois
03.3K
Orama:高性能全文本和向量搜索引擎

Orama : un moteur de recherche performant pour les livres en texte intégral et les vecteurs

Introduction générale Orama est un moteur de recherche open source de haute performance , écrit entièrement en TypeScript , supportant la recherche plein texte , la recherche vectorielle et la recherche hybride .Orama est conçu pour fonctionner dans n'importe quel environnement d'exécution JavaScript , fournissant des ...
Il y a 7 mois
02.9K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter : outil d'édition d'images de type gribouillis alimenté par l'IA

Introduction générale FramePainter est un outil révolutionnaire d'édition d'images piloté par l'IA qui utilise une technologie de diffusion vidéo avancée et des commandes d'esquisse intuitives pour aider les utilisateurs à réaliser facilement des éditions d'images complexes. Qu'il s'agisse d'un simple ajustement ou d'une transformation créative complexe, Fr...
Il y a 7 mois
03.1K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork : un corps intelligent qui commande des ordinateurs par la voix et le texte et qui fournit un retour d'information vocal en temps réel.

Introduction générale TankWork est un agent de bureau open source conçu pour permettre à l'IA de percevoir et de contrôler votre ordinateur grâce à la vision par ordinateur et à l'interaction au niveau du système. Le cadre permet aux agents de contrôler directement les ordinateurs par le biais de commandes vocales et textuelles, de traiter le contenu de l'écran en temps réel et de fournir des...
Il y a 7 mois
02.9K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free : utilisation illimitée des IDE d'IA à l'aide d'outils d'automatisation (par exemple Cursor et Windsurf)

Description générale AI Auto Free est un puissant outil d'automatisation conçu pour aider les utilisateurs à faire un usage illimité des environnements de développement intégré (IDE) pilotés par l'IA, tels que Cursor et Windsurf. Le projet offre un support multiplateforme et inclut de multiples fonctionnalités linguistiques...
Il y a 7 mois
02.7K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm : un cadre pour la collaboration entre clusters multi-intelligents

Quantum Swarm est un cadre d'intelligence artificielle open source axé sur le développement et la recherche de l'intelligence des populations d'IA. Le projet est maintenu par l'équipe Quarm AI sur GitHub et vise à fournir une plateforme flexible et efficace pour construire et tester des systèmes multi-intelligence.Quan...
Il y a 7 mois
03.2K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG : un outil d'évaluation visuelle pour optimiser les systèmes de génération d'amélioration de la recherche.

Introduction complète XRAG (eXamining the Core) est un cadre d'analyse comparative conçu pour évaluer les composants sous-jacents des systèmes avancés de génération d'augmentation de la recherche (RAG). En profilant et en analysant chaque module de base, XRAG fournit des informations sur la manière dont les différentes configurations et les différents composants affectent...
Il y a 7 mois
02.9K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan : embellir les articles Markdown en un clic, s'adapter à de multiples formats de plates-formes multimédia (client local open source)

Introduction WenYan est un outil conçu pour la composition et l'embellissement d'articles en Markdown. Il permet de convertir des articles édités en Markdown dans un format adapté à WeChat, Zhihu, Today's headlines et d'autres plates-formes. Les utilisateurs peuvent copier l'article en un seul clic, l'article...
Il y a 7 mois
02.2K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS : Outil de résumé de la chronologie de l'actualité pour améliorer l'efficacité de la recherche d'informations et de la génération de la chronologie

Introduction générale CHRONOS est un outil de résumé chronologique des actualités développé par l'équipe NLP d'Alibaba. L'outil génère des résumés chronologiques d'événements d'actualité par le biais d'auto-questionnements itératifs. CHRONOS est non seulement capable de traiter des tâches de résumé chronologique dans un domaine ouvert, mais également en termes d'efficacité et d'évolutivité...
Il y a 7 mois
02.5K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow : contrôle le mouvement des objets dans la vidéo, en ajoutant ou en soustrayant tout objet en mouvement dans la vidéo.

Introduction générale Go-with-the-Flow est un projet open source développé par l'équipe de recherche de Netflix Eyeline Studios pour contrôler les modèles de mouvement des modèles de diffusion vidéo en déformant le bruit. Le projet permet à l'utilisateur de déterminer comment la caméra de la scène et...
Il y a 7 mois
02.5K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna : Still Portrait Reference Video Pose Generation Video to Make Missy's Photos Dance

Introduction générale X-Dyna est un projet open source développé par ByteDance qui vise à générer des animations de portraits dynamiques grâce à des techniques de diffusion sans échantillonnage. Le projet utilise les expressions faciales et les mouvements du corps dans les vidéos d'entraînement pour animer des images de portraits individuels, générant ainsi des effets de mouvement réalistes et adaptés au contexte.X-D...
Il y a 7 mois
02.7K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D) : génération d'actifs 3D haute résolution, flux de travail multiples pour la génération de matériaux 3D

Introduction complète Tencent Hunyuan3D (Hunyuan3D 2.0) est un système avancé de composition 3D à grande échelle de Tencent conçu pour générer des ressources 3D texturées en haute résolution. Le système se compose de deux éléments principaux : Hunyuan3D-DiT, un modèle de génération de formes à grande échelle, et Hunyuan3D-DiT, un modèle de...
Il y a 7 mois
03.6K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI : Construction d'un système intelligent de questions-réponses sur les documents et construction simple d'une base de connaissances privée sur le Web

Introduction complète RAG Web UI est un système de dialogue intelligent basé sur la technologie RAG (Retrieval Augmented Generation). Il aide les entreprises et les particuliers à créer des systèmes de questions-réponses intelligents basés sur leur propre base de connaissances. En combinant la recherche de documents et les modèles linguistiques, RAG Web UI fournit des réponses précises et...
Il y a 7 mois
02.6K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop : Application Intelligentsia de bureau pour contrôler les ordinateurs à l'aide du langage naturel

Introduction générale UI-TARS Desktop est une application d'agent d'interface graphique basée sur UI-TARS (Visual Language Model) développée par ByteDance. L'application permet aux utilisateurs de contrôler les ordinateurs par le biais du langage naturel pour une interaction homme-machine plus intuitive et plus efficace....
Il y a 7 mois
03.1K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix : emballage de la base de code dans un fichier texte pour la récupération de modèles de grande taille

Introduction générale Repomix (anciennement connu sous le nom de Repopack) est un outil open source conçu pour empaqueter une base de code entière dans un fichier unique, adapté à l'IA. Cet outil permet aux développeurs de mettre facilement leur base de code à la disposition de grands modèles de langage (tels que Claude, Chat...
Il y a 7 mois
03.3K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek : lecture des fichiers texte du dépôt git et découpage rapide pour les modèles de grande taille

Introduction générale Yek est un outil rapide basé sur Rust pour lire des fichiers texte à partir de dépôts ou de répertoires, les découper et les sérialiser pour les utiliser dans de grands modèles de langage (LLM). L'outil utilise la règle .gitignore par défaut pour ignorer les fichiers inutiles, et utilise...
Il y a 7 mois
03K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish : intelligences multirôles examinant, validant et formatant les résultats pour produire des résultats de haute qualité

Introduction complète Kheish est un agent multirôle open source conçu pour les tâches de modélisation des grands langages (LLM) qui nécessitent une collaboration structurée, étape par étape. Kheish est plus qu'un simple coordinateur, c'est un agent intelligent à part entière, qui demande des modules à la demande, intègre des...
Il y a 7 mois
02.8K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft : un outil polyvalent de création de contenu IA pour générer des histoires courtes, des scripts de dialogue, des voix off et des graphiques.

Description générale AI ContentCraft est un outil de création de contenu polyvalent qui intègre la génération de texte, la synthèse vocale, la génération d'images et bien plus encore. Il aide les créateurs à générer rapidement des histoires, des scripts de podcast et du contenu audio et vidéo d'accompagnement. L'outil prend en charge les conversions de langues multiples et peut...
Il y a 7 mois
03K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph : construction de graphes de connaissances et de moteurs de recherche personnels exécutés localement

Introduction générale Unigraph est un graphe de connaissances et un moteur de recherche personnel local et polyvalent conçu pour fournir aux utilisateurs un espace de travail intégré qui les aide à gérer et à rechercher une grande variété de données dans leur vie personnelle. Avec Unigraph, les utilisateurs peuvent intégrer des données provenant de différentes sources dans un...
Il y a 7 mois
02.7K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js : un plugin open source qui permet de tester l'automatisation des navigateurs grâce à l'IA

Introduction générale Midscene.js est un outil d'automatisation de navigateur alimenté par l'IA qui contrôle les pages web, effectue des assertions et extrait des données par le biais de commandes en langage naturel. Il prend en charge les extensions Chrome, les SDK JavaScript et les scripts YAML, simplifiant ainsi la mesure de l'interface utilisateur...
Il y a 7 mois
03.4K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Analyseur vidéo : analyse le contenu des vidéos et génère des descriptions détaillées

Comprehensive Introduction Video Analyzer est un outil d'analyse vidéo complet qui combine des techniques de vision par ordinateur, de transcription audio et de traitement du langage naturel pour générer des descriptions détaillées du contenu vidéo. L'outil transcrit le contenu audio en extrayant les images clés de la vidéo...
Il y a 6 mois
04.2K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB : système de base de connaissances AI Q&A prêt à l'emploi pour un service client intelligent et une base de connaissances interne

Introduction MaxKB (Max Knowledge Base) est un système de questions-réponses de base de connaissances open source basé sur de grands modèles de langage et RAG (Retrieval Augmented Generation). Le système est largement utilisé dans le service client intelligent, la base de connaissances interne de l'entreprise, la recherche universitaire, l'éducation et d'autres scénarios.
Il y a 7 mois
03.6K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink : un cadre de rédaction pour générer des essais longs et de qualité, en recherchant des connaissances externes, puis en y réfléchissant et en construisant un arbre de connaissances étape par étape.

Introduction OmniThink est un cadre innovant de rédaction automatique conçu pour générer des essais longs de haute qualité en imitant l'expansion itérative et la réflexion des processus cognitifs humains. L'objectif est de repousser les limites de la connaissance et de générer des informations riches et profondes....
Il y a 7 mois
02.6K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents : A Multi-Intelligent Body Speech Interaction Application (OpenAI Example)

Introduction générale OpenAI Realtime Agents est un projet open source qui vise à montrer comment l'API temps réel d'OpenAI peut être utilisée pour construire des applications vocales multi-intelligentes. Il fournit un modèle de corps intelligent de haut niveau (emprunté à OpenAI Swarm) qui permet...
Il y a 7 mois
03.5K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库

DeepFace : une bibliothèque Python légère pour la reconnaissance faciale de l'âge, du sexe, des émotions et de la race

Introduction générale DeepFace est une bibliothèque Python légère pour la reconnaissance faciale et l'analyse des attributs faciaux (y compris l'âge, le sexe, l'émotion et l'ethnicité). Elle intègre plusieurs modèles avancés de reconnaissance faciale tels que VGG-Face, FaceNet, OpenFace, De...
Il y a 7 mois
03.3K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight : rendu d'images de portraits en lumière naturelle (non publié)

Description générale SynthLight est un outil d'éclairage de portraits basé sur un modèle de diffusion. Il apprend à recalculer des images de visages synthétiques pour obtenir des ajustements d'effets d'éclairage sur des photos de portraits réels. L'outil utilise un moteur de rendu physique pour générer des ensembles de données qui simulent des transformations d'éclairage dans différentes conditions d'éclairage...
Il y a 7 mois
03.3K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox : PDF, DOCX, conversion d'images en Markdown, modèle visuel OCR de haute précision

Introduction générale Zerox est un projet open source conçu pour convertir des documents PDF, DOCX, des images et d'autres documents au format Markdown par le biais de modèles visuels. Le projet est développé par l'équipe getomni-ai et fournit une solution OCR (Optical Character Recognition) simple et efficace....
Il y a 7 mois
03.3K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla : un outil de chat minimaliste basé sur des points d'accès avec une intégration native au backend d'Ollama.

Description générale Charla est une application de chat basée sur un point d'accès et conçue pour engager un dialogue avec des modèles de langue maternelle. L'application s'intègre au backend Ollama, prend en charge le dialogue contextuel et enregistre les sessions de chat sous forme de fichiers Markdown. Les utilisateurs peuvent simplement...
Il y a 7 mois
02.9K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG : Cadre de génération amélioré pour la recherche simplifiée, index de graphe d'entité rappelant les blocs de texte pertinents.

Une introduction complète MiniRAG est un cadre extrêmement simple de Génération Augmentée de Récupération (GAR) qui vise à permettre de bonnes performances de GAR même pour les petits modèles grâce à l'indexation de graphes hétérogènes et à la récupération topologique légère. Il a été développé par le Data Science Laboratory de l'Université de Hong Kong (HKUDS) pour ...
Il y a 7 mois
03.4K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT : un grand modèle multimodal pour la compréhension des régions d'images et de vidéos afin d'améliorer l'analyse du contenu visuel

Introduction complète Omni-RGPT est un modèle de langage multimodal à grande échelle conçu pour permettre la compréhension des images et des vidéos au niveau de la région. En introduisant la technique de la marque de jeton, Omni-RGPT est capable de mettre en évidence des régions cibles dans l'espace des caractéristiques visuelles avec des...
Il y a 7 mois
02.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing : un assistant de dialogue vocal open source à faible latence pour la conversation et la communication naturelles

Introduction Bailing (Bailing) est un assistant de dialogue vocal open source conçu pour engager un dialogue naturel avec les utilisateurs par le biais de la parole. Le projet combine les technologies de reconnaissance vocale (ASR), de détection de l'activité vocale (VAD), de modélisation du langage (LLM) et de synthèse vocale (TTS) pour...
Il y a 7 mois
03.3K
元界AI:开源版AI数字人克隆与短视频生成工具

Metaverse AI : Version Open Source de l'outil de clonage humain numérique et de génération de courtes vidéos par l'IA

Introduction complète Metaverse AI (version open source) est un projet hébergé sur GitHub, développé par l'équipe libn-net. Il permet de cloner des images et des voix humaines numériques grâce à la technologie de l'IA afin de générer de courtes vidéos, et prend également en charge le doublage et le sous-titrage. Cet outil fournit des...
il y a 5 mois
01.7K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat : un outil de chat pour la recherche de connaissances à partir des données de Wikipedia

Introduction générale WikiChat est un chatbot expérimental développé à l'Université de Stanford qui vise à améliorer la factualité des grands modèles de langage en récupérant des données de Wikipedia. Les grands modèles de langage (tels que ChatGPT et GPT-4) ont tendance à traiter les informations les plus récentes ou les sujets les moins...
Il y a 7 mois
02.2K
AIEvo:创建多智能体协作应用的高效框架

AIEvo : Un cadre efficace pour la création d'applications collaboratives multi-intelligentes

Introduction générale AIEvo est un framework multi-agent open source d'Ant Group conçu pour créer efficacement des applications multi-agents. Le framework suit strictement le graphe de tâches SOP afin d'améliorer le taux de réussite de l'exécution des tâches complexes, et assure une grande flexibilité et évolutivité grâce à des mécanismes de feedback et de surveillance...
Il y a 7 mois
02.5K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent : génération et évaluation automatiques de présentations PPT, de documents à PPT

Introduction générale PPTAgent est un système innovant conçu pour générer automatiquement des présentations à partir de documents. Le système s'inspire de l'approche humaine de la création de présentations, en utilisant un processus en deux étapes pour garantir la qualité du contenu et l'impact visuel. De plus, PPTAgent introduit PPTEval, un outil complet de...
Il y a 7 mois
02.9K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI : Construction d'une interface glisser-déposer de nœuds pour des applications LLM personnalisées

Introduction générale FlowiseAI est un outil open source à code bas conçu pour aider les développeurs à créer des applications LLM (Large Language Model) personnalisées et des agents d'intelligence artificielle. Grâce à une interface simple de type "glisser-déposer", les utilisateurs peuvent rapidement créer et itérer sur des applications LLM, rendant ainsi le processus de test à la production plus efficace...
Il y a 7 mois
03.1K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT : outil de conversion de la parole en texte en temps réel pour la reconnaissance vocale en continu à faible latence basé sur Whisper

Introduction générale RealtimeSTT est une bibliothèque de conversion de la parole vers le texte en temps réel, efficace et à faible latence, avec une détection avancée de l'activité vocale et l'activation des mots de réveil. Elle a été développée par Kolja Beigel pour soutenir les applications qui nécessitent une conversion rapide et précise...
Il y a 7 mois
03K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash : Mise en œuvre rapide de la déduplication sémantique du texte pour améliorer l'efficacité du nettoyage des données

Introduction complète SemHash est un outil léger et flexible pour dédupliquer des ensembles de données par similarité sémantique. Il combine la génération rapide d'embedding de Model2Vec avec la recherche de similarité ANN (approximate nearest neighbour) de Vicinity....
Il y a 7 mois
02.8K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita : un cadre open source pour construire des applications RAG modulaires et tester rapidement diverses stratégies RAG

Introduction complète Cognita est un framework open source développé par TrueFoundry pour simplifier le développement d'applications basées sur RAG (Retrieval-Augmented Generation). Le framework fournit une approche structurée, mod...
Il y a 7 mois
03K
BotSharp:基于.NET的多智能体AI应开发与管理平台

BotSharp : une plateforme de développement et de gestion d'IA multi-intelligence basée sur .NET

Introduction complète BotSharp est un projet open source basé sur .NET Core dédié à fournir un outil complet de construction de plateforme de chatbot IA. Il utilise la programmation C#, supporte les opérations multiplateformes et vise à simplifier l'application des algorithmes d'apprentissage automatique, permettant aux développeurs...
Il y a 7 mois
02.9K
OmAgent:构建多模态智能设备的智能体框架

OmAgent : un corps intelligent pour la construction d'appareils intelligents multimodaux

Introduction OmAgent est un cadre multimodal de corps intelligent développé par Om AI Lab, visant à fournir de puissantes fonctionnalités alimentées par l'IA pour les appareils intelligents. En intégrant des modèles de base multimodaux et des algorithmes de corps intelligents de pointe, le projet permet aux développeurs de créer des appareils intelligents efficaces sur une variété de...
Il y a 7 mois
02.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit : un ensemble complet d'outils pour la construction d'intelligences IA basées sur LangGraph

Introduction complète Le AI Agent Service Toolkit est un ensemble d'outils complet basé sur LangGraph, FastAPI et Streamlit, conçu pour aider les développeurs à créer et à exécuter rapidement des services d'agents d'intelligence artificielle. La boîte à outils fournit...
Il y a 7 mois
02.7K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora : construction de modules de mémoire d'IA humanisés pour enregistrer et mettre à jour des informations sur les interactions avec les humains

Introduction générale Memora est un agent conçu pour reproduire les souvenirs humains pour chaque IA personnalisée. Il aide les IA à se souvenir des détails des interactions passées, des émotions et des expériences partagées, comme le font les humains, grâce à des fonctionnalités telles que les souvenirs horodatés, les marqueurs d'émotions et les souvenirs multimodaux....
Il y a 7 mois
03K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

Micro agent : intelligence de programmation IA qui génère automatiquement du code, le teste et le corrige.

Introduction générale Micro-Agent est un assistant de codage IA open source développé par Builder.io, conçu pour fournir aux développeurs la possibilité de générer et de tester automatiquement du code. Il génère des cas de test en comprenant les descriptions en langage naturel et itère le code jusqu'à ce que tous les tests soient réussis, réduisant ainsi les...
Il y a 7 mois
03.2K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko : Workflows intelligents en langage naturel pour l'automatisation des postes de travail et des navigateurs

Introduction générale Eko est un framework JavaScript de niveau production conçu pour construire des flux de travail d'agents intelligents efficaces par le biais de descriptions en langage naturel. Il est conçu pour permettre aux développeurs d'automatiser des tâches quotidiennes à l'aide de technologies d'IA sans programmation profonde....
il y a 5 mois
02.7K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox : une interface de gestion pour l'interaction homme-machine avec les intelligences IA

Introduction générale Agent Inbox est un projet open source développé par l'équipe LangChain pour fournir une nouvelle expérience utilisateur pour interagir avec des intelligences IA. Le projet permet aux utilisateurs de gérer et d'optimiser les interactions avec plusieurs intelligences IA à travers une interface centralisée.Ag...
Il y a 7 mois
02.6K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent : un assistant intelligent pour les médias sociaux qui génère et gère automatiquement le contenu des médias sociaux.

Introduction générale Social Media Agent (Social Media Agent) est un projet open source qui gère les informations d'interaction par la nouvelle boîte de réception de l'agent, conçue pour aider les utilisateurs à automatiser la génération et la gestion du contenu des médias sociaux. Le projet est développé par l'équipe LangChain...
Il y a 7 mois
02.7K
Executive AI Assistant:AI行政助理,提醒阅读邮件并规划工作日程

Assistant exécutif AI : assistant exécutif AI, rappels pour lire les courriels et planifier les horaires de travail.

Introduction générale Executive AI Assistant (EAIA) est un outil d'assistance basé sur l'IA conçu pour aider les utilisateurs à automatiser et à gérer leurs tâches quotidiennes. Développé par LangChain, l'outil est capable de traiter les courriels, de planifier, de gérer des tâches et d'autres...
Il y a 7 mois
02.8K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia : un outil de coloriage automatisé pour colorer rapidement des dessins au trait en noir et blanc.

Introduction complète MangaNinjia est un projet open source développé par Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), qui se concentre sur le traitement automatisé de la coloration des dessins au trait. Cet outil permet de faire correspondre avec précision les couleurs des images de référence grâce à des techniques d'apprentissage...
Il y a 7 mois
02.6K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez : générer des livres audio, convertir des livres électroniques en livres audio avec Kokoro

Introduction générale Audiblez est un projet open source conçu pour convertir les livres électroniques (format .epub) en livres audio (format .m4b). Le projet utilise la technologie de synthèse vocale de haute qualité de Kokoro pour prendre en charge plusieurs langues et plusieurs voix. Les utilisateurs peuvent simplement...
Il y a 7 mois
03.4K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Recherche o1 : Permettre aux modèles d'inférence d'effectuer des recherches actives, en permettant aux grands modèles de rechercher des connaissances externes tout en réfléchissant.

Introduction Search-o1 est un projet open source qui vise à améliorer les performances des modèles de raisonnement à grande échelle (LRM) en intégrant des mécanismes de recherche avancés. L'idée centrale est de résoudre le problème du déficit de connaissances rencontré dans le processus de raisonnement par le biais de la recherche dynamique et de l'intégration des connaissances. Le projet est sponsorisé par sunn...
Il y a 7 mois
02.4K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2 : Générer et publier automatiquement des vidéos courtes sur YouTube et du contenu sur Twitter

Introduction générale MoneyPrinter V2 est un projet open source développé par FujiwaraChoki pour aider les utilisateurs à gagner de l'argent en ligne grâce à l'automatisation. Le projet intègre principalement l'automatisation de Twitter, la génération de courtes vidéos YouTube et le camping affilié...
Il y a 7 mois
03.5K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator : une application de traduction vocale en temps réel pour Android, gratuite et hors ligne !

Introduction générale RTranslator est une application de traduction en temps réel hors ligne, gratuite et virtuellement open source, conçue pour les appareils Android. Les utilisateurs peuvent garder leur téléphone dans leur poche en connectant un casque Bluetooth et avoir une conversation avec d'autres personnes comme s'ils parlaient leur propre langue.RTransla...
Il y a 7 mois
03.2K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser : Génération de code d'automatisation du navigateur pour transformer les actions de la souris en scripts Selenium Python via l'IA

Introduction générale AutoMouser est une extension Chrome qui suit intelligemment les interactions de l'utilisateur et génère automatiquement du code de test Selenium en utilisant les modèles GPT d'OpenAI. Pour ce faire, il enregistre les actions du navigateur de l'utilisateur et les convertit...
Il y a 7 mois
02.8K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna : Utilisation des techniques RAG pour générer des requêtes SQL précises à partir de texte

Introduction complète Vanna est un framework Python open source sous licence MIT qui permet de générer des requêtes SQL grâce aux techniques RAG (Retrieval Augmented Generation). Les utilisateurs peuvent entraîner des modèles RAG, les appliquer à leurs propres données, puis poser des questions, et Vanna retournera les s...
Il y a 7 mois
02.7K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR : Un cadre unifié pour l'implémentation de la réparation de visages vidéo, la réparation de vidéos en noir et blanc, de portraits flous et de vieilles vidéos

Introduction SVFR (Stable Video Face Restoration) est un cadre unifié pour la restauration de visages vidéo qui prend en charge la restauration de base des visages (BFR), la coloration, la réparation et leurs tâches combinées. Le cadre utilise des antécédents génératifs et cinématiques en unifiant...
Il y a 7 mois
03.6K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking : système numérique interactif en temps réel à source ouverte, permettant d'établir un dialogue audio et vidéo synchrone.

Introduction détaillée LiveTalking est un système humain numérique interactif en temps réel à code source ouvert, qui s'engage à construire une solution humaine numérique en direct de haute qualité. Le projet utilise le protocole open source Apache 2.0, intégré avec un certain nombre de technologies de pointe, y compris le rendu ER-NeRF, le traitement de flux audio et vidéo en temps réel ...
Il y a 7 mois
03.9K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider : outil d'aide à la programmation open source, utilisation d'un assistant IA pour l'écriture de code et l'édition de fichiers

Introduction générale Aider est un puissant assistant de programmation IA open source qui aide les développeurs à écrire, éditer et remanier le code par le biais d'un dialogue en langage naturel. En tant qu'outil interactif de programmation en binôme, Aider prend en charge de nombreux langages de programmation majeurs et peut être intégré de manière transparente dans Git...
Il y a 4 mois
03K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen : Outil d'édition vidéo parlant de portraits en 3D, piloté par l'audio et conscient de la profondeur

Introduction JoyGen est un cadre innovant de génération vidéo en deux étapes pour les visages parlants, qui se concentre sur la résolution du problème de la génération d'expressions faciales pilotée par l'audio. Développé par une équipe de Jingdong Technology, il utilise des techniques avancées de reconstruction 3D et des méthodes d'extraction de caractéristiques audio pour capturer avec précision les caractéristiques de l'identité du locuteur et l'expression...
Il y a 7 mois
02.8K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR : logiciel de suppression de filigrane vidéo sans perte et de sous-titres en dur (client de suppression de filigrane vidéo 7G+).

Introduction complète Video Subtitle Remover (Video-subtitle-remover, ou VSR en abrégé) est un logiciel de traitement vidéo basé sur la technologie de l'intelligence artificielle, spécialement conçu pour supprimer les sous-titres et les filigranes des vidéos. L'outil utilise une variété de modèles d'algorithmes d'IA (STTN, L...
Il y a 7 mois
03.5K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader : Téléchargez rapidement la vidéo WeChat Video No., supporte plusieurs formats et plateformes.

Introduction complète WeChat Video No. Downloader est un projet open source conçu pour aider les utilisateurs à télécharger rapidement du contenu vidéo à partir des numéros vidéo WeChat. L'outil prend en charge une variété de formats vidéo et de plateformes, et les utilisateurs peuvent facilement l'utiliser sur les systèmes Windows et macOS. Le projet est développé par ltaoo et hébergé sur...
Il y a 7 mois
02.7K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent : intelligences interactives automatisées des médias sociaux qui recherchent, aiment et laissent des messages automatiquement.

Introduction générale Riona-AI-Agent est un outil d'automatisation innovant alimenté par l'IA et spécialement conçu pour gérer et optimiser les opérations des principales plateformes de médias sociaux. Le projet utilise des modèles d'IA avancés pour des plateformes telles qu'Instagram, Twitter et GitHub afin de fournir...
Il y a 7 mois
08.5K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest : analyse de documents au format complexe, extraction de données multimodales en métadonnées et en texte

Introduction complète NV Ingest (NVIDIA Ingest) est une suite de microservices en accès anticipé conçus pour analyser des centaines de milliers de PDF non structurés complexes et désordonnés et d'autres documents d'entreprise. Il peut convertir ces documents en métadonnées et en texte pour les intégrer dans des...
Il y a 7 mois
03K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI : un cadre open source pour l'exécution d'intelligences IA pour naviguer sur le web, permettant à l'IA de manipuler automatiquement les pages web.

Introduction générale Browser Use Web UI est un projet open source innovant visant à fournir aux agents d'intelligence artificielle des capacités d'interaction avec le navigateur en tant qu'outil d'interface graphique. Le projet s'appuie sur le framework browser-use core, construit avec Gradio ...
Il y a 2 mois
04.4K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIA et LangChain lancent un guide avancé sur la rédaction de rapports structurés pour l'analyse, permettant de générer des rapports techniques pilotés par l'IA.

Introduction générale Il s'agit d'un projet de génération de rapports structurés co-développé par LangChain et NVIDIA, présenté dans un tutoriel Jupyter notebook sur GitHub. Le projet utilise des techniques d'IA avancées, en particulier Llama-3.3-7...
Il y a 4 mois
02.4K
BrownChat:开源实时语音聊天的AI助手

BrownChat : assistant IA open source de chat vocal en temps réel

Introduction générale BrownChat est une application de chat audio en temps réel basée sur la technologie LLM (Large Language Modelling). Développé par l'utilisateur GitHub sugarforever, le projet vise à améliorer l'expérience de communication de l'utilisateur grâce à une technologie avancée de traitement du langage naturel.B...
Il y a 7 mois
02.4K
Lecca:无代码构建AI智能体与AI工作流构建平台

Lecca : Construire une intelligence de l'IA et un flux de travail de l'IA Construire des plates-formes sans code

Introduction Lecca est une plateforme d'IA puissante qui permet aux utilisateurs de configurer et de déployer de grands modèles de langage (LLM) à l'aide de plusieurs outils et flux de travail. Les utilisateurs peuvent facilement construire, personnaliser et automatiser leurs agents d'IA...
il y a 5 mois
02.5K