Projet open source sur l'IA

Total 1020 articles

mettre en ordre

IMS Toucan : outil de synthèse vocale multilingue rapide et contrôlable (plus de 7000 langues prises en charge)

Introduction générale IMS Toucan est une boîte à outils de synthèse vocale de pointe développée par l'Institut de traitement du langage naturel (IMS) de l'Université de Stuttgart, en Allemagne. Cette boîte à outils prend en charge plus de 7 000 langues. Elle est rapide, contrôlable et peu gourmande en ressources informatiques....

Il y a 6 mois

03.1K

LocalGPT : garantir la confidentialité des données en s'adressant à plusieurs documents sur des appareils locaux

Introduction générale LocalGPT est un projet open source conçu pour permettre aux utilisateurs de dialoguer avec des documents sur des appareils locaux, tout en garantissant la confidentialité des données. En utilisant divers modèles open source, LocalGPT peut traiter et comprendre le contenu des documents sans télécharger les données dans le nuage. Le projet supporte une variété de p...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Recherche de connaissances et cadre RAG

Il y a 8 mois

03.1K

LivePortrait : Outil d'animation pour générer des portraits dynamiques à partir d'images fixes et de vidéos

Introduction générale LivePortrait est un outil avancé d'animation de portraits dynamiques développé par Racer Technology. Il utilise une technologie d'IA innovante pour transformer des images fixes en animations vidéo vivantes. Que vous utilisiez des photos réelles, des styles d'animation ou des portraits artistiques, LivePo...

Dernières ressources sur l'IA # AI Image to Video # AI Java Open Source Projecct # AI Video Conversion Style

Il y a 9 mois

03.1K

Quantum Swarm : un cadre pour la collaboration entre clusters multi-intelligents

Quantum Swarm est un cadre d'intelligence artificielle open source axé sur le développement et la recherche de l'intelligence des populations d'IA. Le projet est maintenu par l'équipe Quarm AI sur GitHub et vise à fournir une plateforme flexible et efficace pour construire et tester des systèmes multi-intelligence.Quan...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Cadre de développement de l'organisme intelligent

Il y a 7 mois

03.1K

Agent.exe : Laissez l'IA contrôler directement votre ordinateur, une implémentation open source de l'ordinateur de contrôle de Claude.

Description générale Agent.exe est une application Electron open source qui utilise l'API Sonnet Claude 3.5 d'Anthropic pour permettre aux utilisateurs de contrôler leurs ordinateurs locaux directement par le biais de l'IA. Le projet a été développé par K...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Desktop Automation Intelligence

Il y a 8 mois

03.1K

AnyText : génère et édite du texte multilingue dans l'image, avec la possibilité de générer plusieurs lignes de chinois dans l'image.

Introduction complète AnyText est un outil révolutionnaire de génération et d'édition de textes visuels multilingues, développé sur la base du modèle de diffusion. Il génère des textes multilingues naturels et de haute qualité dans des images et offre des capacités d'édition de texte flexibles. Il a été développé par une équipe de chercheurs et présenté à l'ICLR 2024...

Dernières ressources sur l'IA # AI Aides à la génération d'images # AI Image Style Control # AI Java Open Source Projecct

Il y a 7 mois

03.1K

AutoGPT : Plate-forme intelligente de construction de corps pour l'automatisation des flux de travail et l'exécution autonome des tâches

Introduction complète AutoGPT est une plateforme puissante conçue pour aider les utilisateurs à créer, déployer et gérer des agents d'intelligence artificielle fonctionnant en continu et à automatiser des flux de travail complexes. Développée par Significant Gravitas, la plateforme offre une large gamme d'outils et de fonctionnalités qui permettent aux utilisateurs de se concentrer...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Flux de travail à code bas # Cadre de développement de l'organisme intelligent

Il y a 8 mois

03.1K

Browse AI : extraire et surveiller des données structurées sans code

Présentation de Browse Browse AI est un logiciel d'automatisation web basé sur le cloud, sans codage, conçu pour aider les utilisateurs à extraire et à surveiller les données de n'importe quel site web sans programmation. Vous pouvez former un robot pour qu'il effectue des tâches d'extraction de données, de surveillance et d'automatisation en un seul point de la souris...

Dernières ressources sur l'IA # AI Open Services # AI Java Open Source Projecct # Pas de développement de code

Il y a 11 mois

03.1K

AIstudioProxyAPI：无限使用 Gemini 2.5 Pro 模型 API

AIstudioProxyAPI : Utilisation illimitée des API du modèle Gemini 2.5 Pro

Introduction complète AIstudioProxyAPI est un projet open source qui utilise Node.js et la technologie Playwright pour émuler l'API OpenAI en imitant la version web Google AI Studio de...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Free Large Model API

Il y a 3 mois

03K

RAGLite : un outil efficace de génération d'augmentation de la recherche (RAG) qui prend en charge plusieurs bases de données et modèles linguistiques.

Introduction générale RAGLite est une boîte à outils Python pour Retrieval Augmented Generation (RAG) qui prend en charge les bases de données PostgreSQL ou SQLite. Il offre des options de configuration flexibles qui permettent aux utilisateurs de choisir différents modèles de langage et réorganisateurs...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Recherche de connaissances et cadre RAG

Il y a 9 mois

03K

Linly-Dubbing : Outil intelligent de doublage/traduction multilingue de vidéos par l'IA

Introduction complète Linly-Dubbing est un outil de doublage et de traduction multilingue intelligent conçu pour fournir aux utilisateurs des services de doublage vidéo et de traduction de sous-titres multilingues de haute qualité grâce à l'intégration d'une technologie d'intelligence artificielle avancée. Cet outil est particulièrement adapté à l'éducation internationale, à la localisation de contenu global et à d'autres scénarios, aidant...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Traduction

Il y a 7 mois

03K

Flying Paddle PP-TableMagic : Extraction d'informations structurées pour les tableaux complexes

L'objectif de la reconnaissance de tableaux est d'analyser les tableaux dans les images, d'identifier avec précision les structures des tableaux et l'emplacement des cellules, et de les réduire à des formats de tableaux structurés (par exemple, HTML). À l'ère de l'information, un grand nombre de données tabulaires importantes existent encore à l'état non structuré (par exemple, des documents scannés avec des images de tableaux statistiques...).

Dernières ressources sur l'IA # AI Java Open Source Projecct # Extraction et nettoyage de documents

il y a 5 mois

03K

DeepSeek-VL2 : un modèle expert de langage visuel pour une compréhension multimodale avancée

Introduction complète DeepSeek-VL2 est une série de modèles avancés de langage visuel avec mélange d'experts (MoE) qui améliorent de manière significative les performances de son prédécesseur, DeepSeek-VL. Les modèles sont utiles pour les questions-réponses visuelles, la reconnaissance...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Produits multimodaux interactifs en temps réel

Il y a 6 mois

03K

wechat-article-exporter：一键部署微信公众号文章批量导出工具

wechat-article-exporter : déploiement en un clic de l'outil d'exportation par lots d'articles de numéros publics wechat

Introduction complète wechat-article-exporter est un outil open source conçu pour aider les utilisateurs à exporter par lots les articles du numéro public WeChat. L'outil prend en charge l'exportation de l'audio et de la vidéo intégrés dans l'article sans créer d'environnement, peut restaurer le style de l'article, et prend en charge les parties privées....

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 10 mois

03K

FiveThirtyNine : Prédire la probabilité d'événements futurs sur la base de la connaissance de la recherche

Introduction générale Forecast AI est une superbe plateforme de prévision basée sur une technologie avancée d'intelligence artificielle. Elle utilise de puissants algorithmes d'analyse de données et d'apprentissage automatique pour fournir aux utilisateurs des prédictions très précises sur les événements futurs. Qu'il s'agisse d'élections politiques, de tendances économiques ou d'événements sociaux, Forecast ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI outil de recherche

Il y a 11 mois

03K

GraphRAG Visualizer：可视化和探索Microsoft GraphRAG工件的工具

GraphRAG Visualizer : un outil pour visualiser et explorer les artefacts Microsoft GraphRAG

Introduction générale GraphRAG Visualizer est un outil en ligne conçu pour aider les utilisateurs à visualiser et à explorer les artefacts de Microsoft GraphRAG. En téléchargeant Par...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Knowledge Graph

Il y a 8 mois

03K

olmOCR : conversion de documents PDF en texte, prise en charge des tableaux, des formules et de la reconnaissance du contenu manuscrit

Introduction générale olmOCR est un outil open source développé par l'équipe AllenNLP de l'Allen Institute for Artificial Intelligence (AI2) qui se concentre sur la conversion de fichiers PDF...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Extraction et nettoyage de documents

Il y a 6 mois

03K

infinite-zoom-stable-diffusion：生成无限缩放循环视频

infinite-zoom-stable-diffusion : générer une vidéo en boucle avec un zoom infini

Introduction complète Infinite Zoom Stable Diffusion (Infinite Zoom Stable Diffusion) est un projet open source conçu pour créer des vidéos à zoom infini en utilisant des techniques de diffusion stable. Le projet fournit un cahier Colab facile à utiliser, les utilisateurs peuvent ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Video Conversion Style

Il y a 7 mois

03K

PhiData : construire des intelligences IA avec de la mémoire, des connaissances et des outils

Introduction complète PhiData est un framework conçu pour développer des assistants intelligents. Il permet aux assistants intelligents d'engager des conversations à long terme, de fournir un contexte commercial précis et d'effectuer diverses opérations grâce à une mémoire améliorée, à l'intégration des connaissances et à des capacités d'invocation d'outils.

Dernières ressources sur l'IA # AI Java Open Source Projecct # Application de l'organisme intelligent

il y a 5 mois

03K

Seed-VC : permet la conversion en temps réel de la parole et de la chanson avec moins d'échantillons

Introduction générale Seed-VC est un projet open source sur GitHub, développé par Plachtaa. Il peut utiliser une référence audio de 1 à 30 secondes, une conversion rapide de la parole ou de la chanson, sans formation supplémentaire. Le projet supporte la conversion de la voix en temps réel, le retard ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Clonage vocal AI

il y a 5 mois

03K

Vision is All You Need：使用视觉语言模型构建智能文档检索系统（Vision RAG）

Vision is All You Need : Building an Intelligent Document Retrieval System Using Visual Language Models (Vision RAG) (La vision est tout ce dont vous avez besoin : construire un système intelligent de recherche de documents en utilisant des modèles de langage visuel)

Introduction globale Vision-is-all-you-need est un projet de démonstration d'un système visuel innovant RAG (Retrieval Augmented Generation) qui innove en appliquant la modélisation du langage visuel (VLM) au domaine du traitement des documents. Contrairement aux méthodes traditionnelles de regroupement de textes, le système permet directement...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de résumé de texte AI et d'audio/vidéo # Recherche de connaissances et cadre RAG

Il y a 7 mois

03K

Robo Blogger：基于LangGraph将语音内容生成博客文章，自动化写作博客

Robo Blogger : génération d'articles de blog à partir de contenu vocal basé sur LangGraph, rédaction automatisée de blogs

Introduction générale Robo Blogger est un outil de création de blog innovant conçu pour simplifier le processus de génération de contenu grâce à la technologie speech-to-text. Les utilisateurs peuvent enregistrer des idées par le biais de n'importe quelle application de synthèse vocale, et Robo Blogger transforme ces idées en contenu de blog structuré...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de résumé de texte AI et d'audio/vidéo

Il y a 8 mois

03K

Ragas : évaluation du rappel RAG, de la précision de l'AQ et de la corrélation des réponses

Introduction complète Ragas est un outil spécialement conçu pour évaluer et optimiser les systèmes de génération augmentée de recherche (RAG). Il fournit un ensemble complet de mesures d'évaluation en analysant les relations entre les requêtes, les contextes de recherche et les réponses générées. Ces mesures comprennent la fidélité, la pertinence de la réponse, la pertinence du contexte, l'on...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Recherche de connaissances et cadre RAG

Il y a 7 mois

03K

DH live : AI digital people pour une interaction fluide en temps réel sur les cartes graphiques de la série 30/40

Introduction générale DH_live est un projet d'humain numérique en temps réel basé sur l'apprentissage par échantillonnage, visant à fournir aux utilisateurs une expérience de streaming en direct fluide et interactive. Le projet est compatible avec les cartes graphiques NVIDIA des séries 30 et 40 et est capable de fonctionner en temps réel à plus de 25 images par seconde. Les utilisateurs peuvent...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Digital Man

Il y a 9 mois

03K

Xorbits Inference : déploiement en un clic de plusieurs modèles d'IA, un cadre d'inférence distribué

Introduction complète Xorbits Inference (Xinference) est un cadre d'inférence distribué puissant et complet qui prend en charge l'inférence pour une large gamme de modèles d'intelligence artificielle tels que les grands modèles de langage (LLM), les modèles de reconnaissance vocale et les modèles multimodaux. Avec Xorbits I...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 11 mois

03K

VITA : Open Source Multimodal Large Language Models for Real-Time Visual and Speech Interaction (modèles multimodaux de langage à grande échelle pour l'interaction visuelle et vocale en temps réel)

Introduction générale VITA est un projet open source de modélisation interactive multimodale du langage, pionnier dans la capacité à réaliser une véritable interaction multimodale complète. Le projet a lancé VITA-1.0 en août 2024, inaugurant le premier modèle de langage interactif entièrement modal en open source....

Dernières ressources sur l'IA # AI Java Open Source Projecct # Produits multimodaux interactifs en temps réel

Il y a 7 mois

03K

FramePainter : outil d'édition d'images de type gribouillis alimenté par l'IA

Introduction générale FramePainter est un outil révolutionnaire d'édition d'images piloté par l'IA qui utilise une technologie de diffusion vidéo avancée et des commandes d'esquisse intuitives pour aider les utilisateurs à réaliser facilement des éditions d'images complexes. Qu'il s'agisse d'un simple ajustement ou d'une transformation créative complexe, Fr...

Dernières ressources sur l'IA # AI Image Editor # AI Java Open Source Projecct # AI Doodle Generation Painting

Il y a 7 mois

03K

StickerBaker : Créez des images autocollantes personnalisées grâce à l'IA

Description générale stickerbaker est un créateur d'autocollants open source qui utilise la technologie de l'intelligence artificielle pour créer une variété d'autocollants intéressants. Que vous vouliez un simple autocollant de chat ou que vous souhaitiez créer une série d'autocollants divers, stickerbaker peut répondre à vos besoins...

Dernières ressources sur l'IA # AI génération d'images en ligne # AI Java Open Source Projecct

Il y a 11 mois

03K

Fay Digital Human Framework : intégration de modèles linguistiques et de personnages numériques en 3D pour soutenir une variété de scénarios d'application.

Introduction complète Fay est une structure open source d'humain numérique virtuel en 3D qui intègre des modèles de langage et des personnages numériques pour une variété de scénarios d'application, tels que des guides d'achat virtuels, des présentateurs virtuels, des assistants, des serveurs, des enseignants et des assistants mobiles vocaux ou textuels....

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Digital Man

Il y a 7 mois

03K

Devika : logiciel d'intelligence artificielle open-source intelligence qui comprend, divise les instructions en sous-tâches et écrit du code

Introduction générale Devika est un ingénieur logiciel IA avancé qui comprend les instructions humaines de haut niveau, les décompose en étapes, étudie les informations pertinentes et écrit du code pour atteindre un objectif donné. Il développe intelligemment des logiciels en utilisant des modèles de langage à grande échelle, des algorithmes de planification et de raisonnement, et des capacités de navigation sur le web....

Dernières ressources sur l'IA # AI Java Open Source Projecct # Programmation AI # Application de l'organisme intelligent

il y a 5 mois

03K

SP-MangaEditer : outil professionnel de création d'illustrations manga à quatre panneaux, génération d'images, édition de pages manga

Introduction générale SP-MangaEditer est une plateforme indépendante d'édition de manga conçue pour les créateurs de manga. La plate-forme prend en charge la génération d'images, l'édition de couches, l'ajustement d'images, l'application de filtres et de nombreuses autres fonctions pour aider les utilisateurs à créer facilement des illustrations de manga de haute qualité. Les utilisateurs peuvent simplement manipuler...

Dernières ressources sur l'IA # AI Aides à la génération d'images # AI Java Open Source Projecct

Il y a 7 mois

03K

RocketNotes：支持文本补全、文档对话、语义搜索的Markdown笔记应用

RocketNotes : application de notes en Markdown avec complétion de texte, dialogue sur les documents, recherche sémantique

Introduction générale RocketNotes est une application web de prise de notes en Markdown qui intègre la complétion de texte pilotée par le Large Language Model (LLM), le chat et la recherche sémantique. Le projet utilise le RAG (Re...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Notes

Il y a 9 mois

03K

ER NeRF : Construction d'un système de synthèse vidéo pour des têtes parlantes de haute fidélité

Synthèse ER-NeRF (Efficient Region-Aware Neural Radiance Fields) est un système open-source de synthèse de caractères parlants présenté à la conférence ICCV 2023. Le projet utilise des champs ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Digital Man

Il y a 7 mois

03K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT : outil de conversion de la parole en texte en temps réel pour la reconnaissance vocale en continu à faible latence basé sur Whisper

Introduction générale RealtimeSTT est une bibliothèque de conversion de la parole vers le texte en temps réel, efficace et à faible latence, avec une détection avancée de l'activité vocale et l'activation des mots de réveil. Elle a été développée par Kolja Beigel pour soutenir les applications qui nécessitent une conversion rapide et précise...

Nouvelles de l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 7 mois

03K

VBDeepSeek : un outil open source pour générer du matériel d'étude de mots pour la 4e année à l'aide de DeepSeek

Introduction complète "Vocabulary Book by DeepSeek" est un projet open source développé sur la base du grand modèle de DeepSeek, visant à aider les apprenants d'anglais à maîtriser efficacement le vocabulaire du College English Level 4 (CET-4). Le projet est hébergé sur GitHub...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outils pédagogiques AI

Il y a 6 mois

03K

KTransformers : moteur de performance pour l'inférence de grands modèles : accélération extrême, autonomisation flexible

KTransformers : Un cadre Python de haute performance pour briser le goulot d'étranglement de l'inférence de grands modèles. C'est plus qu'un simple outil d'exécution de modèle, c'est un ensemble de moteurs d'optimisation de performances extrêmes et une plateforme flexible d'habilitation d'interface. KTransf...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 6 mois

03K

roop-unleashed : un outil d'échange de visages tout-en-un basé sur l'optimisation Roop

Introduction Roop-Unleashed est un outil open source de changement de visage basé sur Python, hérité du projet Roop de s0md3v, par le développeur C0untFloyd qui continue à le maintenir et l'a renommé Roop-Unleashed....

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Face Swap and Dress Up (échange de visages et habillage)# AI video face swap

Il y a 4 mois

03K

MCP Server ChatSum：依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum : s'appuyer sur MCP pour interroger et résumer les messages WeChat dans Claude

Introduction générale MCP Server ChatSum est un projet open source conçu pour aider les utilisateurs à interroger et à résumer les messages de chat. Le projet est hébergé sur GitHub et fournit un ensemble d'outils puissants qui permettent aux utilisateurs d'interroger les journaux de chat sur la base de paramètres spécifiques et de générer les résumés correspondants...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de résumé de texte AI et d'audio/vidéo # Services MCP

il y a 5 mois

03K

uni-api：轻量大模型API转换为OpenAI接口，YAML文件配置API渠道

uni-api : API légère de grand modèle convertie en interface OpenAI, fichier YAML pour configurer le canal de l'API

Introduction complète Pas d'interface, pur fichier de configuration canal API de configuration . Il suffit d'écrire un fichier pour créer sa propre station API. Le document contient un guide de configuration détaillé. uni-api est une gestion unifiée d'un grand modèle de projet API, permettant une ...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 9 mois

03K

Srcbook : ingénieurs en IA full-stack open source qui construisent et itèrent rapidement des projets TypeScript complets.

Introduction générale Srcbook est une plateforme de développement d'applications centrée sur TypeScript, conçue pour créer et itérer rapidement sur des applications web avec des assistants IA. Elle prend en charge l'exécution native, fournit une interface de carnet de notes interactive et permet aux utilisateurs d'écrire et d'exécuter du code back-end....

Dernières ressources sur l'IA # AI Java Open Source Projecct # Programmation AI

Il y a 9 mois

03K

GPT SoVITS : Outils révolutionnaires de génération et de clonage de discours

Introduction complète GPT-SoVITS est un outil de conversion et de synthèse vocale open source qui combine le modèle GPT et la technologie de changement de voix SoVITS. L'outil prend en charge la conversion texte-parole à la volée avec zéro ou peu d'échantillons, et la migration de style de voix avec seulement 5 secondes d'échantillons audio. Ses fonctionnalités incluent la conversion ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Clonage vocal AI

Il y a 11 mois

03K

Raycast-G4F：通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F : Accès gratuit à GPT-4, Llama-3 et à de nombreux autres modèles d'IA via Raycast !

Introduction générale Raycast-G4F (GPT4Free) est une puissante extension Raycast qui donne aux utilisateurs un accès gratuit à un large éventail de modèles d'IA avancés, notamment GPT-4 et Llama-3. L'extension ne se contente pas de fournir des dialogues en temps réel...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Localised Chat Application # Free Large Model API

Il y a 7 mois

03K

Awesome LLM Apps：收集和探索优秀开源的LLM应用程序，一行命令快速部署

Awesome LLM Apps : Rassemblez et explorez de superbes applications LLM open source, déployez-les rapidement à l'aide d'une simple commande !

Introduction générale Awesome LLM Apps est un dépôt GitHub créé par Shubham Saboo, dédié à la collecte et à la présentation d'un large éventail d'applications LLM (Large Language Modelling). Le dépôt contient des applications qui utilisent OpenAI, An...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 8 mois

03K

Promptimizer : une bibliothèque expérimentale pour l'optimisation de grands modèles de mots-guides, optimisant automatiquement Prompt

Introduction générale Promptimizer est une bibliothèque expérimentale d'optimisation des mots-guides conçue pour aider les utilisateurs à améliorer systématiquement les mots-guides de leurs systèmes d'intelligence artificielle. En automatisant le processus d'optimisation, Promptimizer peut améliorer les performances des mots indicateurs pour des tâches spécifiques. Les utilisateurs n'ont qu'à fournir...

Dernières ressources sur l'IA # AI Java Open Source Projecct # PROMPTS Aides

Il y a 9 mois

03K

Director：智能视频代理框架，用自然语言描述执行视频搜索、编辑和生成工作流

Director : cadre d'agent vidéo intelligent pour la recherche, l'édition et la génération de flux de travail vidéo avec des descriptions en langage naturel

Introduction générale Director est un framework open source conçu pour simplifier et optimiser les interactions et les flux de travail vidéo en construisant des agents vidéo intelligents. Le cadre est basé sur l'infrastructure "vidéo en tant que données" de VideoDB et est capable de gérer des tâches vidéo complexes telles que la recherche, l'édition, la compilation et la génération...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI éditeur audio/vidéo

Il y a 8 mois

03K

RolmOCR : Modèle d'OCR de documents pour la reconnaissance de caractères manuscrits et obliques

Introduction générale RolmOCR est un outil de reconnaissance optique de caractères (OCR) open source développé par l'équipe Reducto AI, basé sur le modèle de langage visuel Qwen2.5-VL-7B. Il peut extraire du texte à partir d'images et de fichiers PDF plus rapidement que des outils similaires...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR

Il y a 4 mois

03K

MiniMind : 2 heures de formation à partir de zéro 26M paramètres GPT outil open source

Introduction générale MiniMind est un projet open source créé par le développeur jingyaogong. Son objectif principal est de permettre aux gens ordinaires d'entraîner rapidement leurs propres modèles d'intelligence artificielle.

Dernières ressources sur l'IA # AI Java Open Source Projecct

il y a 5 mois

03K

SkyReels-V1 : Modèles vidéo libres pour générer des vidéos d'action humaine de haute qualité

Introduction générale SkyReels-V1 est un projet open source développé par l'équipe SkyworkAI, qui vise à générer du contenu vidéo de haute qualité, centré sur l'humain. Le projet est basé sur le modèle HunyuanVideo, à travers des dizaines de millions de films et d'extraits télévisés de haute qualité...

Dernières ressources sur l'IA # AI Image to Video # AI Java Open Source Projecct # AI text to video

Il y a 6 mois

03K

Aider : outil d'aide à la programmation open source, utilisation d'un assistant IA pour l'écriture de code et l'édition de fichiers

Introduction générale Aider est un puissant assistant de programmation IA open source qui aide les développeurs à écrire, éditer et remanier le code par le biais d'un dialogue en langage naturel. En tant qu'outil interactif de programmation en binôme, Aider prend en charge de nombreux langages de programmation majeurs et peut être intégré de manière transparente dans Git...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Programmation AI

Il y a 4 mois

03K

RoomGPT : Téléchargez une photo de votre chambre et redessinez-la à l'aide de l'IA !

Introduction générale RoomGPT est un projet open source développé par Nutlope, un utilisateur de GitHub, qui permet aux utilisateurs de télécharger des photos de pièces et d'en générer des versions redessinées à l'aide d'une technologie d'intelligence artificielle. Le projet vise à permettre aux utilisateurs d'accéder à une décoration d'intérieur de qualité professionnelle sans avoir à payer de coûteux honoraires de designer...

Dernières ressources sur l'IA # AI Image Style Control # AI Java Open Source Projecct

Il y a 9 mois

03K

MegaParse：解析各类型文档为LLM可用数据，完整保留文档中的表格、图片等所有信息

MegaParse : analyse chaque type de document en données disponibles en LLM, en préservant toutes les informations du document, telles que les tableaux et les images, dans leur intégralité.

Introduction générale MegaParse est un outil d'analyse de documents puissant et polyvalent, conçu pour optimiser le traitement des données pour le Large Language Model (LLM). Que vous travailliez avec du texte, des PDF, des présentations PowerPoint ou des documents Word, MegaParse...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Extraction et nettoyage de documents

Il y a 8 mois

03K

AIHawk : Intelligent Job Search Assistant, Automated CV Placement (en anglais uniquement)

Introduction générale Auto_Jobs_Applier_AIHawk est un outil d'automatisation de la recherche d'emploi utilisant la technologie de l'intelligence artificielle. Il aide les utilisateurs à automatiser l'envoi d'un grand nombre de CV en peu de temps et à les personnaliser en fonction de leurs informations personnelles et de leurs intentions de recherche d'emploi. L'outil est conçu pour...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Life Efficiency Assistant

Il y a 8 mois

03K

MakeSense : un outil d'annotation d'images gratuit pour améliorer l'efficacité des projets de vision par ordinateur

Introduction générale Make Sense est un outil d'annotation d'images en ligne gratuit conçu pour aider les utilisateurs à préparer rapidement des ensembles de données pour des projets de vision par ordinateur. Il ne nécessite aucune installation compliquée, il suffit d'ouvrir un accès au navigateur pour l'utiliser, il supporte plusieurs systèmes d'exploitation, et il est idéal pour les petits projets d'apprentissage profond. Les utilisateurs peuvent...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Détection visuelle de cibles

Il y a 6 mois

03K

TextDistiller：一键总结一整本书，高效提炼书籍内容，快速掌握核心思想

TextDistiller : résumez un livre entier en un clic, distillez efficacement le contenu du livre et saisissez rapidement les idées essentielles.

Introduction complète TextDistiller est un outil avancé basé sur l'intelligence artificielle, conçu pour résumer des livres chapitre par chapitre ou dans leur ensemble, en fournissant une vue d'ensemble à la fois concise et complète. En utilisant TextDistiller, les utilisateurs sont en mesure de saisir rapidement les idées essentielles et les points clés de n'importe quel livre...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de résumé de texte AI et d'audio/vidéo

Il y a 8 mois

03K

Tabby : un assistant de programmation IA auto-hébergé qui s'intègre à VSCode

Introduction générale Tabby est un assistant de programmation IA open source développé par l'équipe TabbyML que les utilisateurs peuvent déployer eux-mêmes localement ou sur un serveur. Il offre des fonctionnalités similaires à celles du Copilote GitHub, telles que l'auto-complétion du code et les questions-réponses intelligentes, mais le plus...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Programmation AI

Il y a 4 mois

03K

Hoarder：开源 AI 书签管理工具，支持多种格式文件，智能标签分类、全文检索

Hoarder : outils de gestion de signets AI open source, prise en charge de plusieurs formats, classification intelligente des balises, recherche plein texte

Description générale Hoarder est un outil de gestion de signets auto-hébergé qui permet de stocker des liens, des notes, des PDF et des images. Il utilise la technologie AI pour l'étiquetage automatique et fournit des capacités de recherche en texte intégral. Les utilisateurs peuvent utiliser le plugin Chrome et le plugin Firefox...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Life Efficiency Assistant

Il y a 8 mois

03K

Moondream : un modèle de langage visuel léger et open source pour la rétropropagation par lots de mots repères d'images

Introduction complète Moondream est un modèle de langage visuel léger open source conçu pour permettre des capacités de description d'images grâce à des techniques d'apprentissage profond et de vision par ordinateur. Le modèle est capable de fonctionner efficacement sur une variété de plates-formes, et est particulièrement adapté aux appareils...

Dernières ressources sur l'IA # AI Aides à la génération d'images # AI Java Open Source Projecct

Il y a 7 mois

03K

askrepo：源代码阅读工具，使用LLM分析代码，提供详细代码解释，支持多种编程语言

askrepo : outil de lecture du code source, utilisant LLM pour analyser le code, fournir des explications détaillées sur le code, prise en charge d'une variété de langages de programmation.

Introduction générale askrepo est un outil de lecture de code source basé sur LLM (Large Language Model). Il peut lire le contenu d'un fichier texte géré par Git dans un répertoire spécifié et l'envoyer à l'API Google Gemini pour fournir des réponses à des questions basées sur des invites spécifiées...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 9 mois

03K

AudioX : générer de l'audio et de la musique à partir de textes, d'images et de vidéos référencés

Introduction générale AudioX est un projet open source sur GitHub de Zeyue Tian et al. L'article officiel est publié sur arXiv (numéro 2503.10522). Il est basé sur les transferts de diffusion...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Music

Il y a 4 mois

03K

Fabric : un cadre de flux de travail IA open source qui intègre de nombreux mots-clés pour traiter efficacement une variété de transactions.

Introduction générale Fabric est un framework d'IA open source développé par Daniel Miessler pour simplifier et automatiser les tâches informatiques quotidiennes et rendre l'intelligence artificielle plus facile à utiliser. Il aide efficacement les utilisateurs grâce à une conception modulaire et à des mots guides prédéfinis (Patterns)...

Dernières ressources sur l'IA # AI Java Open Source Projecct # PROMPTS Aides

Il y a 10 mois

03K

VideoRAG : un cadre RAG pour comprendre les vidéos ultra-longues avec un support pour la recherche multimodale et la construction de graphes de connaissances.

Introduction complète VideoRAG est un cadre génératif amélioré par la recherche d'information conçu pour traiter et comprendre les vidéos contextuelles de très longue durée. L'outil associe une base de connaissances textuelles orientée graphe à un encodage contextuel multimodal hiérarchique pour traiter efficacement sur un seul GPU NVIDIA RTX 3090...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Recherche de connaissances et cadre RAG

Il y a 6 mois

03K

DocsGPT : Document Chat Assistant, obtenir des réponses fiables à partir de documents uniques, de sources web, prendre en charge le déploiement local

Introduction générale DocsGPT est un assistant de documentation open source conçu pour simplifier le processus d'interrogation de la documentation d'un projet. En intégrant un puissant modèle GPT, les développeurs peuvent facilement poser des questions sur le projet et obtenir des réponses précises. En intégrant un puissant modèle GPT, les développeurs peuvent facilement poser des questions sur le projet et obtenir des réponses précises.DocsGPT supporte le déploiement local pour assurer la confidentialité des données tout en...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de résumé de texte AI et d'audio/vidéo

Il y a 9 mois

03K

Chonkie : une bibliothèque légère de découpage de texte en RAG

Introduction complète Chonkie est une bibliothèque de découpage de texte RAG (Retrieval-Augmented Generation) légère et efficace, conçue pour aider les développeurs à découper rapidement et facilement du texte. La bibliothèque prend en charge une variété de méthodes de découpage, y compris ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Extraction et nettoyage de documents

Il y a 6 mois

03K

Sonic : Des images de portraits audio génèrent des vidéos de démonstration numériques avec des expressions faciales vivantes.

Introduction générale Sonic est une plateforme innovante axée sur la perception audio globale, qui vise à générer des portraits animés par l'audio. Développée par une équipe de chercheurs de Tencent et de l'université de Zhejiang, la plateforme utilise les informations audio pour contrôler les expressions faciales et les mouvements de tête afin de générer des vidéos animées naturelles et fluides....

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Digital Man

Il y a 4 mois

03K

BrushEdit : un outil tout-en-un pour la restauration et l'édition d'images lancé par Tencent ARC

Introduction BrushEdit est un outil de réparation et d'édition d'images tout-en-un développé par Tencent ARC Labs. L'outil est basé sur la dernière technologie d'intelligence artificielle et est capable d'identifier et de réparer automatiquement les défauts des images, tout en prenant en charge l'édition interactive par les utilisateurs.BrushEdit combine...

Dernières ressources sur l'IA # AI Image Editor # AI Java Open Source Projecct

Il y a 8 mois

03K

xyks : notes inversées de calcul oral du petit singe, rétro-ingénierie et algorithmes de décryptage

Introduction complète Ape Mouth Calculator Reverse Notes est un projet open source qui vise à documenter et à partager le processus et les méthodes de rétro-ingénierie de l'application Ape Mouth Calculator. Le projet contient une variété d'outils et de techniques de rétro-ingénierie pour utiliser les instructions, telles que Frida, dexdump , etc., pour aider les utilisateurs à comprendre et à craquer l'addition arithmétique orale du petit singe...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outils pédagogiques AI

Il y a 10 mois

03K

Unsloth : un outil open source pour l'affinage et l'entraînement efficaces de grands modèles de langage

Introduction complète Unsloth est un projet open source conçu pour fournir des outils efficaces pour l'ajustement et l'entraînement de grands modèles de langage (LLM). Le projet supporte une variété de modèles bien connus, dont Llama, Mistral, Phi et Gemma....

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 6 mois

02.9K

Changeur de voix : Un changeur de voix en temps réel pour faire chanter vos personnages d'anime préférés !

Introduction générale Voice Changer est un outil open source de transformation de la voix en temps réel qui prend en charge un large éventail de modèles vocaux d'IA tels que MMVC, so-vits-svc, RVC, DDSP-SVC et Beatrice....

Dernières ressources sur l'IA # AI Java Open Source Projecct # Clonage vocal AI

Il y a 10 mois

02.9K

Second Me : des sosies d'IA formés localement et dotés de souvenirs et d'habitudes personnels

Second Me est un projet open source développé par l'équipe Mindverse qui vous permet de créer une IA sur votre ordinateur qui agit comme un "sosie numérique", apprenant vos schémas d'élocution et vos habitudes à travers vos mots et vos souvenirs, et devenant une personne intelligente qui comprend vos...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Life Efficiency Assistant # Mise au point du grand modèle

il y a 5 mois

02.9K

SciToolAgent : une intelligence qui intègre plus de 500 outils de recherche pour automatiser les tâches scientifiques et de recherche.

Introduction complète SciToolAgent est une plateforme d'outils open source développée par le Centre d'innovation de l'Université de Zhejiang à Hangzhou (HICAI-ZJU). Elle intègre plus de 500 outils scientifiques par le biais d'un graphe de connaissances (SciToolKG) et de technologies de modélisation du grand langage afin d'aider les chercheurs à...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outils pédagogiques AI # Application de l'organisme intelligent

il y a 5 mois

02.9K

DeepSeek-R1-FP4：FP4优化版DeepSeek-R1推理速度25倍

DeepSeek-R1-FP4 : version optimisée pour le FP4 de l'inférence DeepSeek-R1 25x plus rapide

Introduction complète DeepSeek-R1-FP4 est un modèle de langage quantifié optimisé par NVIDIA, développé sur la base de DeepSeek-R1 de DeepSeek AI. Il a été développé sur la base de DeepSeek-R1 de DeepSeek AI. Il a été développé en utilisant le modèle TensorRT Opt...

Dernières ressources sur l'IA # AI Java Open Source Projecct

il y a 5 mois

02.9K

Yek : lecture des fichiers texte du dépôt git et découpage rapide pour les modèles de grande taille

Introduction générale Yek est un outil rapide basé sur Rust pour lire des fichiers texte à partir de dépôts ou de répertoires, les découper et les sérialiser pour les utiliser dans de grands modèles de langage (LLM). L'outil utilise la règle .gitignore par défaut pour ignorer les fichiers inutiles, et utilise...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Extraction et nettoyage de documents

Il y a 7 mois

02.9K

HiOllama : une interface de chat propre pour interagir avec les modèles natifs d'Ollama

Introduction générale HiOllama est une interface conviviale construite sur Python et Gradio, conçue pour interagir avec les modèles Ollama. Elle fournit une interface web simple et intuitive qui prend en charge la génération de texte en temps réel et les fonctions de gestion du modèle. Les utilisateurs peuvent ajuster des paramètres tels que la température et la plupart des...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Localised Chat Application

Il y a 9 mois

02.9K

YTSage：YouTube下载器，免费下载YouTube视频，提取音频，获取字幕

YTSage : YouTube Downloader, Télécharger gratuitement des vidéos YouTube, Extraire l'audio, Obtenir les sous-titres

Introduction générale YTSage est un outil moderne de téléchargement YouTube avec une interface PyQt6 propre. Les utilisateurs peuvent utiliser YTSage pour télécharger des vidéos de toute qualité, extraire l'audio, obtenir des sous-titres (y compris des sous-titres auto-générés), et afficher les méta...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI éditeur audio/vidéo

Il y a 8 mois

02.9K

simple-one-api：一键集成多种免费大模型API，统一对外提供 OpenAI 接口

simple-one-api : intégration en un clic d'une variété d'API de grands modèles libres, interface OpenAI externe unifiée

Introduction complète simple-one-api est un projet open source conçu pour simplifier l'intégration de plusieurs API de grands modèles. Il prend en charge les API compatibles avec OpenAI telles que ThousandFans Big Model Platform, Xunfei Starfire Big Model, Tencent Mixed Element, MiniMax et Deep-Seek...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 9 mois

02.9K

DCT-Net : un outil open source pour transposer des photos et des vidéos en animes stylisés

Introduction générale DCT-Net est un projet open source développé par DAMO Academy et Wang Xuan Institute of Computer Technology, Peking University, visant à animer la transformation stylisée des images. Le projet utilise des techniques d'apprentissage profond par le biais de la traduction calibrée par domaine (Domain-Calibrat...

Dernières ressources sur l'IA # AI Image Style Control # AI Java Open Source Projecct # AI Video Conversion Style

Il y a 7 mois

02.9K

Fish Agent：端到端AI语音克隆助手，实时语音对话助理，Fish Speech衍生项目

Fish Agent : assistant de clonage vocal IA de bout en bout, assistant de dialogue vocal en temps réel, projet dérivé de Fish Speech

Introduction complète Projet de dérivation de la parole de Fish Fish Agent est un système révolutionnaire de clonage de la parole de bout en bout développé sur la base de l'architecture du modèle V0.1 3B. En tant que système de traitement de clones de parole de bout en bout, sa caractéristique la plus importante est l'utilisation de...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Clonage vocal AI # Produits multimodaux interactifs en temps réel

Il y a 7 mois

02.9K

E2B : plateforme d'exécution de code d'IA dans un bac à sable sécurisé dans le nuage

Introduction générale E2B est une plateforme open source conçue pour exécuter du code généré par l'IA dans un bac à sable sécurisé dans le nuage. Elle prend en charge un large éventail de langages de programmation et de cadres et fournit un environnement virtuel isolé pour garantir la sécurité et la fiabilité de l'exécution du code.E2B convient à une variété de scénarios d'application de l'IA, y compris le partitionnement des données...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 7 mois

02.9K

Aide : extension d'aide à l'IA qui améliore l'expérience de développement de VSCode avec l'annotation, la conversion et le code généré par l'interface utilisateur en un seul clic.

Introduction générale AIDE (AI-assisted Development Extension) est une puissante extension de développement assistée par l'IA pour VSCode, qui se concentre sur la fourniture d'une assistance unique et utile à la programmation de l'IA. Elle est différente de GitHu...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Programmation AI

Il y a 7 mois

02.9K

EasyControl : un outil gratuit pour transformer les portraits en images de style Ghibli

Introduction générale EasyControl est un projet open source, le projet est basé sur l'architecture du transformateur de diffusion (DiT) pour fournir un contrôle efficace et flexible de la génération d'images. Parmi eux, Ghibli Control LoRA est l'une de ses caractéristiques spéciales, en utilisant seulement 100 sous...

Dernières ressources sur l'IA # AI Image Style Control # AI Java Open Source Projecct

Il y a 4 mois

02.9K

HivisionIDPhotos : outil open source de création de photos d'identité intelligentes par l'IA

Introduction complète HivisionIDPhotos est un outil de production de photos de documents AI léger et open source, capable d'identifier intelligemment la scène de la photo de l'utilisateur et le keying, afin de générer une photo de document standard conforme à une variété de spécifications. L'outil prend en charge les couleurs et les tailles d'arrière-plan personnalisées et, à l'avenir, il...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI keying pour changer d'arrière-plan

Il y a 11 mois

02.9K

ANP : un protocole open source pour une communication sécurisée et efficace entre agents intelligents

Introduction générale AgentNetworkProtocol (ANP en abrégé) est un projet de protocole open source, hébergé sur GitHub, visant à fournir des solutions de communication sécurisées et efficaces pour les agents intelligents (AI Agents). Il fonctionne selon une architecture à trois niveaux - identité et cryptage...

Dernières ressources sur l'IA # AI Java Open Source Projecct

il y a 5 mois

02.9K

CR-Mentor : Base de connaissance + LLM Intelligent Code Review Mentor pour GitHub

Introduction complète CR-Mentor est un outil intelligent de révision de code qui combine une base de connaissances professionnelle avec la puissance de la modélisation des grands langages (LLM). Il prend non seulement en charge l'examen du code pour tous les langages de programmation, mais il personnalise également des critères d'examen exclusifs et des domaines d'intérêt pour les équipes sur la base des meilleures pratiques accumulées dans la base de connaissances. Grâce à...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Programmation AI

Il y a 9 mois

02.9K

Pieces OS：逆向Pieces-OS GRPC转换为OpenAI接口（失效）

Pieces OS : Conversion inverse de Pieces-OS GRPC vers l'interface OpenAI (échoué)

Introduction générale Pieces-OS est un projet open source qui vise à inverser les flux GRPC de Pieces-OS et à les convertir en interface API OpenAI standard, prenant en charge Claude, GPT et Gemini.

Dernières ressources sur l'IA # AI Java Open Source Projecct # Free Large Model API

Il y a 9 mois

02.9K

TreeGPT : Interface de chat AI pour visualiser les conversations basées sur les arbres

Introduction générale TreeGPT est une application de chat open source basée sur Next.js, qui se concentre sur la visualisation des conversations avec de grands modèles de langage (LLM, par exemple, GPT) à travers des structures de graphes arborescents (graphes acycliques dirigés, DAG), remplaçant les méthodes de chat linéaires traditionnelles pour améliorer la vitesse et la...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Localised Chat Application

Il y a 6 mois

02.9K

NV Ingest : analyse de documents au format complexe, extraction de données multimodales en métadonnées et en texte

Introduction complète NV Ingest (NVIDIA Ingest) est une suite de microservices en accès anticipé conçus pour analyser des centaines de milliers de PDF non structurés complexes et désordonnés et d'autres documents d'entreprise. Il peut convertir ces documents en métadonnées et en texte pour les intégrer dans des...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Extraction et nettoyage de documents

Il y a 7 mois

02.9K

R2R : un système de recherche avancée d'IA (RAG) pour l'analyse de contenu multimodal et la combinaison de graphes de connaissances avec la recherche hybride

Introduction complète R2R (RAG to Riches) est un système de recherche IA avancé qui prend en charge la fonctionnalité Retrieval Augmented Generation (RAG) avec des caractéristiques prêtes à la production. Construit sur une API RESTful conteneurisée, le système fournit une analyse multimodale du contenu, une fonctionnalité de recherche hybride...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Recherche de connaissances et cadre RAG

Il y a 8 mois

02.9K

AingDesk : Installation en un clic de modèles d'IA et d'interfaces de discussion sur des ordinateurs personnels (avec DeepSeek)

Introduction générale AingDesk est un logiciel open source et gratuit conçu pour aider les utilisateurs à déployer et à exécuter facilement divers modèles d'IA sur leurs ordinateurs locaux. Qu'il s'agisse d'un modèle DeepSeek ou Llama, AingDesk permet une...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Localised Chat Application

Il y a 6 mois

02.9K

Orate : une API unifiée pour l'intégration de la génération de parole Well-Known, de la transcription de la parole et de la modélisation de la voix

Introduction générale Orate est une boîte à outils d'IA axée sur la génération et la transcription de la parole. Il fournit une API unifiée qui s'intègre de manière transparente avec les principaux fournisseurs d'IA tels que OpenAI, ElevenLabs et AssemblyAI afin d'aider les utilisateurs à créer des...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Synthèse vocale AI # AI Speech to Text

Il y a 6 mois

02.9K

Cognita : un cadre open source pour construire des applications RAG modulaires et tester rapidement diverses stratégies RAG

Introduction complète Cognita est un framework open source développé par TrueFoundry pour simplifier le développement d'applications basées sur RAG (Retrieval-Augmented Generation). Le framework fournit une approche structurée, mod...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Pas de développement de code # Recherche de connaissances et cadre RAG

Il y a 7 mois

02.9K

FlashMLA：优化Hopper GPU的MLA解码内核（DeepSeek 开源周第一天）

FlashMLA : Optimisation des noyaux de décodage MLA pour les GPU Hopper (DeepSeek Open Source Week Day 1)

Introduction générale FlashMLA est un noyau de décodage MLA (Multi-head Latent Attention) efficace développé par DeepSeek AI, optimisé pour les GPU NVIDIA Hopper...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 6 mois

02.9K

ComfyUI disty Flow：为 ComfyUI 提供友好的用户界面，简化工作流程

ComfyUI disty Flow : une interface conviviale pour ComfyUI afin de rationaliser le flux de travail

Introduction générale ComfyUI-disty-Flow est un nœud personnalisé qui fournit une interface conviviale à ComfyUI. Il est destiné à simplifier l'exécution des flux de travail en fournissant une interface utilisateur alternative à la création de flux de travail....

Dernières ressources sur l'IA # AI Aides à la génération d'images # AI Java Open Source Projecct # ComfyUI

Il y a 7 mois

02.9K

Génération sans serveur d'un code QR Microsoft permanent

Introduction générale serverless-qrcode-hub est un outil open source conçu pour résoudre le problème des échecs fréquents des codes QR dans les chats de groupe WeChat. Il est basé sur les travailleurs Cloudflare et les bases de données D1, sans avoir besoin de serveurs traditionnels pour ...

Tutoriels pratiques sur l'IA # AI Java Open Source Projecct

Il y a 4 mois

02.9K

Muyan-TTS : formation et synthèse vocale personnalisée pour podcast

Synthesis Muyan-TTS est un modèle de synthèse vocale open source conçu pour les scénarios de podcasting. Il est pré-entraîné avec plus de 100 000 heures de données audio de podcasts et prend en charge la synthèse vocale sans échantillon pour générer une parole naturelle de haute qualité. Le modèle est basé sur Llama-3.2-3...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Synthèse vocale AI

Il y a 3 mois

02.9K

Kolors : modèle texte-image pour la génération d'images de haute qualité, avec prise en charge de la génération d'affiches chinoises

Introduction complète Kolors est un modèle de génération de texte-image à grande échelle développé par l'équipe Racer, basé sur des techniques de diffusion de potentiel. Le modèle est entraîné sur des milliards de paires de données texte-image, et est capable de générer des images de haute qualité, complexes et sémantiquement précises, avec une prise en charge des entrées chinoises et anglaises....

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Self-Deployment Image Generation Tool (outil de génération d'images pour l'autodéploiement de l'IA)

Il y a 8 mois

02.9K

GFPGAN : algorithme de réparation des visages open source de Tencent

Introduction complète GFPGAN (Generative Facial Prior GAN) est un algorithme de réparation de visage open source développé par Tencent ARC (Applied Research Center). L'algorithme utilise un GAN facial pré-entraîné...

Dernières ressources sur l'IA # AI Agrandissement et restauration d'images # AI Java Open Source Projecct

Il y a 11 mois

02.9K

XRAG : un outil d'évaluation visuelle pour optimiser les systèmes de génération d'amélioration de la recherche.

Introduction complète XRAG (eXamining the Core) est un cadre d'analyse comparative conçu pour évaluer les composants sous-jacents des systèmes avancés de génération d'augmentation de la recherche (RAG). En profilant et en analysant chaque module de base, XRAG fournit des informations sur la manière dont les différentes configurations et les différents composants affectent...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Recherche de connaissances et cadre RAG

Il y a 7 mois

02.9K

Supermemory : Importer des signets et du contenu web pour construire une base de connaissances personnelle

Introduction générale Supermemory est un projet open source conçu pour aider les utilisateurs à construire leur "deuxième cerveau". Grâce à une puissante extension Chrome et à une technologie d'intelligence artificielle, il permet aux utilisateurs de sauvegarder, d'organiser et de récupérer facilement des données à partir de pages web, de signets Twitter...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Recherche de connaissances et cadre RAG

Il y a 6 mois

02.9K

LangBot：开源大模型即时通信机器人，支持多微信、QQ、飞书等多平台部署AI机器人

LangBot : robot de messagerie instantanée open source de grande taille, compatible avec le déploiement multiplateforme de robots IA (WeChat, QQ, Flybook, etc.)

LangBot est une plateforme de bot de messagerie instantanée basée sur un grand modèle qui prend en charge plusieurs plateformes de messagerie et de grands modèles. La plateforme s'adapte à QQ, WeChat (WeChat d'entreprise, WeChat personnel), Flybook, Discord, OneBot et d'autres plateformes de messagerie, et prend en charge Open...

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 6 mois

02.9K