Mise au point d'un grand modèle

Total 28 articles

mettre en ordre

One Shot LoRA : la plateforme tout-en-un pour la génération rapide de modèles vidéo LoRA

Introduction générale One Shot LoRA est une plateforme destinée à générer des modèles LoRA de haute qualité à partir de vidéos. Les utilisateurs peuvent rapidement et facilement former des modèles LoRA de boutique à partir de vidéos sans avoir à se connecter ou à stocker des données privées. La plateforme prend en charge Hunyua...

Dernières ressources sur l'IA # AI Aides à la génération d'images # Mise au point du grand modèle

Il y a 6 mois

03.8K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit by Ostris : Diffusion stable avec FLUX.1 Model Training Toolkit

Introduction générale AI Toolkit by Ostris est un ensemble d'outils d'IA open source axé sur la prise en charge des modèles Stable Diffusion et FLUX.1 pour les tâches d'entraînement et de génération d'images. La boîte à outils est créée et maintenue par le développeur Ostris, tor...

Dernières ressources sur l'IA # AI Aides à la génération d'images # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

03.7K

TPO-LLM-WebUI : un cadre d'intelligence artificielle dans lequel vous pouvez saisir des questions pour entraîner un modèle en temps réel et produire les résultats.

Introduction générale TPO-LLM-WebUI est un projet innovant ouvert par Airmomo sur GitHub qui permet l'optimisation en temps réel de grands modèles de langage (LLM) par le biais d'une interface web intuitive. Il utilise TPO (Test-Time Pr...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 6 mois

03.7K

ModelScope Swift : une infrastructure légère pour affiner et déployer efficacement de grands modèles.

Introduction complète ModelScope Swift (MS-Swift en abrégé) est une infrastructure légère et efficace conçue pour affiner, raisonner, évaluer et déployer de grands modèles (LLM) et de grands modèles multimodaux (MLLM). Le cadre supporte plus de 400 LLM...

Dernières ressources sur l'IA # Mise au point du grand modèle

Il y a 9 mois

03.6K

DeepCoder-14B-Preview : un modèle open-source qui excelle dans la génération de code

Introduction générale DeepCoder-14B-Preview est un modèle de génération de code open source développé par l'équipe d'Agentica et publié sur la plateforme Hugging Face. Il est basé sur le modèle DeepSeek-R1-Distilled-Q...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

03.5K

LLaMA Factory : mise au point efficace de plus d'une centaine de macromodèles open-source, personnalisation aisée des modèles

Introduction générale LLaMA-Factory est un cadre de réglage fin unifié et efficace qui prend en charge la personnalisation flexible et l'entraînement efficace de plus de 100 grands modèles linguistiques (LLM). Grâce à l'interface web intégrée LLaMA Board, les utilisateurs n'ont pas besoin d'écrire du code pour compléter la modélisation...

Dernières ressources sur l'IA # Mise au point du grand modèle

Il y a 9 mois

03.4K

Petals：分布式共享GPU运行和微调大语言模型，像BitTorrent网络一样共享GPU资源

Petals : exécution distribuée et partagée de modèles linguistiques de grande taille sur GPU, partageant les ressources GPU comme un réseau BitTorrent.

Introduction générale Petals est un projet open source développé par le BigScience Workshop pour exécuter de grands modèles de langage (LLM) par le biais d'une approche informatique distribuée. Les utilisateurs peuvent exécuter les LLM chez eux en utilisant des GPU grand public ou Google Co...

Dernières ressources sur l'IA # Mise au point du grand modèle # Outil de grand modèle à source ouverte déployé localement

Il y a 9 mois

03.4K

Kiln : Outil simple de mise au point de modèles LLM et de synthèse de données, base de code 0 pour mettre au point vos propres mini-modèles !

Introduction complète Kiln est un outil open source axé sur la mise au point de grands modèles linguistiques (LLM), la génération de données synthétiques et la collaboration en matière d'ensembles de données. Il fournit des applications de bureau intuitives prenant en charge les systèmes Windows, MacOS et Linux, permettant aux utilisateurs de réaliser une implémentation en code zéro des modèles Ll...

Dernières ressources sur l'IA # Mise au point du grand modèle

Il y a 6 mois

03.3K

WeClone : former des sosies numériques à l'aide des journaux de conversation et des voix WeChat

Introduction complète WeClone est un projet open source qui utilise les transcriptions de chat et les messages vocaux de WeChat, combinés à de grands modèles de langage et à une technologie de synthèse vocale, pour permettre aux utilisateurs de créer des sosies numériques personnalisés. Le projet peut analyser les habitudes de chat de l'utilisateur pour entraîner le modèle, mais aussi un petit nombre d'échantillons de voix pour générer des sons réalistes...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

03.3K

OpenManus-RL : affiner les grands modèles pour améliorer le raisonnement et la prise de décision des organismes intelligents

Introduction générale OpenManus-RL est un projet open source développé par UIUC-Ulab en collaboration avec l'équipe OpenManus de la communauté MetaGPT, hébergé sur GitHub.

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

03.2K

Unsloth : un outil open source pour l'affinage et l'entraînement efficaces de grands modèles de langage

Introduction complète Unsloth est un projet open source conçu pour fournir des outils efficaces pour l'ajustement et l'entraînement de grands modèles de langage (LLM). Le projet supporte une variété de modèles bien connus, dont Llama, Mistral, Phi et Gemma....

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 6 mois

03.2K

Second Me : des sosies d'IA formés localement et dotés de souvenirs et d'habitudes personnels

Second Me est un projet open source développé par l'équipe Mindverse qui vous permet de créer une IA sur votre ordinateur qui agit comme un "sosie numérique", apprenant vos schémas d'élocution et vos habitudes à travers vos mots et vos souvenirs, et devenant une personne intelligente qui comprend vos...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Life Efficiency Assistant # Mise au point du grand modèle

il y a 5 mois

03.2K

Forefront AI : Plate-forme de mise au point de modèles d'apprentissage automatique | Assistant de chat AI

Introduction complète Forefront AI est une plateforme d'IA avancée qui se concentre sur la personnalisation et le déploiement de modèles open source. Les utilisateurs peuvent sélectionner et affiner une variété de modèles d'IA puissants, tels que GPT-4, GPT-3.5, etc., pour répondre aux différentes exigences des tâches. La plateforme prend en charge le téléchargement de...

Dernières ressources sur l'IA # AI Open Services # Plate-forme de dialogue multi-modèle intégrée à l'IA # Mise au point du grand modèle

Il y a 9 mois

03K

Bonsai : un modèle de langage pondéré à trois valeurs adapté aux appareils périphériques

Introduction générale Bonsai est un modèle de langage open source développé par deepgrove-ai avec une taille de paramètre de 500 millions, utilisant des poids ternaires. Il est basé sur l'architecture Llama et le classificateur Mistral...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

02.9K

LlamaEdge : le moyen le plus rapide d'exécuter et d'affiner LLM localement !

Introduction générale LlamaEdge est un projet open source conçu pour simplifier le processus d'exécution et d'ajustement des grands modèles de langage (LLM) sur les appareils locaux ou périphériques. Le projet prend en charge la famille de modèles Llama2 et fournit des services API compatibles avec l'OpenAI qui permettent aux utilisateurs de créer et d'exécuter...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 7 mois

02.9K

Bakery : affiner et monétiser facilement les modèles d'IA open source

Introduction générale Bakery est une plateforme conçue pour les startups d'IA, les ingénieurs en apprentissage automatique et les chercheurs afin de fournir des services simples et efficaces de mise au point de modèles d'IA et de monétisation. Les utilisateurs peuvent accéder à des ensembles de données communautaires via Bakery, créer ou télécharger leurs propres ensembles de données, affiner les modèles...

Dernières ressources sur l'IA # AI Side Hustle Money Making Project (Projet de création d'argent)# Mise au point du grand modèle

Il y a 7 mois

02.9K

NVIDIA Garak : outil open-source pour détecter les vulnérabilités LLM et sécuriser l'IA générative

Introduction complète NVIDIA Garak est un outil open source spécialement conçu pour détecter les vulnérabilités dans les grands modèles de langage (LLM). Il vérifie le modèle pour de multiples faiblesses telles que les illusions, les fuites de données, l'injection d'indices, la génération de messages d'erreur, la génération de contenu nuisible, etc. par le biais de sondages statiques, dynamiques et adaptatifs...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 9 mois

02.9K

Ensemble de données de distillation DeepSeek-R1 à sang complet basé en Chine, prend en charge l'ensemble de données SFT de distillation R1 en Chine

Introduction complète Le jeu de données chinois DeepSeek-R1 distillation est un jeu de données chinois open source contenant 110 000 pièces de données conçues pour soutenir l'apprentissage automatique et la recherche sur le traitement du langage naturel. Le jeu de données est publié par l'équipe NLP de Cong Liu. Le jeu de données contient non seulement des données mathématiques, mais aussi un grand nombre de types généraux...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 6 mois

02.9K

Easy Dataset : un outil facile à utiliser pour créer de grands ensembles de données finement réglées.

Introduction complète Easy Dataset est un outil open source conçu spécifiquement pour affiner les grands modèles (LLM), hébergé sur GitHub. Il fournit une interface facile à utiliser qui permet aux utilisateurs de télécharger des fichiers, de segmenter automatiquement le contenu, de générer des questions et des réponses, et finalement de produire un...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

02.9K

MM-EUREKA : Un outil d'apprentissage par renforcement multimodal pour explorer le raisonnement visuel

Introduction complète MM-EUREKA est un projet open source développé par le laboratoire d'intelligence artificielle de Shanghai, l'université Jiao Tong de Shanghai et d'autres parties. Il étend les capacités de raisonnement textuel aux scénarios multimodaux grâce à des techniques d'apprentissage par renforcement basées sur des règles afin d'aider les modèles à traiter les images et les informations textuelles. Le cœur de cet outil...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

02.8K

Maestro : un outil pour simplifier le processus de mise au point des modèles des principaux langages visuels open source

Introduction complète Maestro est un outil développé par Roboflow pour simplifier et accélérer le processus de mise au point de modèles multimodaux, afin que chacun puisse entraîner ses propres macromodèles visuels. Il fournit des recettes prêtes à l'emploi pour affiner les modèles de langage visuel (VLM) populaires tels que F...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 6 mois

02.8K

Open-Reasoner-Zero : Plate-forme de formation à l'apprentissage par renforcement du raisonnement à grande échelle (Open Source Large-Scale Reasoning Reinforcement Learning)

Introduction générale Open-Reasoner-Zero est un projet open source axé sur la recherche en apprentissage par renforcement (RL), développé par l'équipe Open-Reasoner-Zero sur GitHub. Il vise à fournir une formation efficace, évolutive et facile à ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 6 mois

02.7K

Search-R1 : Apprentissage par renforcement pour former de grands modèles de recherche et de raisonnement

Introduction générale Search-R1 est un projet open source, développé par PeterGriffinJin sur GitHub, construit sur le framework veRL. Il forme de grands modèles de langage (LLM) grâce à des techniques d'apprentissage par renforcement (RL), permettant aux modèles d'apprendre de manière autonome....

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

02.7K

X-R1 : Formation à faible coût de modèles 0,5B dans des appareils courants

Introduction générale X-R1 est un framework d'apprentissage par renforcement ouvert sur GitHub par l'équipe dhcode-cpp, visant à fournir aux développeurs un outil efficace et peu coûteux pour former des modèles basés sur l'apprentissage par renforcement de bout en bout. Le projet est soutenu par DeepSeek...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

02.6K

Optexity : un projet open source pour entraîner l'IA à effectuer des actions sur le web avec des démonstrations humaines

Introduction générale Optexity est un projet open source sur GitHub, développé par l'équipe Optexity. Son objectif principal est d'utiliser des données de démonstration humaines pour entraîner l'IA à effectuer des tâches informatiques, en particulier des opérations sur des pages web. Le projet contient trois bibliothèques de code : Compute...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle # Desktop Automation Intelligence

Il y a 4 mois

02.6K

GraphGen : amélioration des modèles de langage à l'aide de graphes de connaissances pour générer des données synthétiques

Introduction complète GraphGen est un framework open source développé par OpenScienceLab, un laboratoire d'IA à Shanghai, hébergé sur GitHub, axé sur l'optimisation de la mise au point supervisée des grands modèles de langage (LLM) en guidant la génération de données synthétiques par le biais de graphes de connaissances. Il a été développé à partir de ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle # Knowledge Graph

Il y a 3 mois

02.3K

MiniMind-V : 1 heure d'entraînement de 26M modèles paramétriques de langage visuel

Introduction générale MiniMind-V est un projet open source, hébergé sur GitHub, conçu pour aider les utilisateurs à entraîner un modèle de langage visuel léger (VLM) avec seulement 26 millions de paramètres en moins d'une heure. Il est basé sur le modèle de langage MiniMind, avec de nouvelles...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

02.3K

ColossalAI : des solutions efficaces pour la formation de modèles d'IA à grande échelle

Introduction ColossalAI est une plateforme open-source développée par HPC-AI Technologies, visant à fournir une solution efficace et rentable pour l'entraînement et l'inférence de modèles d'IA à grande échelle. En prenant en charge de multiples stratégies parallèles, une gestion hétérogène de la mémoire et une formation à précision mixte, ColossalAI...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 6 mois

02.2K

Ce n'est pas le cas.