OpenReasoning-Nemotron - Série de modèles de raisonnement Open Source de NVIDIA

Dernières ressources sur l'IAPosté il y a 2 mois Cercle de partage de l'IA

14.3K 00

Qu'est-ce que OpenReasoning-Nemotron ?

OpenReasoning-Nemotron est une série de modèles de langage à grande échelle mis à disposition par NVIDIA pour faciliter le traitement des tâches de raisonnement dans les domaines des mathématiques, des sciences et du code. Les modèles sont basés sur DeepSeek Le modèle R1 0528 est distillé à partir du modèle R1 0528, avec des échelles de paramètres de 1,5B, 7B, 14B et 32B pour répondre à différents besoins de calcul. Basé sur la distillation de données à grande échelle et la formation supervisée à la mise au point, le modèle a une excellente capacité d'inférence et surpasse ses concurrents dans le domaine des mathématiques. openReasoning-Nemotron prend en charge le mode d'inférence "lourd", qui est combiné à l'algorithme GenSelect et à la collaboration multi-intelligence pour améliorer encore l'effet de l'inférence. Le modèle fonctionne localement et est pris en charge par LM. Le modèle fonctionne localement et peut être déployé avec des outils tels que LM Studio, fournissant un outil puissant pour l'éducation, la recherche et le développement de code.

Caractéristiques principales de OpenReasoning-Nemotron

Des capacités de raisonnement très efficacesLe logiciel : excelle dans des domaines complexes tels que les mathématiques, les sciences et le code, en générant des solutions de raisonnement de haute qualité qui fournissent aux utilisateurs des analyses et des réponses logiques précises.
Modèles de taille variableLe modèle est disponible dans une variété d'échelles de paramètres (1,5B, 7B, 14B et 32B), et l'utilisateur choisit la version appropriée du modèle en fonction de ses ressources informatiques et des exigences de sa tâche.
Le modèle de raisonnement "lourdLe système GenSelect : Basé sur l'algorithme GenSelect qui combine les résultats du raisonnement de plusieurs intelligences pour optimiser les performances, il excelle dans les tâches de mathématiques et de codage et fournit de meilleures solutions.
Un soutien de base solideLes résultats de l'étude : constituent un point de départ puissant pour les futures recherches sur le raisonnement basé sur l'apprentissage par renforcement (RL), en aidant à développer des techniques de raisonnement plus efficaces.
Support local d'exécutionLe système d'exploitation local 100% est facile à déployer et à utiliser par les utilisateurs à l'aide d'outils tels que LM Studio.

Adresse du site officiel d'OpenReasoning-Nemotron

Bibliothèque de modèles HuggingFace: : https://huggingface.co/collections/nvidia/openreasoning-nemotron-687730dae0170059860f1f01

Comment utiliser OpenReasoning-Nemotron

Utilisation du concentrateur Hugging Face: :Accédez à l'adresse de la bibliothèque du modèle HuggingFace.
Installer la bibliothèque des transformateurs Hugging FaceInstallation de Hugging Face (visage étreint) transformers installez-la à l'aide de la commande suivante :

pip install transformers

Modèles de chargementUtilisation de la transformers La bibliothèque charge le modèle OpenReasoning-Nemotron sélectionné. Par exemple, charger un modèle avec 7B paramètres :

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "nvidia/OpenReasoning-Nemotron-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

Générer des résultats d'inférenceGénérer des résultats de raisonnement à l'aide de modèles. Par exemple, générer une réponse à un problème mathématique :

input_text = "Solve the equation 2x + 3 = 7."
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs, max_length=50)
result = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(result)

Principaux avantages d'OpenReasoning-Nemotron

Un raisonnement solideLe programme de raisonnement mathématique : Il se concentre sur les tâches de raisonnement mathématique, scientifique et de codage, en fournissant des solutions de raisonnement de haute qualité basées sur la collaboration multi-intelligence et des performances mathématiques supérieures.
Modèles de taille variableLe système est disponible en quatre tailles de paramètres : 1,5B, 7B, 14B et 32B pour répondre aux différentes ressources informatiques et exigences des tâches.
Techniques de formation avancéesLes résultats de cette étude sont les suivants : la distillation de données à grande échelle et le réglage fin supervisé (SFT), l'apprentissage par renforcement (RL) n'ont pas été utilisés, ce qui constitue une base solide pour les recherches ultérieures.
Un déploiement et une utilisation efficacesLa version française du logiciel : supporte l'exécution locale, le déploiement de LM Studio et l'intégration avec Hugging Face Hub pour un chargement et une utilisation rapides.
Des modèles de référence puissantsLe projet de recherche sur l'apprentissage par renforcement (RL) a pour objectif de fournir un point de départ puissant pour la recherche sur l'apprentissage par renforcement afin de soutenir le raisonnement et les solutions à des problèmes complexes dans de nombreux domaines.
Source ouverte et soutien de la communautéLe modèle : En tant que modèle open source, les utilisateurs ont un accès libre au code ainsi qu'aux riches ressources et au soutien de la communauté Hugging Face.

Personnes pour lesquelles OpenReasoning-Nemotron est disponible

chercheurLe projet est destiné aux universitaires et aux chercheurs travaillant dans les domaines de l'intelligence artificielle, de l'apprentissage automatique et du traitement du langage naturel pour l'exploration et l'optimisation des algorithmes d'inférence.
éducateurLes enseignants qui ont besoin d'aides pour aider les élèves à comprendre et à résoudre des problèmes complexes dans le cadre de l'enseignement des mathématiques, des sciences et d'autres matières.
écoliersLes étudiants qui étudient des matières telles que les mathématiques, les sciences, la programmation, etc. répondent à des questions et à des aides à l'étude à l'aide de modèles.
développeur de logicielsLes programmes d'études : Les programmeurs et les équipes de développement qui ont besoin de générer du code, d'optimiser les performances du code ou de déboguer le code.
scientifique des donnéesLes professionnels de l'analyse de données complexes et du calcul scientifique, en s'appuyant sur le raisonnement à l'aide de modèles.