OpenReasoning-Nemotron - Serie de modelos de razonamiento de código abierto de NVIDIA

Últimos recursos sobre IAPublicado hace 8 meses Círculo de intercambio de inteligencia artificial

40.4K 00

¿Qué es OpenReasoning-Nemotron?

OpenReasoning-Nemotron es una serie de modelos de lenguaje a gran escala de código abierto de NVIDIA para el procesamiento de tareas de razonamiento en matemáticas, ciencia y código. Los modelos se basan en DeepSeek El modelo R1 0528 se destila a partir del modelo R1 0528, con escalas de parámetros de 1,5B, 7B, 14B y 32B para satisfacer diferentes necesidades computacionales. Basado en la destilación de datos a gran escala y el entrenamiento supervisado de ajuste fino, el modelo tiene una excelente capacidad de inferencia y supera a sus competidores en el dominio matemático. openReasoning-Nemotron soporta el modo de inferencia "pesada", que se combina con el algoritmo GenSelect y la colaboración multi-inteligencia para mejorar aún más el efecto de inferencia. El modelo se ejecuta localmente y es compatible con LM. El modelo se ejecuta localmente y puede desplegarse con herramientas como LM Studio, proporcionando una potente herramienta para la educación, la investigación y el desarrollo de código.

Características principales de OpenReasoning-Nemotron

Gran capacidad de razonamiento: destaca en áreas complejas como las matemáticas, la ciencia y el código, generando soluciones de razonamiento de alta calidad que proporcionan a los usuarios análisis y respuestas lógicas precisas.
Tamaños de modelo flexiblesEl modelo está disponible en varias escalas de parámetros (1,5B, 7B, 14B y 32B), y el usuario elige la versión adecuada del modelo en función de sus recursos informáticos y los requisitos de su tarea.
El modelo de razonamiento "pesado: Basado en el algoritmo GenSelect, que combina los resultados de razonamiento de varias inteligencias para optimizar aún más el rendimiento, destaca en tareas matemáticas y de codificación y ofrece mejores soluciones.
Fuerte apoyo de baseproporcionan un poderoso punto de partida para futuras investigaciones sobre el razonamiento basado en el aprendizaje por refuerzo (RL), ayudando a desarrollar técnicas de razonamiento más eficientes.
Soporte de tiempo de ejecución local: Admite el funcionamiento local de 100%, que los usuarios pueden implantar y utilizar fácilmente con herramientas como LM Studio.

Dirección del sitio web oficial de OpenReasoning-Nemotron

Biblioteca de modelos HuggingFace:: https://huggingface.co/collections/nvidia/openreasoning-nemotron-687730dae0170059860f1f01

Cómo utilizar OpenReasoning-Nemotron

Hugging Face Hub Uso::Accede a la dirección de la biblioteca del modelo HuggingFace.
Instalar la biblioteca de Transformers Cara Abrazada: Instalación de Hugging Face transformers instálela con el siguiente comando:

pip install transformers

Modelos de carga: Uso de transformers La biblioteca carga el modelo OpenReasoning-Nemotron seleccionado. Por ejemplo, carga un modelo con parámetros 7B:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "nvidia/OpenReasoning-Nemotron-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

Generación de resultados de inferencia: Generar resultados de razonamiento con modelos. Por ejemplo, generar una respuesta a un problema matemático:

input_text = "Solve the equation 2x + 3 = 7."
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs, max_length=50)
result = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(result)

Principales ventajas de OpenReasoning-Nemotron

Razonamiento sólido: Se centra en tareas de razonamiento matemático, científico y de código, proporcionando soluciones de razonamiento de alta calidad basadas en la colaboración multiinteligencia y un rendimiento matemático superior.
Tamaños de modelo flexiblesEl sistema está disponible en cuatro tamaños de parámetro: 1,5B, 7B, 14B y 32B para satisfacer distintos recursos informáticos y requisitos de tareas.
Técnicas avanzadas de formaciónEl sistema de aprendizaje por refuerzo (RL), basado en la destilación de datos a gran escala y el ajuste fino supervisado (SFT), no se utilizó, lo que proporcionó una base sólida para investigaciones posteriores.
Despliegue y uso eficientes: Admite ejecución local, despliegue en LM Studio e integración con Hugging Face Hub para una carga y uso rápidos.
Potentes modelos de referenciaEl objetivo es proporcionar un potente punto de partida para la investigación del aprendizaje por refuerzo (RL) con el fin de apoyar el razonamiento y las soluciones a problemas complejos en múltiples dominios.
Código abierto y apoyo comunitarioComo modelo de código abierto, los usuarios tienen libre acceso al código y a los abundantes recursos y apoyo de la comunidad Hugging Face.

¿A quién va dirigido OpenReasoning-Nemotron?

investigador: Académicos e investigadores que trabajan en los campos de la Inteligencia Artificial, el Aprendizaje Automático y el Procesamiento del Lenguaje Natural para la exploración y optimización de algoritmos de inferencia.
educador: Profesores que necesitan ayudas para que los alumnos comprendan y resuelvan problemas complejos en la enseñanza de matemáticas, ciencias y otras asignaturas.
escolares: Los estudiantes de asignaturas como matemáticas, ciencias, programación, etc. responden a preguntas y ayudas de estudio con la ayuda de modelos.
desarrollador de software: Programadores y equipos de desarrollo que necesitan generar código, optimizar su rendimiento o depurarlo.
científico de datos: profesionales que se ocupan de tareas complejas de análisis de datos y cálculo científico, apoyándose en el razonamiento con modelos.