OpenReasoning-Nemotron - Série de modelos de raciocínio de código aberto da NVIDIA

Recursos mais recentes de IAPublicado há 2 meses Círculo de compartilhamento de IA

14.3K 00

O que é o OpenReasoning-Nemotron?

O OpenReasoning-Nemotron é uma série de modelos de linguagem em larga escala com código aberto da NVIDIA para dar suporte ao processamento de tarefas de raciocínio em matemática, ciências e código. Os modelos são baseados em DeepSeek O modelo R1 0528 é destilado do modelo R1 0528, com escalas de parâmetros de 1,5B, 7B, 14B e 32B para atender a diferentes necessidades computacionais. Com base na destilação de dados em grande escala e no treinamento de ajuste fino supervisionado, o modelo tem excelente capacidade de inferência e supera os concorrentes no domínio matemático. O openReasoning-Nemotron oferece suporte ao modo de inferência "pesada", que é combinado com o algoritmo GenSelect e a colaboração de várias inteligências para aprimorar ainda mais o efeito de inferência. O modelo é executado localmente e tem o suporte da LM. O modelo é executado localmente e pode ser implantado com ferramentas como o LM Studio, fornecendo uma ferramenta avançada para educação, pesquisa e desenvolvimento de código.

Principais recursos do OpenReasoning-Nemotron

Habilidades de raciocínio altamente eficazesO software de raciocínio de alta qualidade: destaca-se em áreas complexas, como matemática, ciências e códigos, gerando soluções de raciocínio de alta qualidade que fornecem aos usuários análises e respostas lógicas precisas.
Tamanhos flexíveis de modelosO modelo está disponível em uma variedade de escalas de parâmetros (1,5B, 7B, 14B e 32B), e o usuário escolhe a versão apropriada do modelo com base em seus recursos computacionais e requisitos de tarefas.
O modelo de raciocínio "pesado"GenSelect: Com base no algoritmo GenSelect, que combina os resultados de raciocínio de várias inteligências para otimizar ainda mais o desempenho, ele se destaca em tarefas matemáticas e de codificação e oferece soluções melhores.
Forte suporte de linha de baseOs resultados do estudo de caso da pesquisa de raciocínio baseado em aprendizado por reforço (RL) são um ponto de partida poderoso para o futuro, ajudando a desenvolver técnicas de raciocínio mais eficientes.
Suporte ao tempo de execução localSuporte à operação local 100%, que é facilmente implantada e usada pelos usuários com ferramentas como o LM Studio.

Endereço do site oficial do OpenReasoning-Nemotron

Biblioteca do modelo HuggingFace:: https://huggingface.co/collections/nvidia/openreasoning-nemotron-687730dae0170059860f1f01

Como usar o OpenReasoning-Nemotron

Uso do hub Hugging Face::Acesse o endereço da biblioteca do modelo HuggingFace.
Instalar a biblioteca de Transformadores de Rosto AbraçadoInstalação do Hugging Face transformers instale-a com o seguinte comando:

pip install transformers

Modelos de carregamentoUso de transformers A biblioteca carrega o modelo OpenReasoning-Nemotron selecionado. Por exemplo, carregue um modelo com parâmetros 7B:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "nvidia/OpenReasoning-Nemotron-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

Geração de resultados de inferênciaGerar resultados de raciocínio com modelos. Por exemplo, gerar uma resposta para um problema matemático:

input_text = "Solve the equation 2x + 3 = 7."
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs, max_length=50)
result = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(result)

Principais benefícios do OpenReasoning-Nemotron

Raciocínio sólidoFoco em tarefas de raciocínio matemático, científico e de código, fornecendo soluções de raciocínio de alta qualidade com base na colaboração de várias inteligências e no desempenho matemático superior.
Tamanhos flexíveis de modelosO sistema está disponível em quatro tamanhos de parâmetros: 1,5B, 7B, 14B e 32B para atender a diferentes recursos de computação e requisitos de tarefas.
Técnicas avançadas de treinamentoO aprendizado por reforço (RL) não foi usado com base na destilação de dados em larga escala e no ajuste fino supervisionado (SFT), fornecendo uma base sólida para pesquisas subsequentes.
Implementação e uso eficientesSuporte à execução local, implantação do LM Studio e integração com o Hugging Face Hub para carregamento e uso rápidos.
Modelos avançados de linha de baseO que é: Fornecer um ponto de partida poderoso para a pesquisa de aprendizagem por reforço (RL) para apoiar o raciocínio e as soluções de problemas complexos em vários domínios.
Código aberto e suporte da comunidadeComo um modelo de código aberto, os usuários têm acesso livre ao código e aos ricos recursos e suporte da comunidade Hugging Face.

A quem se destina o OpenReasoning-Nemotron?

pesquisadorEstudiosos e pesquisadores que trabalham nas áreas de Inteligência Artificial, Aprendizado de Máquina e Processamento de Linguagem Natural para a exploração e otimização de algoritmos de inferência.
educadorProfessores que precisam de auxílios para ajudar os alunos a entender e resolver problemas complexos no ensino de matemática, ciências e outras disciplinas.
crianças em idade escolarModelos: Os alunos que estão estudando disciplinas como matemática, ciências, programação etc. respondem a perguntas e ajudam nos estudos com a ajuda de modelos.
desenvolvedor de softwareProgramadores e equipes de desenvolvimento que precisam gerar código, otimizar o desempenho do código ou depurar o código.
cientista de dadosProfissionais que lidam com análise de dados complexos e tarefas de computação científica, com o apoio do raciocínio com modelos.