Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1

R1 Overthinker: forçando os modelos R1 do DeepSeek a pensar mais

Introdução geral

DeepSeek O R1 Overthinker é um software especializado para aprimorar DeepSeek R1 Uma ferramenta projetada para que os modelos pensem profundamente. Ao prolongar o processo de raciocínio do modelo, a ferramenta permite que o modelo pense mais profundamente, melhorando assim a qualidade e a precisão de suas respostas. A ferramenta utiliza sem preguiça Modelos otimizados com suporte ilimitado ao comprimento do contexto (dependendo da VRAM disponível). Os usuários podem personalizar as extensões de inferência e os limites de reflexão, controlar com precisão os parâmetros do modelo (por exemplo, temperatura, top-p, etc.) e acompanhar em tempo real a reflexão de token Contagens. o DeepSeek R1 Overthinker é adequado para uma ampla variedade de configurações de VRAM e suporta uma ampla variedade de tamanhos de modelos (de 1,5B a 70B parâmetros).

O princípio do projeto é inspecionar constantemente o resultado e substituir por uma frase de repensar, que inspirou o projeto:r1_overthinker .

DeepSeek R1 Overthinker: forçando o modelo de destilação do DeepSeek R1 para estender o tempo de raciocínio-1

 

Lista de funções

  • Forçar os modelos a pensar mais e com mais profundidade
  • Extensões de raciocínio e limites de pensamento personalizados
  • Controle fino dos parâmetros do modelo (temperatura, top-p, etc.)
  • Visibilidade em tempo real dos processos de pensamento e rastreamento da contagem de tokens
  • Suporte para expressões matemáticas LaTeX
  • Otimizado para várias configurações de VRAM
  • Suporta vários tamanhos de modelos (parâmetros de 1,5B a 70B)

 

Usando a Ajuda

Processo de instalação

  1. estar em movimento Google Colab.

Diretrizes para uso

  1. iniciar um aplicativo::
    • estar em movimento python r1_overthinker.py Inicie o aplicativo.
    • Quando o aplicativo é iniciado, ele carrega o modelo DeepSeek R1 e se prepara para processar a entrada.
  2. processamento de entrada::
    • Digite uma frase ou um parágrafo e o aplicativo o processará por meio de um processo de raciocínio estendido.
    • O aplicativo detecta quando o modelo tenta encerrar seu raciocínio e o substitui por dicas que incentivam o raciocínio adicional até que um limite de tempo de raciocínio especificado pelo usuário seja atingido.
  3. Tempo de reflexão personalizado::
    • Os usuários podem especificar limites de tempo de reflexão ao iniciar o aplicativo, por exemplo:
      python r1_overthinker.py --min-think-time 10
      
    • O comando acima definirá o tempo mínimo que o modelo precisa para pensar sobre isso como 10 segundos.
  4. Exibir resultados::
    • Quando o processamento estiver concluído, o aplicativo emitirá os resultados do raciocínio estendido e o usuário poderá visualizar o processo de raciocínio mais aprofundado do modelo.

Procedimento de operação detalhado

  1. Configurações de inicialização::
    • Ao usá-lo pela primeira vez, certifique-se de que todas as dependências tenham sido instaladas corretamente e que as configurações iniciais tenham sido feitas.
    • Verifique a disponibilidade de VRAM para garantir que comprimentos de contexto maiores sejam tratados.
  2. Processamento de texto de entrada::
    • Insira o texto a ser processado e o aplicativo detectará e ampliará automaticamente o processo de inferência do modelo.
    • Durante o processamento, o usuário pode visualizar o progresso do raciocínio do modelo e o estado atual do pensamento em tempo real.
  3. Configurações personalizadas::
    • Os usuários podem ajustar os limites de tempo de reflexão e outros parâmetros conforme necessário para obter os melhores resultados.
    • O aplicativo suporta uma ampla variedade de configurações personalizáveis que os usuários podem ajustar de forma flexível para se adequar a diferentes cenários de uso.
  4. Saída de resultados::
    • Após a conclusão do processamento, o aplicativo emitirá os resultados completos do raciocínio, que o usuário pode visualizar e analisar o processo de pensamento do modelo.
    • A saída de resultados suporta uma variedade de formatos para que o usuário possa salvar e processar posteriormente, conforme necessário.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " R1 Overthinker: forçando os modelos R1 do DeepSeek a pensar mais
pt_BRPortuguês do Brasil