R1 Overthinker: forçando os modelos R1 do DeepSeek a pensar mais

Recursos mais recentes de IAPublicado há 8 meses Círculo de compartilhamento de IA

17.8K 00

Introdução geral

DeepSeek O R1 Overthinker é um software especializado para aprimorar DeepSeek R1 Uma ferramenta projetada para que os modelos pensem profundamente. Ao prolongar o processo de raciocínio do modelo, a ferramenta permite que o modelo pense mais profundamente, melhorando assim a qualidade e a precisão de suas respostas. A ferramenta utiliza sem preguiça Modelos otimizados com suporte ilimitado ao comprimento do contexto (dependendo da VRAM disponível). Os usuários podem personalizar as extensões de inferência e os limites de reflexão, controlar com precisão os parâmetros do modelo (por exemplo, temperatura, top-p, etc.) e acompanhar em tempo real a reflexão de token Contagens. o DeepSeek R1 Overthinker é adequado para uma ampla variedade de configurações de VRAM e suporta uma ampla variedade de tamanhos de modelos (de 1,5B a 70B parâmetros).

O princípio do projeto é inspecionar constantemente o resultado e substituir por uma frase de repensar, que inspirou o projeto:r1_overthinker .

Lista de funções

Forçar os modelos a pensar mais e com mais profundidade
Extensões de raciocínio e limites de pensamento personalizados
Controle fino dos parâmetros do modelo (temperatura, top-p, etc.)
Visibilidade em tempo real dos processos de pensamento e rastreamento da contagem de tokens
Suporte para expressões matemáticas LaTeX
Otimizado para várias configurações de VRAM
Suporta vários tamanhos de modelos (parâmetros de 1,5B a 70B)

Usando a Ajuda

Processo de instalação

estar em movimento Google Colab.

Diretrizes para uso

iniciar um aplicativo::
- estar em movimento python r1_overthinker.py Inicie o aplicativo.
- Quando o aplicativo é iniciado, ele carrega o modelo DeepSeek R1 e se prepara para processar a entrada.
processamento de entrada::
- Digite uma frase ou um parágrafo e o aplicativo o processará por meio de um processo de raciocínio estendido.
- O aplicativo detecta quando o modelo tenta encerrar seu raciocínio e o substitui por dicas que incentivam o raciocínio adicional até que um limite de tempo de raciocínio especificado pelo usuário seja atingido.
Tempo de reflexão personalizado::
- Os usuários podem especificar limites de tempo de reflexão ao iniciar o aplicativo, por exemplo:
```
python r1_overthinker.py --min-think-time 10
```
- O comando acima definirá o tempo mínimo que o modelo precisa para pensar sobre isso como 10 segundos.
Exibir resultados::
- Quando o processamento estiver concluído, o aplicativo emitirá os resultados do raciocínio estendido e o usuário poderá visualizar o processo de raciocínio mais aprofundado do modelo.

Procedimento de operação detalhado

Configurações de inicialização::
- Ao usá-lo pela primeira vez, certifique-se de que todas as dependências tenham sido instaladas corretamente e que as configurações iniciais tenham sido feitas.
- Verifique a disponibilidade de VRAM para garantir que comprimentos de contexto maiores sejam tratados.
Processamento de texto de entrada::
- Insira o texto a ser processado e o aplicativo detectará e ampliará automaticamente o processo de inferência do modelo.
- Durante o processamento, o usuário pode visualizar o progresso do raciocínio do modelo e o estado atual do pensamento em tempo real.
Configurações personalizadas::
- Os usuários podem ajustar os limites de tempo de reflexão e outros parâmetros conforme necessário para obter os melhores resultados.
- O aplicativo suporta uma ampla variedade de configurações personalizáveis que os usuários podem ajustar de forma flexível para se adequar a diferentes cenários de uso.
Saída de resultados::
- Após a conclusão do processamento, o aplicativo emitirá os resultados completos do raciocínio, que o usuário pode visualizar e analisar o processo de pensamento do modelo.
- A saída de resultados suporta uma variedade de formatos para que o usuário possa salvar e processar posteriormente, conforme necessário.