Introdução geral
DeepSeek O R1 Overthinker é um software especializado para aprimorar DeepSeek R1 Uma ferramenta projetada para que os modelos pensem profundamente. Ao prolongar o processo de raciocínio do modelo, a ferramenta permite que o modelo pense mais profundamente, melhorando assim a qualidade e a precisão de suas respostas. A ferramenta utiliza sem preguiça Modelos otimizados com suporte ilimitado ao comprimento do contexto (dependendo da VRAM disponível). Os usuários podem personalizar as extensões de inferência e os limites de reflexão, controlar com precisão os parâmetros do modelo (por exemplo, temperatura, top-p, etc.) e acompanhar em tempo real a reflexão de token Contagens. o DeepSeek R1 Overthinker é adequado para uma ampla variedade de configurações de VRAM e suporta uma ampla variedade de tamanhos de modelos (de 1,5B a 70B parâmetros).
O princípio do projeto é inspecionar constantemente o resultado e substituir por uma frase de repensar, que inspirou o projeto:r1_overthinker .
Lista de funções
- Forçar os modelos a pensar mais e com mais profundidade
- Extensões de raciocínio e limites de pensamento personalizados
- Controle fino dos parâmetros do modelo (temperatura, top-p, etc.)
- Visibilidade em tempo real dos processos de pensamento e rastreamento da contagem de tokens
- Suporte para expressões matemáticas LaTeX
- Otimizado para várias configurações de VRAM
- Suporta vários tamanhos de modelos (parâmetros de 1,5B a 70B)
Usando a Ajuda
Processo de instalação
- estar em movimento Google Colab.
Diretrizes para uso
- iniciar um aplicativo::
- estar em movimento
python r1_overthinker.py
Inicie o aplicativo. - Quando o aplicativo é iniciado, ele carrega o modelo DeepSeek R1 e se prepara para processar a entrada.
- estar em movimento
- processamento de entrada::
- Digite uma frase ou um parágrafo e o aplicativo o processará por meio de um processo de raciocínio estendido.
- O aplicativo detecta quando o modelo tenta encerrar seu raciocínio e o substitui por dicas que incentivam o raciocínio adicional até que um limite de tempo de raciocínio especificado pelo usuário seja atingido.
- Tempo de reflexão personalizado::
- Os usuários podem especificar limites de tempo de reflexão ao iniciar o aplicativo, por exemplo:
python r1_overthinker.py --min-think-time 10
- O comando acima definirá o tempo mínimo que o modelo precisa para pensar sobre isso como 10 segundos.
- Os usuários podem especificar limites de tempo de reflexão ao iniciar o aplicativo, por exemplo:
- Exibir resultados::
- Quando o processamento estiver concluído, o aplicativo emitirá os resultados do raciocínio estendido e o usuário poderá visualizar o processo de raciocínio mais aprofundado do modelo.
Procedimento de operação detalhado
- Configurações de inicialização::
- Ao usá-lo pela primeira vez, certifique-se de que todas as dependências tenham sido instaladas corretamente e que as configurações iniciais tenham sido feitas.
- Verifique a disponibilidade de VRAM para garantir que comprimentos de contexto maiores sejam tratados.
- Processamento de texto de entrada::
- Insira o texto a ser processado e o aplicativo detectará e ampliará automaticamente o processo de inferência do modelo.
- Durante o processamento, o usuário pode visualizar o progresso do raciocínio do modelo e o estado atual do pensamento em tempo real.
- Configurações personalizadas::
- Os usuários podem ajustar os limites de tempo de reflexão e outros parâmetros conforme necessário para obter os melhores resultados.
- O aplicativo suporta uma ampla variedade de configurações personalizáveis que os usuários podem ajustar de forma flexível para se adequar a diferentes cenários de uso.
- Saída de resultados::
- Após a conclusão do processamento, o aplicativo emitirá os resultados completos do raciocínio, que o usuário pode visualizar e analisar o processo de pensamento do modelo.
- A saída de resultados suporta uma variedade de formatos para que o usuário possa salvar e processar posteriormente, conforme necessário.