R1 Overthinker: obligar a los modelos DeepSeek R1 a pensar más tiempo

Introducción general

DeepSeek El R1 Overthinker es un software especializado para mejorar DeepSeek R1 Una herramienta diseñada para que los modelos piensen en profundidad. Al alargar el proceso de razonamiento del modelo, la herramienta le permite pensar más profundamente, mejorando así la calidad y precisión de sus respuestas. La herramienta utiliza antipático Modelos optimizados que admiten una longitud de contexto ilimitada (en función de la VRAM disponible). Los usuarios pueden personalizar las extensiones de inferencia y los umbrales de think-through, controlar con precisión los parámetros del modelo (por ejemplo, temperatura, top-p, etc.) y realizar un seguimiento en tiempo real del think-through de los modelos. ficha Counts. el DeepSeek R1 Overthinker es adecuado para una amplia gama de configuraciones de VRAM y admite una amplia gama de tamaños de modelo (de 1,5B a 70B parámetros).

El principio del proyecto es inspeccionar constantemente la salida y sustituir por una frase de replanteamiento, que inspiró el proyecto:r1_sobrepensador .

R1 Overthinker:强制 DeepSeek R1 模型延长思考时间

 

Lista de funciones

  • Obligar a los modelos a pensar durante más tiempo y en profundidad
  • Extensiones de razonamiento y umbrales de pensamiento personalizados
  • Control preciso de los parámetros del modelo (temperatura, top-p, etc.)
  • Visibilidad en tiempo real de los procesos de pensamiento y seguimiento del recuento de fichas
  • Compatibilidad con expresiones matemáticas LaTeX
  • Optimizado para varias configuraciones de VRAM
  • Admite varios tamaños de modelo (de 1,5B a 70B de parámetros)

 

Utilizar la ayuda

Proceso de instalación

  1. estar en movimiento Google Colab.

Normas de uso

  1. lanzar una aplicación::
    • estar en movimiento python r1_overthinker.py Inicie la aplicación.
    • Cuando la aplicación se inicia, carga el modelo DeepSeek R1 y se prepara para procesar la entrada.
  2. tratamiento de entradas::
    • Introduzca una frase o un párrafo y la aplicación lo procesará mediante un proceso de razonamiento ampliado.
    • La aplicación detecta cuándo el modelo intenta poner fin a su pensamiento y lo sustituye por pistas que fomentan el razonamiento adicional hasta alcanzar un umbral de tiempo de pensamiento especificado por el usuario.
  3. Tiempo de reflexión personalizado::
    • Los usuarios pueden especificar umbrales de tiempo de reflexión al iniciar la aplicación, por ejemplo:
      python r1_overthinker.py --min-think-time 10
      
    • El comando anterior fijará el tiempo mínimo que el modelo necesita para pensar en ello en 10 segundos.
  4. Ver resultados::
    • Una vez finalizado el procesamiento, la aplicación mostrará los resultados del razonamiento ampliado y el usuario podrá ver el proceso de razonamiento más profundo del modelo.

Procedimiento de funcionamiento detallado

  1. Ajustes de inicialización::
    • Cuando lo utilice por primera vez, asegúrese de que todas las dependencias se han instalado correctamente y de que se han realizado los ajustes iniciales.
    • Compruebe la disponibilidad de VRAM para asegurarse de que se manejan longitudes de contexto mayores.
  2. Tratamiento del texto de entrada::
    • Introduzca el texto que desea procesar y la aplicación detectará y ampliará automáticamente el proceso de inferencia del modelo.
    • Durante el procesamiento, el usuario puede ver en tiempo real el progreso del razonamiento del modelo y el estado actual del pensamiento.
  3. Ajustes personalizados::
    • Los usuarios pueden ajustar los umbrales de tiempo de reflexión y otros parámetros según sea necesario para obtener los mejores resultados.
    • La aplicación admite una amplia gama de configuraciones personalizables que los usuarios pueden ajustar con flexibilidad para adaptarse a diferentes escenarios de uso.
  4. Resultado::
    • Una vez finalizado el procesamiento, la aplicación mostrará los resultados completos del razonamiento, que el usuario podrá visualizar y analizar el proceso de pensamiento del modelo.
    • La salida de resultados admite diversos formatos para que los usuarios puedan guardarlos y seguir procesándolos según sus necesidades.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...