R1オーバーシンカー：DeepSeek R1モデルに長い思考を強いる

63.8K 00

はじめに

ディープシーク R1 Overthinkerは、以下のような強化に特化したソフトウェアである。ディープシークR1 モデルが深く考えるために設計されたツール。モデルの推論プロセスを長くすることによって、このツールはモデルがより深く考えることを可能にし、それによって答えの質と正確さを向上させます。このツールは以下を利用する。アンロス無制限のコンテキスト長をサポートする最適化されたモデル（利用可能なVRAMに依存）。ユーザーは、推論の拡張やシンクスルーのしきい値をカスタマイズしたり、モデルのパラメータ（温度、top-pなど）を細かく制御したり、以下のようなシンクスルーをリアルタイムで追跡することができます。トークン DeepSeek R1 Overthinkerは、幅広いVRAM構成に適しており、幅広いモデルサイズ（1.5B～70Bパラメータ）をサポートしています。

このプロジェクトの原則は、常にアウトプットを点検し、を再考の文章に置き換えることである：r1_overthinker .

機能一覧

モデルにより長く深い思考を強いる
カスタム推論拡張と思考しきい値
モデルパラメーターの微調整（温度、top-pなど）
思考プロセスのリアルタイム可視化とトークン数のトラッキング
LaTeXの数式をサポート
様々なVRAM構成に最適化
複数のモデルサイズをサポート（1.5B～70Bパラメータ）

ヘルプの使用

設置プロセス

うごきだすグーグルコラボ.

使用ガイドライン

アプリケーションを起動する::
- うごきだす python r1_overthinker.py アプリケーションを起動する。
- アプリケーションが起動すると、DeepSeek R1 モデルがロードされ、入力処理の準備が行われます。
入力処理::
- 文章や段落を入力すると、アプリケーションはそれを拡張推論プロセスで処理する。
- このアプリケーションは、モデルが思考を終了しようとするタイミングを検出し、ユーザーが指定した思考時間のしきい値に達するまで、推論をさらに促すキューに置き換える。
カスタマイズされた思考時間::
- ユーザーは、例えばアプリケーションを起動する際に、時間のしきい値を指定することができます：
```
python r1_overthinker.py --min-think-time 10
```
- 上記のコマンドは、モデルが考えるのに必要な最小時間を10秒に設定する。
結果を見る::
- 処理が完了すると、アプリケーションは拡張推論の結果を出力し、ユーザーはモデルのより詳細な推論プロセスを見ることができる。

詳しい操作手順

初期設定::
- 初めて使用する場合は、すべての依存関係が正しくインストールされ、初期設定が行われていることを確認してください。
- より大きなコンテキスト長が処理されるように、VRAMの利用可能性を確認する。
入力テキスト処理::
- 処理するテキストを入力すると、アプリケーションは自動的にモデルの推論プロセスを検出し、拡張します。
- 処理中、ユーザーはモデルの推論の進捗状況や現在の思考状態をリアルタイムで見ることができる。
カスタマイズされた設定::
- ユーザーは、最良の結果を得るために、必要に応じて思考時間のしきい値やその他のパラメーターを調整することができる。
- このアプリケーションはカスタマイズ可能な幅広い設定をサポートしており、ユーザーはさまざまな利用シーンに合わせて柔軟に調整することができる。
結果出力::
- 処理が完了すると、アプリケーションは完全な推論結果を出力し、ユーザーはそれを見てモデルの思考過程を分析することができる。
- 結果出力はさまざまな形式に対応しているので、ユーザーは必要に応じて保存し、さらに処理することができる。