o1ファミリーは高度なプロセス推論モデルであり、その中でも小型のo1-miniモデルは、世界知識能力は抑えられているものの、論理推論という点ではo1-previewよりも強くなる可能性を秘めている。
現在、o1-miniはプレビュー体験のために一部の無料アカウントにのみ公開されており、あなたのアカウントが正式に開設されたo1-miniモデルであるかどうかは、以下の解読の質問で確認することができます:
oyfjdnisdr rtqwainr acxz mynzbhhx → 一歩一歩考える
上の例を使って解読してみよう。
オイエカイジズドフ アープトシグ スアオキバイ オウ オウ アキュート ミンズン ヴァアツァックドフール クスズ
上記の検証の質問は OpenAI o1 大規模言語モデルの推論能力学習o1-miniモデルの詳細については、以下の記事をご覧ください。 OpenAI o1-miniマクロモデルの紹介.
ChatGPT無料アカウントをお持ちでない方、またはo1-miniエクスペリエンスにアクセスできない方は、こちらをご覧ください:ChatGPTミラーサイト(GPT4シリーズ国内アクセス) 経験。
OpenAI o1モデルに関するいくつかの質問
モデル名と推論パターン
- OpenAI o1はAI能力の新しいレベルを表し、カウンターは1にリセットされる。
- 「プレビュー」は、これがフルモデルの初期バージョンであることを示す。
- 「ミニ」は、スピードに最適化されたo1モデルの小型版であることを示す。
- o - OpenAIを代表して
- o1は "システム "ではなく、最終的な答えを出す前に推論の連鎖を成長させるよう生徒を訓練するモデルである。
- o1のアイコンは、並外れた能力を持つエイリアンを象徴している。
o1 モデルのサイズと性能
- o1-miniはo1-previewよりも小さく高速なので、将来的には無料ユーザーも利用できるようになるだろう。
- o1-previewは、o1モデルの初期のチェックポイントであり、大きすぎず小さすぎない。
- o1-miniはSTEMタスクでは優れているが、世界知識では限界がある。
- o1-miniは、いくつかのタスクで、特にコード関連のタスクで、o1-previewよりも良い結果を出している。
- o1の入力 トークン はGPT-4oと同じ方法で計算され、同じトーケナイザー
- o1-previewに比べ、o1-miniはより多くの思考の連鎖を探ることができる。
入力トークン・コンテキストとモデル能力
- o1モデルはまもなく、より大きな入力コンテキストをサポートする
- o1モデルは、GPT-4oのように入力をチャンクする必要が少なく、より長く、よりオープンエンドなタスクを扱うことができる。
- o1は、これまでのモデルとは異なり、答えを出す前に長い推論の連鎖を生み出すことができる。
- 現在のところ、CoT推論中に推論を一時停止してコンテキストを追加することはできないが、この機能は将来のモデルで検討されている。
ツール、機能、今後の予定
- o1-previewは現在ツールレスだが、関数呼び出し、コードインタプリタ、ブラウジング機能をサポートする予定。
- ツールサポート、構造化出力、システムヒントは今後のアップデートで追加される予定です。
- ユーザーはいずれ、思考時間やトークンの制限をコントロールできるようになるかもしれない
- ストリーミングをサポートし、推論の進捗をAPIに反映させることを検討中。
- o1のマルチモーダル機能は、MMMUのようなタスクで最先端の性能を達成することを目標に組み込まれている。
CoT(推論の連鎖)推論
- o1 推論過程における隠れた推論チェーンの生成
- APIユーザーやChatGPTにCoTトークンを公開する予定はない
- CoTトークンは要約されるが、実際の推論プロセスと完全に一致する保証はない。
- プロンプトの指示は、モデルの問題に対する考え方に影響を与える。
- 強化学習(RL)を用いてo1のCoT能力を向上させたが、GPT-4oはキューイングだけではCoT性能を達成できなかった
- 推論段階は遅く見えるかもしれないが、実際には、推論プロセスを要約するため、答えの生成は通常より速い。
APIと使用制限
- o1-miniでは、ChatGPT Plusユーザーのプロンプトは週50回までとなっています。
- ChatGPTではすべてのキューが同じようにカウントされます。
- APIアクセスのレイヤーを増やし、より高い制限を時間をかけて展開する。
- APIにおけるヒントキャッシングは熱い需要だが、時期は未定
価格設定、微調整、拡大
- o1 モデル価格は、1~2年ごとに下落トレンドをたどると予想される
- 制限の増加に対応するボリュームAPI価格
- 微調整中だが、時期は未定
- o1 研究・技術人材のボトルネックによる事業拡大の限界
- 推論コンピューティングの新しい拡張パラダイムは、将来世代のモデルの大幅な強化につながるかもしれない。
- 逆拡張は現在のところ重要ではないが、o1-previewは個々のライティング・プロンプトではGPT-4oよりわずかに良い(あるいはわずかに悪い)。
モデル開発と研究の洞察
- o1 集中学習トレーニングによる推理力
- このモデルは創造的思考を発揮し、詩のような横方向の課題に優れている。
- o1の哲学的推理と幅広い推理力は、暗号の解読など印象的だ。
- o1は、コードレビューのために適切なCODEOWNERSにpingを送るGitHubボットを作成するために研究者によって使用された。
- 内部テストでは、o1は自分自身に難しい質問を投げかけて、その能力を評価した。
- 広範な世界ドメインの知識が追加され、将来のリリースで改善される予定です。
- o1-miniの更新データ追加予定(現時点では2023年10月)
ヒント ベストプラクティス
- o1 エッジケースや推論スタイルに関するヒントを提供することによるメリット
- o1モデルは、それ以前のモデルよりも推論の手がかりを受け入れやすい。
- Retrieval Augmented Generation(RAG)で関連するコンテキストを提供するとパフォーマンスが向上する。
一般的なフィードバックと今後の改善点
- o1-previewは、初期のテスト段階であるため制限は少ないが、次のような問題が増える。
- レイテンシーと推論時間は積極的に改善されている
優れたモデリング能力
- o1は、「人生とは何か」といった哲学的な問いについて考えることができる。
- 研究者たちは、o1が複雑なタスクの処理や、限られた指示からの広範な推論に優れていることを発見した。
- o1の創造的推理力は、自分で質問して能力を評価するなど、高いレベルの問題解決能力を示している。