ある クライン Plan & Actモデルがリリースされた同じ日に、DeepSeekはR1モデルを導入しました。興味深い現象が起こった。開発者が自発的に、計画フェーズにR1を使用し、コード実装に3.5-Sonnetを使用し始めたのである。これは事前に準備されたものではなく、両モデルの長所に対する自然な理解に基づいていた。
開発者のための新しいワークフロー
開発者たちが見つけたベストプラクティスはこうだ:
- 計画段階: R1 モデル($0.55/M トークン)を使用して、Plan モードで新しいタスクを開始する。
- 綿密な話し合い: 綿密な計画対話を行い、アーキテクチャ、エッジケース、可能なソリューションについて議論する。
- コードの実装: プランニングが完了したら、3.5ソネットモデルに切り替えてコーディングする。
- 反復最適化: 計画を見直す必要が生じたり、複雑な問題が発生した場合は、R1モデルに戻す。
コストとパフォーマンスの両立
このワークフローの利点はパフォーマンスだけでなく、コスト削減にもある:
- R1モデルのプランニング: 費用はおよそ$0.55/Mトークン。
- 3.5-ソネットのモデルプランニング: 費用は約$16/Mトークン。
- 計画段階でのコスト削減: 97%まで。
さらに、オースティン・スタークスが分析で指摘しているように、R1モデルは推論力という点では他のモデルと同等かそれ以上である。3.5ソネット・モデルがコードで実装できることが証明されていることと相まって、開発者は最適な結果を得ることができる。
2つのモデルは互いに補完し合う
このモデルの成功の鍵は、それぞれのモデルの特徴を十分に活かすことである:
R1モデル:計画段階に最適
- ディープ・アーキテクチャー・シンキング 綿密なシステムアーキテクチャ設計ができる
- エッジケースの探求: 潜在的なエッジケースを特定し、対処することに長けている。
- システム設計の決定: 適切なシステム設計を決定する能力
- 費用対効果の高い推論: 推論タスクにおけるコスト優位性。
3.5 ソネット・モデル:コード執行の確実な保証
- 正確なコード生成: 正確で信頼性の高いコードを生成する能力
- 複雑な再構成機能: 複雑なコードのリファクタリングも可能だ。
- 簡単なバグ修正: コードのエラーを素早く見つけ、修正する能力。
- 確かな信頼性: 実用上の信頼性が高い。
このワークフローの適用方法
- プランモードが有効になる: R1モデルを使用して、クラインのプランモードを開始する。
- 対話のための計画 プログラムの詳細を明確にするため、完全なプランニング・ダイアログを行う。
- ソネットに切り替える: プランニングが完了したら、3.5ソネット・モデルに切り替えてコードを書く。
- 反復最適化: プランを修正する必要がある場合は、R1モデルに切り替えて調整する。
概要
R1対o1や3.5-Sonnetだけでなく、適切な段階で適切なツールを使うことが重要なのだ。AI開発の未来は、万能モデルを見つけることではなく、タスクのニーズに応じてさまざまなモデルを活用できる柔軟性を持つことなのだ。
特筆すべきは、このベストプラクティスが事前に設計されたものではなく、クラインの開発者たちが実戦の中で自発的に模索したものだということだ。この発見は、コミュニティの知恵を雄弁に物語っており、その結果はこのワークフローの価値を証明している。
このR1とソネットのワークフローを試したことがありますか?他に効果的なモデルの組み合わせはありますか?
私たちの目標は、ソフトウェア開発の各段階でさまざまなモデルを活用し、最適なツールを使用することで、より優れたソフトウェアを構築することです。