在 Cline 发布 Plan & Act 模式的同一天,DeepSeek 推出了 R1 模型。一个有趣的现象随即出现:开发者们开始自发地使用 R1 进行规划阶段,而使用 3.5-Sonnet 进行代码实施。这并非事先安排,而是基于对两种模型优势的自然理解。
开发者的新工作流
开发者们发现的最佳实践是:
- 规划阶段: 使用 R1 模型 ($0.55/M tokens)在 Plan 模式下启动新任务。
- 深入讨论: 进行深入的规划对话,讨论架构、边缘情况和可能的解决方案。
- 代码实施: 当规划完成后,切换到 3.5-Sonnet 模型进行代码编写。
- 迭代优化: 如需重新审视规划或遇到复杂问题,切换回 R1 模型。
成本与性能的双重提升
这种工作流的优势不仅在于性能,还体现在成本节约上:
- R1 模型规划: 成本约为 $0.55/M tokens。
- 3.5-Sonnet 模型规划: 成本约为 $16/M tokens。
- 规划阶段成本降低: 高达 97%。
此外,正如 Austin Starks 在 他的分析 中指出的,R1 模型在推理能力上与其它模型持平或更优。结合 3.5-Sonnet 模型在代码实现方面的成熟能力,开发者可以实现最佳效果。
两种模型优势互补
这种模式成功的关键在于,充分利用了每个模型的特点:
R1 模型:规划阶段的理想选择
- 深度架构思考: 能够进行深入的系统架构设计。
- 边缘情况探索: 善于发现并处理潜在的边缘情况。
- 系统设计决策: 能够做出合理的系统设计决策。
- 经济高效的推理: 在推理任务中具有成本优势。
3.5-Sonnet 模型:代码实施的可靠保障
- 精确代码生成: 能够生成准确可靠的代码。
- 复杂重构能力: 可以进行复杂的代码重构。
- 快速错误修复: 能够快速定位并修复代码中的错误。
- 久经考验的可靠性: 在实际应用中具有高度的可靠性。
如何应用此工作流
- Plan 模式启动: 在 Cline 中使用 R1 模型启动 Plan 模式。
- 规划对话: 进行充分的规划对话,确定方案细节。
- 切换到 Sonnet: 完成规划后,切换到 3.5-Sonnet 模型编写代码。
- 迭代优化: 如需修改计划,切换回 R1 模型进行调整。
总结
这不仅仅是 R1 与 o1 或 3.5-Sonnet 之间的对比,而是关于在合适的阶段使用合适的工具。AI 开发的未来不是寻找一个万能模型,而是根据任务需求,灵活运用不同模型的优势。
值得注意的是,这种最佳实践并非预先设计,而是 Cline 开发者们在实际使用中自发探索出来的。这一发现充分体现了社区的智慧,其效果也证明了这种工作流的价值。
您是否尝试过这种 R1/Sonnet 工作流?您还发现了哪些其它有效的模型组合?
我们的目标是利用不同模型的优势,在软件开发的每个阶段都使用最适合的工具,从而构建更好的软件。