existir Cline No mesmo dia em que o modelo Plan & Act foi lançado, a DeepSeek apresentou o modelo R1. Ocorreu um fenômeno interessante: os desenvolvedores começaram a usar espontaneamente o R1 para a fase de planejamento e o 3.5-Sonnet para a implementação do código. Isso não foi planejado previamente, mas baseado em uma compreensão natural das vantagens de ambos os modelos.
Novo fluxo de trabalho para desenvolvedores
A melhor prática que os desenvolvedores encontraram é:
- Fase de planejamento: Use o modelo R1 (tokens $0.55/M) para iniciar uma nova tarefa no modo Planejar.
- Discussão aprofundada: Tenha um diálogo de planejamento aprofundado para discutir a arquitetura, os casos extremos e as possíveis soluções.
- Implementação do código: Quando o planejamento estiver concluído, mude para o modelo 3.5-Sonnet para codificação.
- Otimização iterativa: Se você precisar revisar o plano ou encontrar problemas complexos, volte para o modelo R1.
Custo e desempenho ao mesmo tempo
Os benefícios desse fluxo de trabalho não estão apenas no desempenho, mas também na economia de custos:
- Planejamento do modelo R1: O custo é de aproximadamente $0,55/M tokens.
- 3.5 - Planejamento do modelo Sonnet: O custo é de aproximadamente $16/M tokens.
- Reduções de custos na fase de planejamento: Até 97%.
Além disso, como Austin Starks aponta em sua análise, o modelo R1 é igual ou melhor do que outros modelos em termos de poder de raciocínio. Combinado com a capacidade comprovada do modelo 3.5-Sonnet de ser implementado em código, os desenvolvedores podem obter os melhores resultados.
Os dois modelos se complementam
A chave para o sucesso desse modelo é que as características de cada modelo sejam totalmente utilizadas:
O modelo R1: ideal para a fase de planejamento
- Pensamento profundo em arquitetura: Capacidade de realizar projetos detalhados de arquitetura de sistemas.
- Exploração de casos extremos: Bom em identificar e lidar com possíveis casos extremos.
- Decisões de design do sistema: Capacidade de tomar decisões acertadas sobre o projeto do sistema.
- Raciocínio econômico: Vantagem de custo em tarefas de raciocínio.
3.5 O modelo Sonnet: uma garantia confiável de aplicação do código
- Geração precisa de código: Capacidade de gerar códigos precisos e confiáveis.
- Recursos complexos de reconfiguração: É possível refatorar códigos complexos.
- Correção rápida de erros: Capacidade de localizar e corrigir rapidamente erros no código.
- Confiabilidade comprovada: Altamente confiável em aplicações práticas.
Como aplicar esse fluxo de trabalho
- O modo de planejamento está ativado: Use o modelo R1 para iniciar o modo Planejar no Cline.
- Planejamento para o diálogo: Envolva-se em um diálogo de planejamento completo para definir os detalhes do programa.
- Mudar para Sonnet: Depois de concluir o planejamento, mude para o modelo 3.5-Sonnet para escrever o código.
- Otimização iterativa: Se você precisar modificar o plano, volte para o modelo R1 para fazer ajustes.
resumos
Não se trata apenas de R1 vs. o1 ou 3.5-Sonnet, mas de usar a ferramenta certa no estágio certo. O futuro do desenvolvimento de IA não é encontrar um modelo único para todos, mas ser flexível o suficiente para aproveitar os diferentes modelos, dependendo das necessidades da tarefa.
Vale a pena observar que essa prática recomendada não foi pré-projetada, mas sim explorada espontaneamente pelos desenvolvedores da Cline em uso no mundo real. Essa descoberta diz muito sobre a sabedoria da comunidade, e os resultados são uma prova do valor desse fluxo de trabalho.
Você já experimentou esse fluxo de trabalho R1/Sonnet? Que outras combinações de modelos você achou eficazes?
Nosso objetivo é criar um software melhor, aproveitando os diferentes modelos e usando as ferramentas mais adequadas em cada estágio do desenvolvimento de software.