Ontem, a DeepSeek lançou uma prévia do DeepSeek-R1-Lite, um modelo de linguagem grande para raciocínio autônomo que compete com o o1 e mostra aos usuários o processo de pensamento completo que o o1 não torna público.Semelhante à o1-preview da OpenAI, a pré-visualização do DeepSeek-R1-Lite raciocinou sobre a tarefa, planejou com antecedência e executou uma série de ações para ajudar o modelo a chegar à resposta, além de mostrar todo o processo de pensamento. O DeepSeek-R1-Lite foi treinado usando o aprendizado por reforço, e o processo de raciocínio incluiu muita reflexão e validação, com cadeias de pensamento com dezenas de milhares de palavras. O processo de raciocínio inclui muita reflexão e verificação, e a cadeia de pensamento tem dezenas de milhares de palavras, o que o torna mais eficiente. No momento, ele suporta apenas o uso na Web, e a versão oficial será totalmente de código aberto.A visualização do DeepSeek-R1-Lite se destaca em tarefas de matemática, código e raciocínio lógico complexo, superando o o1-preview em alguns testes. O o1-preview supera modelos como o o1-preview em avaliações confiáveis, como o AIME, que tem a classificação de dificuldade mais alta na competição de matemática dos EUA AMC, e o codeforces, a principal competição de programação do mundo.Faça o "teste do morango" básico e ele responderá perfeitamente.Dependendo da complexidade da pergunta, o DeepSeek-R1 pode "pensar" por dezenas de segundos antes de responder, e os usuários relataram tempos de raciocínio mais longos para a mesma pergunta do que o1. Oficialmente, à medida que o comprimento da cadeia de pensamento aumenta, quanto maior o tempo de raciocínio, mais precisos são os resultados.Vários testes foram feitos on-line, e o DeepSeek também facilita o jailbreak - ou seja, solicitando de uma forma que ignora as medidas de segurança. Um usuário do X conseguiu que o DeepSeek-R1-Lite fornecesse uma receita detalhada de veneno ao escrever prompts especiais de jailbreak.É claro que, nos testes on-line, o DeepSeek-R1-Lite ainda apresentou todos os tipos de falhas e teve um desempenho ruim, especialmente no jogo da velha e em outros problemas lógicos, assim como o o1.Faça login em chat.deepseek.com e selecione o modo "Deep Thinking" na caixa de entrada para conversar com a visualização do DeepSeek-R1-Lite. O modo "Deep Thinking" foi especialmente projetado para perguntas complexas de raciocínio lógico em matemática, códigos, etc., e fornece respostas mais abrangentes, claras e rigorosas do que as perguntas simples.No entanto, no momento, ele é compatível com o uso na Web, não oferece suporte a chamadas de API por enquanto e tem uma cota diária de apenas 50 usos.
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.
Gerador de imagens FLUX.1 (suporta entrada em chinês)
O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.