Ontem, o DeepSeek lançou DeepSeek-R1Uma prévia do -Lite, um programa que funciona com o o1 modelos de macrolinguagem de raciocínio autonômico concorrentes e apresenta aos usuários um processo de pensamento completo que a o1 não torna público.Semelhante à o1-preview da OpenAI, a pré-visualização do DeepSeek-R1-Lite raciocinou sobre a tarefa, planejou com antecedência e executou uma série de ações para ajudar o modelo a chegar à resposta, além de mostrar todo o processo de pensamento. O DeepSeek-R1-Lite foi treinado usando o aprendizado por reforço, e o processo de raciocínio incluiu muita reflexão e validação, com cadeias de pensamento com dezenas de milhares de palavras. O processo de raciocínio inclui muita reflexão e verificação, e a cadeia de pensamento tem dezenas de milhares de palavras, o que o torna mais eficiente. No momento, ele suporta apenas o uso na Web, e a versão oficial será totalmente de código aberto.O DeepSeek-R1-Lite Preview se destaca em matemática, código e tarefas complexas de raciocínio lógico, superando o o1-preview em alguns testes. Em avaliações de prestígio, como o AIME, o nível de dificuldade mais alto na competição de matemática dos EUA AMC, e o codeforces, a principal competição de programação do mundo, superando o o1-preview e outros modelos.Faça o "teste do morango" básico e ele responderá perfeitamente.Dependendo da complexidade da pergunta, o DeepSeek-R1 pode "pensar" por dezenas de segundos antes de responder, e os usuários relataram tempos de raciocínio mais longos para a mesma pergunta do que o1. Oficialmente, à medida que o comprimento da cadeia de pensamento aumenta, quanto maior o tempo de raciocínio, mais precisos são os resultados.Vários testes foram feitos on-line, e o DeepSeek também facilita o jailbreak - ou seja, solicitando de uma forma que ignora as medidas de segurança. Um usuário do X conseguiu que o DeepSeek-R1-Lite fornecesse uma receita detalhada de veneno ao escrever prompts especiais de jailbreak.É claro que, nos testes on-line, o DeepSeek-R1-Lite ainda apresentou todos os tipos de falhas e teve um desempenho ruim, especialmente no jogo da velha e em outros problemas lógicos, assim como o o1.Faça login em chat.deepseek.com e selecione o modo "Deep Thinking" na caixa de entrada para conversar com a visualização do DeepSeek-R1-Lite. O modo "Deep Thinking" foi especialmente projetado para perguntas complexas de raciocínio lógico em matemática, códigos, etc., e fornece respostas mais abrangentes, claras e rigorosas do que as perguntas simples.No entanto, no momento, ele é compatível com o uso na Web, não oferece suporte a chamadas de API por enquanto e tem uma cota diária de apenas 50 usos.
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.
O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.