O DeepSeek-R1-Lite, um modelo de inferência desenvolvido internamente comparável ao o1-preview, está on-line!

Notícias sobre IAAtualizado há 8 meses Círculo de compartilhamento de IA

13.4K 00

Ontem, o DeepSeek lançou DeepSeek-R1Uma prévia do -Lite, um programa que funciona com o o1 modelos de macrolinguagem de raciocínio autonômico concorrentes e apresenta aos usuários um processo de pensamento completo que a o1 não torna público.

Semelhante à o1-preview da OpenAI, a pré-visualização do DeepSeek-R1-Lite raciocinou sobre a tarefa, planejou com antecedência e executou uma série de ações para ajudar o modelo a chegar à resposta, além de mostrar todo o processo de pensamento. O DeepSeek-R1-Lite foi treinado usando o aprendizado por reforço, e o processo de raciocínio incluiu muita reflexão e validação, com cadeias de pensamento com dezenas de milhares de palavras. O processo de raciocínio inclui muita reflexão e verificação, e a cadeia de pensamento tem dezenas de milhares de palavras, o que o torna mais eficiente. No momento, ele suporta apenas o uso na Web, e a versão oficial será totalmente de código aberto.

媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线

O DeepSeek-R1-Lite Preview se destaca em matemática, código e tarefas complexas de raciocínio lógico, superando o o1-preview em alguns testes. Em avaliações de prestígio, como o AIME, o nível de dificuldade mais alto na competição de matemática dos EUA AMC, e o codeforces, a principal competição de programação do mundo, superando o o1-preview e outros modelos.

Faça o "teste do morango" básico e ele responderá perfeitamente.

Dependendo da complexidade da pergunta, o DeepSeek-R1 pode "pensar" por dezenas de segundos antes de responder, e os usuários relataram tempos de raciocínio mais longos para a mesma pergunta do que o1. Oficialmente, à medida que o comprimento da cadeia de pensamento aumenta, quanto maior o tempo de raciocínio, mais precisos são os resultados.

Vários testes foram feitos on-line, e o DeepSeek também facilita o jailbreak - ou seja, solicitando de uma forma que ignora as medidas de segurança. Um usuário do X conseguiu que o DeepSeek-R1-Lite fornecesse uma receita detalhada de veneno ao escrever prompts especiais de jailbreak.

É claro que, nos testes on-line, o DeepSeek-R1-Lite ainda apresentou todos os tipos de falhas e teve um desempenho ruim, especialmente no jogo da velha e em outros problemas lógicos, assim como o o1.

Faça login em chat.deepseek.com e selecione o modo "Deep Thinking" na caixa de entrada para conversar com a visualização do DeepSeek-R1-Lite. O modo "Deep Thinking" foi especialmente projetado para perguntas complexas de raciocínio lógico em matemática, códigos, etc., e fornece respostas mais abrangentes, claras e rigorosas do que as perguntas simples.

No entanto, no momento, ele é compatível com o uso na Web, não oferece suporte a chamadas de API por enquanto e tem uma cota diária de apenas 50 usos.

Notícias sobre IA

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

A ferramenta de pesquisa profunda inferencial da Jina, DeepSearch API, está no ar!

Notícias sobre IA

7 meses atrás

015.3K

O flowith 2.0 está finalmente chegando, recrutando 100 usuários principais para experimentar a versão beta pública com antecedência!

Notícias sobre IA

9 meses atrás

018.1K

O YouTube Shorts integra o Veo 2 para geração de clipe e plano de fundo de vídeo com IA

Notícias sobre IA

7 meses atrás

012.7K

Zero One Everything: os spin-offs de empresas podem se tornar um novo mecanismo de crescimento com um foco estratégico bem ajustado?

Notícias sobre IA

7 meses atrás

011.7K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

O DeepSeek-R1-Lite, um modelo de inferência desenvolvido internamente comparável ao o1-preview, está on-line!

O Copilot para PowerPoint passa por grandes mudanças; estes são os pontos principais que devem ser lidos: reescrever, traduzir, ilustrar, anotar

A Microsoft anuncia o AI Shell em versão beta pública, sem medo de perder os comandos

Artigos relacionados

A ferramenta de pesquisa profunda inferencial da Jina, DeepSearch API, está no ar!

O flowith 2.0 está finalmente chegando, recrutando 100 usuários principais para experimentar a versão beta pública com antecedência!

O YouTube Shorts integra o Veo 2 para geração de clipe e plano de fundo de vídeo com IA

Zero One Everything: os spin-offs de empresas podem se tornar um novo mecanismo de crescimento com um foco estratégico bem ajustado?

Sem comentários

Últimas coleções

Artigos mais recentes

O DeepSeek-R1-Lite, um modelo de inferência desenvolvido internamente comparável ao o1-preview, está on-line!

O Copilot para PowerPoint passa por grandes mudanças; estes são os pontos principais que devem ser lidos: reescrever, traduzir, ilustrar, anotar

A Microsoft anuncia o AI Shell em versão beta pública, sem medo de perder os comandos

Artigos relacionados

A ferramenta de pesquisa profunda inferencial da Jina, DeepSearch API, está no ar!

O flowith 2.0 está finalmente chegando, recrutando 100 usuários principais para experimentar a versão beta pública com antecedência!

O YouTube Shorts integra o Veo 2 para geração de clipe e plano de fundo de vídeo com IA

Zero One Everything: os spin-offs de empresas podem se tornar um novo mecanismo de crescimento com um foco estratégico bem ajustado?

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes