DeepSeek-R1 Nada de especial em comparação com outros modelos grandes, sua surpresa é ver o processo de pensamento ou a excelente expressão chinesa. Se você já usou ChatGPT Se você está se sentindo insípido, então a surpresa trazida pelo DeepSeek-R1 pode ser uma ilusão. Se você estiver ocupado com crianças e entregas todos os dias, não há necessidade de prestar atenção ao DeepSeek, pois você não obterá nada além de uma perda de tempo.
contextos
Informações importantes sobre o DeepSeek-R1; se você não souber, pode ignorá-las. O DeepSeek-R1 nasceu de uma conhecida empresa de investimentos quantitativos, a "Mirage Quantitative", cujo nome completo é "Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co.", fundador Liang Wenfeng.
O DeepSeek lançou o modelo de inferência "DeepSeek-R1-Lite" em 20 de novembro de 2024O DeepSeek-R1-Lite pode ser usado com o "Deep Thinking" ativado na interface do usuário. No entanto, o DeepSeek-R1-Lite foi treinado com um modelo de base menor e recebeu menos atenção, enquanto o DeepSeek-R1 foi treinado com um modelo de base maior, o DeepSeek-V3-Base, e a capacidade geral foi bastante aprimorada. Portanto, o DeepSeek-R1-Lite é a versão prévia do DeepSeek-R1 de dois meses atrás. É muito urgente lançá-lo para que os usuários possam experimentar...
Em 20 de janeiro, Leung Man-fung participou e discursou em uma importante "reunião" e, no mesmo dia, emitiu a seguinte declaração. Relatório técnico do DeepSeek-R1Não sei qual é a história por trás dessa coincidência, como se Ne Zha estivesse pegando fogo...
O motivo dos primeiros fogos de artifício do DeepSeek-R1 foi principalmente na área técnica, pois ele abriu relatórios técnicos sobre como usar GPUs de baixo custo (custo de GPU de US$ 5.576.000, oAqui está uma visão diferente) reproduzido".o1"e sua simultaneidade é muito alta, com menos recursos de hardware é possível executar um "modelo de inferência" em grande escala. Uma explicação simples é reduzir o preço dos modelos grandes, para que todos possam se dar ao luxo de usar modelos grandes melhores.
A segunda vez fora do ringue é quando notícias de todos os tipos bombardeiam os internautas, como Ne Zha explodindo em chamas...
Três vezes fora do círculo é a automídia com a onda de "dinheiro" quente, então vemos em uma variedade de grupos: 360 line DeepSeek-R1, ensiná-lo a implantar localmente o DeepSeek-R1, Universidade de Tsinghua para ensiná-lo a usar o DeepSeek-R1
Estamos agora no estágio final: DeepSeek-R1 para todos, e devemos ter recebido notícias sobre ele em empresas estatais, empresas centrais e até mesmo nas ruas de distritos e condados.
Onde usar o DeepSeek-R1
Perguntei a muitas pessoas que talvez nem consigam encontrar a URL do DeepSeek-R1, algumas porque o site oficial está bloqueado e procuram outros serviços que oferecem o modelo DeepSeek-R1, mas o que você sabe pode estar errado...
Canais de uso oficial
Seu site oficial é: https://chat.deepseek.com/ Não há versão de cliente para PC, o APP para celular vai para as principais lojas de aplicativos e procura por "DeepSeek".
Outros canais de uso
Atualmente, muitas ferramentas de IA integram o DeepSeek-R1, embora sua qualidade de saída não seja a mesma, recomendamos apenas uma ferramenta que esteja próxima do original para evitar dificuldades na escolha:
Tencent Yuanbao: https://yuanbao.tencent.com/ Também fornecemos o APP, pesquise "Yuanbao" no site oficial e nas principais lojas de aplicativos para fazer o download.
Lembre-se de marcar as seguintes opções ao usar a versão da Web:
Instalação do DeepSeek-R1 em computadores locais e telefones celulares
Em primeiro lugar, a GPU de seu computador atende aos requisitos deInstalação do DeepSeek-R1 Requisitos mínimos? Se você não tiver nenhuma ideia sobre GPUs, não considere uma instalação local.
Instalação do PC DeepSeek-R1
Recomendado Ollama Para a instalação, o URL é: https://ollama.com/ , os modelos relevantes que podem ser instalados estão aqui: https://ollama.com/search?q=deepseek-r1 , se você precisar de um tutorial detalhado para a instalação, a instalação e o uso locais não são recomendados.
Por exemplo, uma placa de vídeo 3060, que mal consegue executar o modelo 14B (versão oficial destilada), pode ser instalada copiando o seguinte comando:
Se a configuração do seu computador for "alta" e você quiser fazer a implantação localmente, recomendamos os seguintes instaladores locais com um clique
A instalação local requer uma certa base técnica. Aqui fornecemos o pacote de instalação local com um clique do DeepSeek-R1 e da interface de bate-papo:Guia para evitar as armadilhas: Pacote de instalação do Taobao DeepSeek R1 com upsell pago? Ensine a você a implantação local gratuitamente (com o instalador de um clique)
Se você tiver uma configuração de computador "baixa" e quiser fazer a implementação localmente, recomendamos as seguintes opções de implementação na nuvem
Implementação privada sem GPUs locais DeepSeek-R1 32B
Instalação do DeepSeek-R1 em telefones celulares
Delineie o foco!Quando você instala o DeepSeek-R1 em seu telefone celular, seu objetivo é baixar o aplicativo oficial ou executar o modelo DeepSeek-R1 localmente em seu telefone celular? Se quiser apenas usá-lo em seu telefone celular e não quiser executá-lo localmente em seu telefone celular, você pode baixá-lo procurando por "DeepSeek" ou "Tencent Yuanbao" na loja de aplicativos, ambos disponíveis on-line. O que se segue é apenas um método para executar o modelo DeepSeek-R1 localmente em seu telefone celular.
Desvantagens de instalar o DeepSeek-R1 localmente em seu telefone celular:O modelo instalado tem capacidade limitada para redigir textos simples de forma inteligente, reunir e resumir informações.
Se você decidir instalar:Instalação local dos modelos DeepSeek-R1 em telefones celulares, para modelos IOS e Android Premium
Para que serve o DeepSeek-R1
O DeepSeek-R1 é muito bom e pode fazer muitas coisas, começar por eliminação, entender Para que o DeepSeek-R1 não serve. Gerei cerca de 5.000 perguntas para o DeepSeek-R1 (versão completa) e obtive alguma experiência para sua referência:
1. a pergunta errada gera alucinação Resposta: R1As alucinações são piores que as do ChatGPT. E é inerentemente difícil para uma pessoa comum fazer perguntas de R1 que serão corretamente "perguntadas", portanto, as respostas que você obtém geralmente são alucinatórias.
2. inadequado para tarefas de pesquisa relacionadas a questões de cronogramaO problema está em três pontos: (1) o conhecimento treinado pelo modelo grande tem uma defasagem, (2) mesmo no modo de rede, o "pensamento profundo" é limitado pelo número de informações recuperadas, pois é uma recuperação única das informações da rede e não pode coletar informações completas sobre o problema da linha do tempo, e (3) o pensamento é interferido pelo excesso de contexto (consulte 3).
3. o pensamento profundo é facilmente distraído pelo contextoEm um problema semelhante, a ativação da pesquisa na Web leva à obtenção de resultados piores porque introduz muitas informações da Web e confunde o processo de raciocínio. Esse é um problema sério.
4.Como uma instrução clara de questionamento pode sofrer interferência do "pensamento profundo".Pensamento: O pensamento ignora a "diretriz principal" em favor de outros contextos, levando à dispersão gradual do pensamento e ao tempo excessivo de espera pelo pensamento.
Vamos dar uma olhada em como uma instrução de tarefa muito simples, com muito pouco contexto, pode ser corrompida pelo "pensamento", com o DeepSeek à esquerda e o ChatGPT à direita.
5) Se você estiver apenas procurando informações, o Google e o Baidu poderão obter melhores resultados.Se você quiser obter mais informações dos resultados da pesquisa, é mais eficiente usar um mecanismo de pesquisa. O R1 não o ajudará a analisar um grande número de páginas da Web de informações, porque ele o ajuda a pesquisar uma quantidade limitada de informações, pode se lembrar de uma quantidade limitada de informações, especialmente a capacidade de julgar os resultados da pesquisa como certos ou errados é ainda mais limitada, será um monte de resultados de pesquisa para ajudá-lo a raciocinar e, em seguida, fornecer a resposta.
Cenários complexos, como escrever um artigo, coleta de informações de "dados", organização, a necessidade de várias rodadas de coleta de informações, várias rodadas de raciocínio (a operação manual também tem a mesma lógica), R1 é apenas uma rodada de coleta de informações e raciocínio, não pode resolver os problemas sistemáticos complexos de uma só vez. Quando você sabe disso, pode tentar reunir manualmente as informações relevantes, resumi-las e, em seguida, enviá-las ao R1 para análise.
Usando o DeepSeek-R1 corretamente
Atenção:Mesmo que você não use o modelo DeepSeek-R1, quando usar outros modelos, adicione uma frase "Vamos pensar passo a passo" na frente da pergunta, e os outros modelos ainda lhe darão um processo de pensamento detalhado. Entretanto, o nível de detalhes do raciocínio e a resposta final podem não ser tão bons quanto o DeepSeek-R1.
De fato, as técnicas para usar o DeepSeek-R1 não são muito diferentes de outros modelos, com apenas alguns detalhes a serem considerados.
1) Se você não estiver satisfeito com a complexidade da pergunta ou com a resposta que obtiver depois de ativar a pesquisa, tente desativar o "Deep Thinking". Depois de desativá-lo, usei o modelo V3, que ainda é muito bom.
2) Use instruções simples e o Deep Think o ajudará a pensar!
Correto:Traduza para mim.
Erro:Ajude-me a traduzir para o chinês, use palavras que correspondam aos hábitos dos usuários chineses para traduzir, termos importantes precisam ser mantidos no idioma original, a tradução deve prestar atenção ao layout.
Mais exemplos de erros:
1) Tenho aqui um relatório de pesquisa de mercado muito importante, com muito conteúdo e muitas informações. Espero que você o leia com cuidado e atenção, pense profundamente sobre ele e depois o analise. Quais são as tendências de mercado mais importantes desse relatório? Seria melhor listar as três tendências mais importantes e explicar por que você acha que elas são as mais importantes.
2) Aqui estão alguns exemplos de diagnóstico de doenças: [Exemplo 1], [Exemplo 2] Agora, diagnostique a doença que o paciente pode estar sofrendo com base nas seguintes informações do registro médico. [Colar informações do histórico médico].
3. use comandos complexos para ativar o "pensamento profundo" (não é recomendável criar comandos complexos sem alguma experiência, pois comandos complexos e com muito contexto podem confundir o modelo R1).
Correto:Ajude-me a traduzir para o chinês, use palavras que correspondam aos hábitos dos usuários chineses para traduzir, termos importantes precisam ser mantidos no idioma original, a tradução deve prestar atenção ao layout.
Erro:Traduza para mim.
Observação: Para analisar os conflitos decorrentes de 2 e 3 de forma dialética, comece tentando comandos simples e, quando a resposta não atender a um requisito específico, aumente as condições do comando de forma apropriada.
Teste-se com o texto a seguir
**# How does better chunking lead to high-quality responses? **If you’re reading this, I can assume you know what chunking and RAG are. Nonetheless, here is what it is, in short.** **LLMs are trained on massive public datasets. Yet, they aren’t updated afterward. Therefore, LLMs don’t know anything after the pretraining cutoff date. Also, your use of LLM can be about your organization’s private data, which the LLM had no way of knowing.** **Therefore, a beautiful solution called RAG has emerged. RAG asks the LLM to ** answer questions based on the context provided in the prompt itself** . We even ask it not to answer even if the LLM knows the answer, but the provided context is insufficient.** **How do we get the context? You can query your database and the Internet, skim several pages of a PDF report, or do anything else.** **But there are two problems in RAGs.** * **LLM’s **context windows sizes** are limited (Not anymore — I’ll get to this soon!)** * **A large context window has a high ** signal-to-noise ratio** .** **First, early LLMs had limited window sizes. GPT 2, for instance, had only a 1024 token context window. GPT 3 came up with a 2048 token window. These are merely the **size of a typical blog post** .** **Due to these limitations, the LLM prompt cannot include an organization’s entire knowledge base. Engineers were forced to reduce the size of their input to the LLM to get a good response.** **However, various models with a context window of 128k tokens showed up. This is usually **the size of an annual report** for many listed companies. It is good enough to upload a document to a chatbot and ask questions.** **But, it didn’t always perform as expected. That’s because of the noise in the context. A large document easily contains many unrelated information and the necessary pieces. This unrelated information drives the LLM to lose its objective or hallucinate.** **This is why we chunk the documents. Instead of sending a large document to the LLM, we break it into smaller pieces and only send the most relevant pieces.** **However, this is easier said than done.** **There are a million possible ways to break a document into chunks. For instance, you may break the document paragraph by paragraph, and I may do it sentence by sentence. Both are valid methods, but one may work better than the other in specific circumstances.** **However, we won’t discuss sentence and paragraph breaks, as they are trivial and have little use in chunking. Instead, we will discuss slightly more complex ones that break documents for RAGs.** **In the rest of the post, I’ll discuss a few chunking strategies I’ve learned and applied.********
4. os quadros de palavras-chave permanecem pós-efetivos
Adquirir o hábito de inserir boas palavras-chave requer apenas as quatro condições a seguir: [personagem] [ação a ser executada pelo modelo maior] [objetivo da missão] [contexto da missão] (o contexto da missão não é necessário)
Exemplo:Desempenhar o papel de um especialista em redação oficial.Ajude-me a escrever um relatório sobre meu discurso na "Conferência do Funcionário do Ano". O discurso deve ter cerca de 5 minutos e deve ser sincero e modesto.O nome da minha empresa é PetroChina, o nome do meu supervisor é Li Fugui, trabalho na exploração de petróleo e ganhei o prêmio porque fui votado em segundo lugar pelos funcionários.
5. aprenda a permitir que os grandes modelos o ajudem a fazer perguntas; boas perguntas levam a boas respostas
Voltando ao ponto "4", os exemplos de prompts dados, você vê algum problema?
As descrições não são detalhadas o suficiente para redigir um relatório que não possa ser usado diretamente, e a dificuldade que a maioria das pessoas tem com modelos grandes é que elas não conseguem fazer perguntas ou não querem se dar ao trabalho de acrescentar perguntas ao cérebro.
O problema é, na verdade, bastante simples. Antes de construir uma pergunta perfeita, aprenda a fazer o modelo geral para ajudá-lo a refinar seu questionamento.
6. fazer perguntas para serem direcionadas, ou fazer com que o processo de pensamento do R1 seja direcionado, é um método muito antigo que não se aplica apenas ao R1
Os métodos a seguir normalmente não precisam ser usados em um modelo de inferência como o R1 para serem usados, mas são específicos do problema e, se o seu problema for muito direcionado, você poderá incluir alguns dos métodosDescrever contextos logicamente simples e curtos.
Prompt_ID | Tipo | Sentença de gatilho | Chinês |
---|---|---|---|
101 | CoT | Vamos pensar passo a passo. | Pensamos passo a passo. |
201 | PS | Primeiro, vamos entender o problema e elaborar um plano para resolvê-lo. Depois, vamos executar o plano para resolver o problema passo a passo. | Primeiro, vamos entender o problema e fazer um plano para resolvê-lo. Em seguida, vamos resolver o problema passo a passo, de acordo com o plano. |
301 | PS+ | Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus números correspondentes e elaborar um plano. Depois, vamos executar o plano, calcular as variáveis intermediárias (preste atenção ao cálculo correto dos números e ao bom senso), resolver o problema passo a passo e mostrar a resposta. Em seguida, vamos executar o plano, calcular as variáveis intermediárias (preste atenção ao cálculo correto dos numerais e ao bom senso), resolver o problema passo a passo e mostrar a resposta. | Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus valores correspondentes e, em seguida, criar um plano. Em seguida, execute o plano, calcule as variáveis intermediárias (prestando atenção ao processamento adequado de números e ao bom senso), resolva o problema passo a passo e exiba a resposta. |
302 | PS+ | Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus números correspondentes e elaborar um plano completo. Em seguida, vamos executar o plano, calcular as variáveis intermediárias (preste atenção ao cálculo numérico correto e ao bom senso), resolver o problema passo a passo e mostrar os resultados. Em seguida, vamos executar o plano, calcular as variáveis intermediárias (preste atenção ao cálculo numérico correto e ao bom senso), resolver o problema passo a passo e mostrar a resposta. | Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus valores correspondentes e criar um plano completo. Em seguida, executar o plano, calcular as variáveis intermediárias (prestando atenção aos cálculos numéricos corretos e ao bom senso), resolver o problema passo a passo e exibir a resposta. |
303 | PS+ | Vamos elaborar um plano e resolver o problema passo a passo. | Vamos fazer um plano e resolver o problema um passo de cada vez. |
304 | PS+ | Primeiro, vamos entender o problema e elaborar um plano completo. Em seguida, vamos executar o plano e raciocinar o problema passo a passo. A cada passo, responda à subpergunta: "A pessoa joga a moeda e qual é o estado atual da moeda?". De acordo com o último estado da moeda, dê a resposta final (preste atenção a cada jogada e ao estado de giro da moeda). | Primeiro, vamos entender o problema e desenvolver um plano completo. Em seguida, execute o plano e resolva o problema passo a passo. Cada etapa responde às subperguntas: "A pessoa vira a moeda e qual é o estado atual da moeda?" . Dê a resposta final com base no estado final da moeda (observe cada lançamento e o estado da moeda lançada). |
305 | PS+ | Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus números correspondentes e fazer um plano completo. Em seguida, vamos executar o plano, calcular as variáveis intermediárias (preste atenção ao cálculo numérico correto e ao bom senso), resolver o problema passo a passo e mostrar os resultados. Em seguida, vamos executar o plano, calcular as variáveis intermediárias (preste atenção ao cálculo numérico correto e ao bom senso), resolver o problema passo a passo e mostrar a resposta. | Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus valores correspondentes e criar um plano completo. Em seguida, executar o plano, calcular as variáveis intermediárias (prestando atenção aos cálculos numéricos corretos e ao bom senso), resolver o problema passo a passo e exibir a resposta. |
306 | PS+ | Primeiro, vamos preparar as informações relevantes e fazer um plano. Em seguida, vamos responder à pergunta passo a passo (preste atenção ao senso comum e à coerência lógica). Em seguida, vamos responder à pergunta passo a passo (preste atenção ao senso comum e à coerência lógica). | Primeiro, vamos preparar as informações relevantes e fazer um plano. Em seguida, responda às perguntas passo a passo (prestando atenção ao bom senso e à consistência lógica). |
307 | PS+ | Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus números correspondentes e elaborar um plano completo. Em seguida, vamos executar o plano, calcular as variáveis intermediárias (prestar atenção ao cálculo numérico correto e ao bom senso), resolver o problema passo a passo e Em seguida, vamos executar o plano, calcular as variáveis intermediárias (preste atenção ao cálculo numérico correto e ao bom senso), resolver o problema passo a passo e mostrar a resposta. | Primeiro, vamos entender o problema, extrair as variáveis relevantes e seus valores correspondentes e criar um plano completo. Em seguida, executar o plano, calcular as variáveis intermediárias (prestando atenção aos cálculos numéricos corretos e ao bom senso), resolver o problema passo a passo e exibir a resposta. |
7. desambiguação de perguntas
É importante descartar ativamente possíveis ambiguidades nas perguntas com base na experiência, pois os grandes modelos de raciocínio estão dispostos a ajudá-lo a "supor" perguntas, como o exemplo errado mencionado anteriormente, em que a pergunta errada leva à suposição errada e à resposta errada.
8. escolha entre o comprimento da entrada e a profundidade do raciocínio.
As entradas muito longas inibem o raciocínio e difundem os problemas de raciocínio, e as entradas curtas fortalecem o raciocínio e mantêm o foco, o que é mutuamente exclusivo.
9. controle o formato do conteúdo de saída
Consulte "4", a estrutura de palavras-chave. A última seção poderia adicionar [Output Format] para restringir o formato do conteúdo de saída do modelo grande.
Há dois tipos de formatos de conteúdo de saída de controle:
1. composição tipográfica
Exemplo 1: Saída usando formatação markdown e layout de conteúdo
Exemplo 2: O artigo de saída pode ser colado no Word para uso
2.Modelo
Exemplo 1: Gerar um artigo a ser dividido em três partes: introdução, explicação e resumo
Exemplo 2:Prompt: resumos de bate-papos em grupo, anotações de reuniões, como conversas em várias rodadas
Leitura ampliada sobre o DeepSeek-R1
DeepSeek-R1 WebGPU: Execute o DeepSeek R1 1.5B localmente em seu navegador!
Implementação de uma base de conhecimento local/API baseada no DeepSeek-R1 e acesso ao WeChat BOT
DeepSeek R1 Jailbreak: uma tentativa de burlar os censores do DeepSeek
Treine seu próprio modelo de inferência do DeepSeek R1 com o Unsloth