Un tutorial para enseñar a la persona promedio cómo entender y utilizar correctamente DeepSeek-R1

Tutoriales prácticos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

52.8K 00

DeepSeek-R1 Nada especial en comparación con otros grandes modelos, su sorpresa es ver el proceso de pensamiento o la excelente expresión china. Si ha utilizado ChatGPT Si te sientes insípido, entonces la sorpresa que te trae DeepSeek-R1 puede ser una ilusión. Si usted está ocupado con los niños y la entrega de todos los días, no hay necesidad de prestar atención a DeepSeek, usted conseguirá nada de él, pero una pérdida de tiempo.

contextos

Información de fondo importante sobre DeepSeek-R1, si no chismes, puede saltar it.DeepSeek-R1 nació de una empresa de inversión cuantitativa conocida - "Mirage cuantitativa", el nombre completo de la empresa es "Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co.", fundador Liang Wenfeng.

DeepSeek lanzó el modelo de inferencia "DeepSeek-R1-Lite" el 20 de noviembre de 2024DeepSeek-R1-Lite puede utilizarse con la función "Deep Thinking" activada en la interfaz de usuario. Sin embargo, DeepSeek-R1-Lite se entrenó con un modelo base más pequeño y recibió menos atención, mientras que DeepSeek-R1 se entrenó con un modelo base más grande, DeepSeek-V3-Base, y sus capacidades generales se mejoraron considerablemente. Por lo tanto, DeepSeek-R1-Lite es la versión preliminar de DeepSeek-R1 de hace 2 meses. Es tan urgente liberarlo para que los usuarios experimenten...

El 20 de enero, Leung Man-fung asistió e intervino en una importante "reunión", y ese mismo día emitió la siguiente declaración. Informe técnico de DeepSeek-R1Me pregunto cuál es la historia detrás de esta coincidencia, como la explosión de Ne Zha...

Los primeros fuegos artificiales de DeepSeek-R1 se produjeron principalmente en el área técnica, ya que abrió informes técnicos sobre cómo utilizar el bajo coste (5.576.000 dólares de coste de GPU, elHe aquí una opinión diferente) reproducido".o1" y su concurrencia es muy alta, con menos recursos de hardware se puede ejecutar "modelo de inferencia" a gran escala. Una explicación sencilla es bajar el precio de los modelos grandes, para que todo el mundo pueda permitirse utilizar mejores modelos grandes.

La segunda vez fuera del ring es cuando noticias de todo tipo bombardean a los internautas, como Ne Zha ardiendo en llamas...

Tres veces fuera del círculo es la auto-medios de comunicación con la ola de caliente "dinero", por lo que vemos en una variedad de grupos: 360 línea DeepSeek-R1, le enseñará a desplegar localmente DeepSeek-R1, la Universidad de Tsinghua para enseñar a utilizar el DeepSeek-R1

Ya estamos en la fase final: DeepSeek-R1 para todos, y deberíamos haber recibido noticias al respecto en empresas estatales, empresas centrales e incluso en las calles de distritos y condados.

Dónde utilizar DeepSeek-R1

He preguntado a un montón de gente que ni siquiera puede encontrar la URL de DeepSeek-R1, algunos porque el sitio oficial está atascado y buscando otros servicios que ofrecen el modelo DeepSeek-R1, pero lo que usted sabe puede ser todo mal ...

Canales de uso oficial

Su página web oficial es: https://chat.deepseek.com/ No existe una versión cliente para PC, APP para teléfonos móviles ir a las principales tiendas de aplicaciones para buscar "DeepSeek".

Otros canales de uso

Muchas herramientas de IA integran actualmente DeepSeek-R1, aunque su calidad de salida no es la misma, sólo recomendamos una herramienta que se acerque al original, para evitar dificultades en la elección:

Tencent Yuanbao: https://yuanbao.tencent.com/ También proporcionamos APP, por favor busque "Yuanbao" en la web oficial y en las principales tiendas de aplicaciones para descargarla.

Recuerda marcar las siguientes opciones cuando utilices la versión web:

Instalación de DeepSeek-R1 en ordenadores locales y teléfonos móviles

En primer lugar, ¿cumple la GPU de su ordenador losInstalación de DeepSeek-R1 Requisitos mínimos? Si no tienes ni idea de GPUs, no te plantees una instalación local.

Instalación en PC DeepSeek-R1

Recomendado Ollama Instalación, su URL es: https://ollama.com/ , los modelos relevantes que se pueden instalar están aquí: https://ollama.com/search?q=deepseek-r1 , si necesita un tutorial detallado para instalar, entonces no se recomienda la instalación local para su uso.

Por ejemplo, una tarjeta gráfica 3060, que apenas puede ejecutar el modelo 14B (versión oficial destilada), puede instalarse copiando el siguiente comando:

Si la configuración de su ordenador es "alta" y desea realizar la instalación localmente, le recomendamos los siguientes instaladores locales de un solo clic

La instalación local requiere una cierta base técnica, aquí proporcionamos DeepSeek-R1 más interfaz de chat paquete de instalación local de un solo clic:Guía para evitar las trampas: ¿Paquete de instalación de Taobao DeepSeek R1 upsell de pago? Le enseñamos la instalación local gratuita (con el instalador de un solo clic)

Si tiene una configuración informática "baja" y desea realizar la implantación localmente, le recomendamos las siguientes opciones de implantación en la nube

Implantación privada sin GPU locales DeepSeek-R1 32B

Instalación de DeepSeek-R1 en teléfonos móviles

¡Delimitar el foco!Al instalar DeepSeek-R1 en su teléfono móvil, ¿desea descargar la aplicación oficial o ejecutar el modelo DeepSeek-R1 localmente en su teléfono móvil? Si sólo desea utilizarlo en su teléfono móvil, y no desea ejecutarlo localmente en su teléfono móvil, puede descargarlo buscando "DeepSeek" o "Tencent Yuanbao" en la tienda de aplicaciones, ambos disponibles en línea. El siguiente es sólo un método para ejecutar el modelo DeepSeek-R1 localmente en su teléfono móvil.

Desventajas de instalar DeepSeek-R1 localmente en tu teléfono móvil:El modelo instalado tiene una capacidad limitada para redactar de forma inteligente textos sencillos, cotejar y resumir información.

Si decides instalarlo:Instalación local de modelos DeepSeek-R1 en teléfonos móviles, para modelos IOS y Android Premium

Para qué sirve DeepSeek-R1

DeepSeek-R1 es muy bueno y puede hacer muchas cosas, empezar por eliminar, entender Para qué no sirve DeepSeek-R1. He generado alrededor de 5000 preguntas a DeepSeek-R1 (versión completa) y tengo algo de experiencia para su referencia:

1. Una pregunta errónea crea alucinaciones Respuesta: R1Las alucinaciones son peores que ChatGPT. Y es intrínsecamente difícil para una persona normal hacer preguntas R1 que sean correctamente "preguntadas", por lo que las respuestas que obtienes suelen ser alucinantes.

2. Inadecuado para tareas de investigación relacionadas con cuestiones de plazosEl problema radica en tres puntos: (1) el conocimiento entrenado por el gran modelo tiene un desfase, (2) incluso en el modo en red el "pensamiento profundo" está limitado por el número de información recordada, ya que se trata de un recuerdo único de la información de la red y no puede recopilar información completa sobre el problema de la línea temporal, y (3) el pensamiento se ve interferido por demasiado contexto, véase 3).

3. El pensamiento profundo se distrae fácilmente con el contexto, el mismo problema, activar la búsqueda en la web lleva a obtener peores resultados porque introduce mucha información de la web y confunde el proceso de pensamiento. Este es un problema grave.

4.Cómo una instrucción clara de preguntas puede verse interferida por el "pensamiento profundo".El pensamiento ignora la "directriz principal" en favor de otros contextos, lo que conduce a una dispersión gradual del pensamiento y a un tiempo de espera excesivo para pensar.

Veamos cómo una instrucción de tarea muy simple, con muy poco contexto, puede ser corrompida por el "pensamiento", con DeepSeek a la izquierda y ChatGPT a la derecha.

5. Si sólo buscas información, Google y Baidu pueden darte mejores resultados.Si desea obtener más información de los resultados de búsqueda, es más eficiente utilizar un motor de búsqueda. Especialmente cuando la cantidad de información es grande.R1 no le ayudará a analizar un gran número de páginas web de información, porque su ayuda a buscar una cantidad limitada de información, puede recordar una cantidad limitada de información, especialmente la capacidad de juzgar los resultados de la búsqueda de la correcta o incorrecta aún más limitado, será un montón de cabeza de un montón de resultados de búsqueda para ayudarle a razonar, y luego darle la respuesta.

Escenarios complejos, como escribir un artículo, "datos" de recopilación de información, organización, la necesidad de múltiples rondas de recopilación de información, múltiples rondas de razonamiento (operación manual es también la misma lógica), R1 es sólo una ronda de recopilación de información y razonamiento, no puede resolver los problemas sistemáticos complejos a la vez. Cuando se sabe esto, se puede intentar cotejar manualmente la información relevante, resumirla y luego lanzarla a R1 para su análisis.

Uso correcto de DeepSeek-R1

Atención:Aunque no utilice el modelo DeepSeek-R1, cuando utilice otros modelos, añada la frase "Pensemos paso a paso" antes de la pregunta, y los otros modelos le seguirán dando un proceso de razonamiento detallado. Sin embargo, el nivel de detalle del razonamiento y la respuesta final pueden no ser tan buenos como DeepSeek-R1.

De hecho, las técnicas para utilizar DeepSeek-R1 no difieren mucho de las de otros modelos, sólo hay que tener en cuenta algunos detalles.

1. Si no estás satisfecho con la complejidad de la pregunta o la respuesta que obtienes tras activar la búsqueda, intenta desactivar el "Pensamiento profundo". Después de desactivarlo, he utilizado el modelo V3, que sigue siendo muy bueno.

2. ¡Usa instrucciones sencillas y Deep Think te ayudará a pensar!

Correcto:Tradúceme.

Error:Ayúdame a traducir al chino, utilizar palabras que coincidan con los hábitos de los usuarios chinos para traducir, los términos importantes deben mantenerse en el idioma original, la traducción debe prestar atención a la disposición.

Más ejemplos de errores:
1. Tengo aquí un informe de investigación de mercado muy importante, con mucho contenido y mucha información. Espero que lo lea con atención y detenimiento, reflexione profundamente sobre él y luego lo analice. 2. ¿Cuáles son las tendencias de mercado más importantes de este informe? Lo mejor sería que enumerara las tres tendencias más importantes y explicara por qué cree que son las más importantes.
2. He aquí algunos ejemplos de diagnóstico de enfermedades: [Ejemplo 1], [Ejemplo 2] Ahora, por favor, diagnostique la enfermedad que puede padecer el paciente basándose en la siguiente información de la historia clínica. [Pegue la información de la historia clínica].

3. Utilizar órdenes complejas para activar el "pensamiento profundo" (no se recomienda construir órdenes complejas sin cierta experiencia, ya que las órdenes complejas y el hecho de llevar demasiado contexto pueden confundir el modelo R1).

Correcto:Ayúdame a traducir al chino, utilizar palabras que coincidan con los hábitos de los usuarios chinos para traducir, los términos importantes deben mantenerse en el idioma original, la traducción debe prestar atención a la disposición.

Error:Tradúceme.

Nota: Para analizar los conflictos derivados de 2 y 3 de forma dialéctica, empiece probando con órdenes sencillas y, cuando la respuesta no satisfaga un requisito concreto, aumente las condiciones de la orden de forma adecuada.

Ponte a prueba con el siguiente texto

**# How does better chunking lead to high-quality responses?
**If you’re reading this, I can assume you know what chunking and RAG are. Nonetheless, here is what it is, in short.**
**LLMs are trained on massive public datasets. Yet, they aren’t updated afterward. Therefore, LLMs don’t know anything after the pretraining cutoff date. Also, your use of LLM can be about your organization’s private data, which the LLM had no way of knowing.**
**Therefore, a beautiful solution called RAG has emerged. RAG asks the LLM to ** answer questions based on the context provided in the prompt itself** . We even ask it not to answer even if the LLM knows the answer, but the provided context is insufficient.**
**How do we get the context? You can query your database and the Internet, skim several pages of a PDF report, or do anything else.**
**But there are two problems in RAGs.**
* **LLM’s **context windows sizes** are limited (Not anymore — I’ll get to this soon!)**
* **A large context window has a high ** signal-to-noise ratio** .**
**First, early LLMs had limited window sizes. GPT 2, for instance, had only a 1024 token context window. GPT 3 came up with a 2048 token window. These are merely the **size of a typical blog post** .**
**Due to these limitations, the LLM prompt cannot include an organization’s entire knowledge base. Engineers were forced to reduce the size of their input to the LLM to get a good response.**
**However, various models with a context window of 128k tokens showed up. This is usually **the size of an annual report** for many listed companies. It is good enough to upload a document to a chatbot and ask questions.**
**But, it didn’t always perform as expected. That’s because of the noise in the context. A large document easily contains many unrelated information and the necessary pieces. This unrelated information drives the LLM to lose its objective or hallucinate.**
**This is why we chunk the documents. Instead of sending a large document to the LLM, we break it into smaller pieces and only send the most relevant pieces.**
**However, this is easier said than done.**
**There are a million possible ways to break a document into chunks. For instance, you may break the document paragraph by paragraph, and I may do it sentence by sentence. Both are valid methods, but one may work better than the other in specific circumstances.**
**However, we won’t discuss sentence and paragraph breaks, as they are trivial and have little use in chunking. Instead, we will discuss slightly more complex ones that break documents for RAGs.**
**In the rest of the post, I’ll discuss a few chunking strategies I’ve learned and applied.********

4. Los marcos de palabras clave siguen siendo retrospectivos

Acostumbrarse a introducir buenas palabras clave sólo requiere las cuatro condiciones siguientes: [personaje] [acción que debe realizar el modelo mayor] [objetivo de la misión] [contexto de la misión] (el contexto de la misión no es necesario).

Por ejemplo:Desempeñar el papel de experto en redacción oficial.Ayúdame a redactar un informe sobre mi discurso en la "Conferencia del Empleado del Año". El discurso debe durar unos 5 minutos y debe ser sincero y modesto.Mi empresa se llama PetroChina, mi supervisor se llama Li Fugui, trabajo en prospección petrolífera y gané el premio porque los empleados me votaron en segundo lugar.

5. Aprende a dejar que los grandes modelos te ayuden a hacer preguntas, las buenas preguntas conducen a buenas respuestas

Volviendo al punto "4", los ejemplos de indicaciones que se han dado, ¿ves algún problema?

Las descripciones no son lo suficientemente detalladas como para redactar un informe que no pueda utilizarse directamente, y la dificultad que tiene la mayoría de la gente con los grandes modelos es que no pueden hacer preguntas o no quieren molestarse en añadir preguntas a su cerebro.

En realidad, el problema es bastante sencillo: antes de construir una pregunta perfecta, aprenda a plantear el gran modelo que le ayudará a afinar sus preguntas.

6. hacer que las preguntas sean dirigidas, o hacer que el proceso de pensamiento R1 sea dirigido, es un método muy antiguo que no sólo se aplica a R1

Normalmente, no es necesario utilizar los siguientes métodos en un modelo de inferencia como el R1 para poder utilizarlos, pero es específico para cada problema, y si su problema es muy dirigido, puede incluir algunos de losDescribir contextos lógicamente sencillos y breves.

Prompt_ID	Tipo	Frase desencadenante	Chino
101	CoT	Pensemos paso a paso.	Pensamos paso a paso.
201	PS	En primer lugar, entendamos el problema e ideemos un plan para resolverlo. A continuación, llevemos a cabo el plan para resolver el problema paso a paso.	Primero, entendamos el problema y elaboremos un plan para resolverlo. Después, resolvamos el problema paso a paso según el plan.
301	PS+	En primer lugar, entendamos el problema, extraigamos las variables relevantes y sus numerales correspondientes y diseñemos un plan. A continuación, llevemos a cabo el plan, calculemos las variables intermedias (prestemos atención al cálculo numérico correcto y al sentido común), resolvamos el problema paso a paso y mostremos la respuesta. A continuación, llevemos a cabo el plan, calculemos las variables intermedias (prestando atención al cálculo numérico correcto y al sentido común), resolvamos el problema paso a paso y mostremos la respuesta.	En primer lugar, entendamos el problema, extraigamos las variables relevantes y sus valores correspondientes y, a continuación, creemos un plan. A continuación, ejecutemos el plan, calculemos las variables intermedias (prestando atención al cálculo numérico adecuado y al sentido común), resolvamos el problema paso a paso y mostremos la respuesta.
302	PS+	En primer lugar, entendamos el problema, extraigamos las variables relevantes y sus correspondientes numerales, y diseñemos un plan completo. A continuación, llevemos a cabo el plan, calculemos las variables intermedias (prestando atención al cálculo numérico correcto y al sentido común), resolvamos el problema paso a paso y mostremos los resultados. A continuación, llevemos a cabo el plan, calculemos las variables intermedias (prestando atención al cálculo numérico correcto y al sentido común), resolvamos el problema paso a paso y mostremos la respuesta. respuesta.	Primero, entendamos el problema, extraigamos las variables relevantes y sus valores correspondientes, y creemos un plan completo. A continuación, ejecutemos el plan, calculemos las variables intermedias (prestando atención a los cálculos numéricos correctos y al sentido común), resolvamos el problema paso a paso y mostremos la respuesta.
303	PS+	Ideemos un plan y resolvamos el problema paso a paso.	Hagamos un plan y resolvamos el problema paso a paso.
304	PS+	En primer lugar, entendamos el problema e ideemos un plan completo. A continuación, llevemos a cabo el plan y razonemos el problema paso a paso. En cada paso responde a la subpregunta "¿lanza la persona y cuál es el estado actual de la moneda?". Según el último estado de la moneda, da la respuesta final (presta atención a cada lanzamiento y al estado de giro de la moneda).	Primero, entendamos el problema y desarrollemos un plan completo. A continuación, ejecutemos el plan y resolvamos el problema paso a paso. Cada paso responde a las subpreguntas: "¿Lanza la persona la moneda y cuál es el estado actual de la moneda?". . Da la respuesta final basándote en el estado final de la moneda (anota cada lanzamiento y el estado de la moneda).
305	PS+	En primer lugar, entendamos el problema, extraigamos las variables relevantes y sus correspondientes numerales, y elaboremos un plan completo. A continuación, llevemos a cabo el plan, calculemos las variables intermedias (prestando atención al cálculo numérico correcto y al sentido común), resolvamos el problema paso a paso y mostremos los resultados. A continuación, llevemos a cabo el plan, calculemos las variables intermedias (prestando atención al cálculo numérico correcto y al sentido común), resolvamos el problema paso a paso y mostremos la respuesta. respuesta.	Primero, entendamos el problema, extraigamos las variables relevantes y sus valores correspondientes, y creemos un plan completo. A continuación, ejecutemos el plan, calculemos las variables intermedias (prestando atención a los cálculos numéricos correctos y al sentido común), resolvamos el problema paso a paso y mostremos la respuesta.
306	PS+	En primer lugar, preparemos la información pertinente y elaboremos un plan. A continuación, respondamos a la pregunta paso a paso (prestando atención al sentido común y a la coherencia lógica). A continuación, respondamos a la pregunta paso a paso (prestando atención al sentido común y a la coherencia lógica).	En primer lugar, preparemos la información pertinente y elaboremos un plan. Después, contesta a las preguntas paso a paso (prestando atención al sentido común y a la coherencia lógica).
307	PS+	En primer lugar, entendamos el problema, extraigamos las variables relevantes y sus correspondientes numerales, y elaboremos y diseñemos un plan completo. A continuación, llevemos a cabo el plan, calculemos las variables intermedias (prestando atención al cálculo numérico correcto y al sentido común), resolvamos el problema paso a paso, y A continuación, llevemos a cabo el plan, calculemos las variables intermedias (prestando atención al cálculo numérico correcto y al sentido común), resolvamos el problema paso a paso, y mostrar la respuesta.	Primero, entendamos el problema, extraigamos las variables relevantes y sus valores correspondientes, y creemos un plan completo. A continuación, ejecutemos el plan, calculemos las variables intermedias (prestando atención a los cálculos numéricos correctos y al sentido común), resolvamos el problema paso a paso y mostremos la respuesta.

7. Desambiguación de las preguntas

Es importante descartar activamente posibles ambigüedades en las preguntas basadas en la experiencia, ya que los grandes modelos de razonamiento están dispuestos a ayudarte a "suponer" preguntas, como el ejemplo erróneo mencionado anteriormente, en el que la pregunta equivocada lleva a la suposición equivocada y a la respuesta equivocada.

8. Elija entre longitud de entrada y profundidad de razonamiento.

Las entradas demasiado largas inhiben el razonamiento y difuminan los problemas de razonamiento, y las entradas cortas refuerzan el razonamiento y mantienen la atención, excluyéndose mutuamente.

9. Controlar el formato del contenido de salida

Consulte "4", el marco de palabras clave. La última sección podría añadir [Formato de salida] para restringir el formato del contenido de salida del modelo grande.

Existen dos tipos de formatos de contenido de salida de control:

1. Composición tipográfica

Ejemplo 1: Salida con formato markdown y disposición del contenido

Ejemplo 2: Se permite pegar el artículo de salida en word para su uso

2. Plantilla

Ejemplo 1: Generar un artículo que se dividirá en tres partes: introducción, explicación y resumen.

Ejemplo 2:Sugerencia: resúmenes de chats de grupo, notas de reuniones, conversaciones de varias rondas, etc.