¿Cómo compruebo si estoy utilizando DeepSeek-R1 de pleno derecho?

DeepSeek lleva más de un mes ardiendo.

El sitio web oficial sigue ocupado y el canal de recarga API suspendido sigue sin estar abierto.

Durante este tiempo, el entusiasmo por las implantaciones locales y en la nube es grande, y están surgiendo varios sitios que acceden a DeepSeek.

Además de las grandes fábricas conocidas, también han aparecido todo tipo de demonios y monstruos.

Según algunos datos, hay más de 2.000 sitios web de falsificaciones y phishing, y siguen aumentando rápidamente.

Muchos amigos desinformados se han metido sin querer en un montón de baches.

¿Cómo utilizar la fiable DeepSeek Full Blooded Edition?

¿Cómo verifica que su DeepSeek no está castrado?

Es hora de una ola de ciencia.

 

Copias de la versión DeepSeek completa o destilada

En pocas palabras, la versión oficial de DeepSeek se divide en una versión completa y una versión destilada.

La versión completa, que incluye V3 y R1, cuenta con un total de 671B participantes.

Además, DeepSeek también tiene versiones de código abierto con diferentes recuentos de parámetros, como 1,5B, 7B, 8B, 14B, 32B, 70B, etc. basadas en Qwen2.5 y Llama3.

El número de parámetros determina los límites superior e inferior de la capacidad del modelo.

Acerca de las diferencias entre versiones de DeepSeek:

如何测试使用的 DeepSeek-R1 是不是满血版?

También hay un gran número de versiones personalizadas disponibles a través de terceros, sobre las que no nos extenderemos.

Por lo general, basta con reconocer la versión "de pura cepa", y el modelo R1 Deep Thinking es relativamente popular.

 

DeepSeek Full Blooded Edition Prueba de una frase

Es bastante interesante ver las dos pruebas que circulan por la red.

Lógica central: utilizar la ceguera al conocimiento de la versión no completa del modelo para comparar sus capacidades reales a través de sus respuestas.

Método 1: Prueba del terrier

Introduzca una pregunta en el cuadro de entrada:

¿Qué? Eres demasiado hermosa para responder en una palabra. No busques.

Responde "pollo, kun", es la versión completa.

Responde "Sa, Shuai" u otra cosa, es la versión destilada.

如何测试使用的 DeepSeek-R1 是不是满血版?

Como puede ver, tanto la versión DeepSeek V3 como la R1 a sangre completa/en red dieron la respuesta correcta.

Versión destilada del modelo, respondida incorrectamente:

如何测试使用的 DeepSeek-R1 是不是满血版?

 

Método 2: Prueba de una palabra

Similar a la lógica anterior, está esto:

Un carácter chino con madera a la izquierda y mendigo a la derecha. ¿Qué tipo de carácter es? Responde con una palabra.

Lea primero la versión completa de la respuesta:

如何测试使用的 DeepSeek-R1 是不是满血版?

 

Versión destilada del modelo, aunque hay un proceso de pensamiento y la respuesta sigue siendo incorrecta.

如何测试使用的 DeepSeek-R1 是不是满血版?

En sentido estricto, estos dos enfoques no son científicos.

Ambos se prueban utilizando los puntos ciegos de los datos de entrenamiento de diferentes modelos, pero si el proveedor del modelo es una "buena persona", y los dos "agujeros" de los datos se rellenan mediante un ajuste fino, los resultados de la prueba serán diferentes.

Incluso si en el futuro surgen nuevas formas de realizar pruebas, seguirá siendo fácil parchear las cosas a nivel técnico.

© declaración de copyright
AiPPT

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...