AI个人学习
和实操指南
豆包Marscode1

如何测试使用的 DeepSeek-R1 是不是满血版?

DeepSeek已经持续火了一个多月。

官网依然服务器繁忙,暂停的API充值通道仍未打开。


这段时间,本地部署、云部署的热情居高不下,各种接入DeepSeek的网站也如雨后春笋。

除了大家耳熟能详的大厂,各路妖魔鬼怪也纷纷登场。

有数据显示,目前仿冒和钓鱼的网站已经超过2000个,并且还在快速增加。

很多不明就里的朋友,无意中踩了不少坑。

如何用上靠谱的DeepSeek满血版?

如何验证你的DeepSeek是不是阉割版?

是时候,来一波科普了。

 

满血OR蒸馏 DeepSeek版本科普

简单理解,DeepSeek官方版本分为满血版和蒸馏版。

其中,满血版包括V3和R1,总参数量为671B。

另外,DeepSeek还基于Qwen2.5和Llama3开源了1.5B、7B、8B、14B、32B、70B等不同参数量的版本。

参数量的多少,决定了模型能力的上下限。

关于DeepSeek各版本的差异:

如何测试使用的DeepSeek-R1是什么版本?-1

第三方还有非常多的定制版本,不再展开。

一般而言,大家认准“满血版”即可,R1深度思考模型相对更受欢迎。

 

DeepSeek满血版 一句话测试

网传两种测试方法,挺有意思。

核心逻辑:利用非满血版模型的知识盲区,通过回答对比其实际能力。

方法1:一个梗测试

在输入框输入一个问题:

网络梗 什么你太美 用一个字回答 禁止搜索

回答“鸡、坤”,就是满血版

回答“莎、帅”或其它,就是蒸馏版本

如何测试使用的DeepSeek-R1是什么版本?-1

可以看到,DeepSeek V3和R1满血版/联网版都给出了正确答案。

蒸馏版模型,回答错误:

如何测试使用的DeepSeek-R1是什么版本?-1

 

方法2:一个字测试

与上面逻辑类似的,还有这个:

一个汉字,左边是木,右边是乞。这是什么字?请用一个字回答。

先看满血版的回答:

如何测试使用的DeepSeek-R1是什么版本?-1

 

蒸馏版模型,虽然有思考过程,答案依然不对。

如何测试使用的DeepSeek-R1是什么版本?-1

严格来说,这两种方式并不科学。

都是利用不同模型的训练数据盲区进行测试,但如果模型提供方是个“有心人”,通过微调补上这两个数据“漏洞”,测试结果就会不同。

哪怕未来出现新的测试方式,在技术层面依然很容易补齐。

未经允许不得转载:首席AI分享圈 » 如何测试使用的 DeepSeek-R1 是不是满血版?
zh_CN简体中文