DeepSeek已经持续火了一个多月。
官网依然服务器繁忙,暂停的API充值通道仍未打开。
这段时间,本地部署、云部署的热情居高不下,各种接入DeepSeek的网站也如雨后春笋。
除了大家耳熟能详的大厂,各路妖魔鬼怪也纷纷登场。
有数据显示,目前仿冒和钓鱼的网站已经超过2000个,并且还在快速增加。
很多不明就里的朋友,无意中踩了不少坑。
如何用上靠谱的DeepSeek满血版?
如何验证你的DeepSeek是不是阉割版?
是时候,来一波科普了。
满血OR蒸馏 DeepSeek版本科普
简单理解,DeepSeek官方版本分为满血版和蒸馏版。
其中,满血版包括V3和R1,总参数量为671B。
另外,DeepSeek还基于Qwen2.5和Llama3开源了1.5B、7B、8B、14B、32B、70B等不同参数量的版本。
参数量的多少,决定了模型能力的上下限。
关于DeepSeek各版本的差异:
第三方还有非常多的定制版本,不再展开。
一般而言,大家认准“满血版”即可,R1深度思考模型相对更受欢迎。
DeepSeek满血版 一句话测试
网传两种测试方法,挺有意思。
核心逻辑:利用非满血版模型的知识盲区,通过回答对比其实际能力。
方法1:一个梗测试
在输入框输入一个问题:
网络梗 什么你太美 用一个字回答 禁止搜索
回答“鸡、坤”,就是满血版
回答“莎、帅”或其它,就是蒸馏版本
可以看到,DeepSeek V3和R1满血版/联网版都给出了正确答案。
蒸馏版模型,回答错误:
方法2:一个字测试
与上面逻辑类似的,还有这个:
一个汉字,左边是木,右边是乞。这是什么字?请用一个字回答。
先看满血版的回答:
蒸馏版模型,虽然有思考过程,答案依然不对。
严格来说,这两种方式并不科学。
都是利用不同模型的训练数据盲区进行测试,但如果模型提供方是个“有心人”,通过微调补上这两个数据“漏洞”,测试结果就会不同。
哪怕未来出现新的测试方式,在技术层面依然很容易补齐。