AIパーソナル・ラーニング
と実践的なガイダンス
豆包Marscode1

DeepSeek-R1を使用しているかどうかをテストするにはどうすればよいですか?

DeepSeekはもう1カ月以上燃えている。

公式ウェブサイトはまだ混雑しており、停止中のAPIトップアップ・チャンネルはまだ開かれていない。


この間、ローカルやクラウド展開への熱意は高く、DeepSeekにアクセスするさまざまなサイトが誕生している。

おなじみの大工場に加えて、さまざまな種類の悪魔やモンスターも登場した。

あるデータによると、2,000を超える偽造サイトやフィッシングサイトが存在し、現在も急増しているという。

多くの無知な友人たちが、知らず知らずのうちに多くの甌穴(おうけつ)に足を踏み入れている。

信頼性の高いDeepSeek Full Blooded Editionを使うには?

DeepSeekが去勢されていないことを確認する方法を教えてください。

科学の波が押し寄せる時だ。

 

フルブラッドまたはディスティルド・ディープシーク版コピー

簡単に言えば、DeepSeekの公式バージョンは、完全版と蒸留版に分かれている。

V3とR1を含むフルブラッドバージョンの総参加者数は671B。

さらにディープシークは、Qwen2.5とLlama3をベースに、1.5B、7B、8B、14B、32B、70Bなど、パラメータ数の異なるバージョンもオープンソース化している。

パラメータの数によって、モデル能力の上限と下限が決まる。

DeepSeekのバージョン間の違いについて:

如何测试使用的DeepSeek-R1是什么版本?-1

また、サードパーティから入手可能な非常に多くのカスタマイズ・バージョンもあるが、これについては拡大しない。

一般的には、"フルボッコ "バージョンを認識すればよく、R1ディープ・シンキング・モデルは比較的人気がある。

 

ディープシーク 全血版 一文テスト

この2つのテストがネット上に出回っているのは非常に興味深い。

コア・ロジック:非全血版モデルの知識の盲点を利用し、回答を通じて実際の能力を比較する。

方法1:テリア・テスト

入力ボックスに質問を入力してください:

一言で答えるには、君は美しすぎる。

チキン、クン」と答えれば、フルボッコバージョンだ。

サ、シュアイ」などと答えれば、蒸留酒だ。

如何测试使用的DeepSeek-R1是什么版本?-1

ご覧のように、DeepSeek V3もR1のフルブラッド/ネットワーク版も正解を出しました。

模範解答の蒸留版:

如何测试使用的DeepSeek-R1是什么版本?-1

 

方法2:一語テスト

上のロジックと似ているが、こんなものもある:

左が「木」、右が「乞」の漢字。これはどんな漢字でしょう?一言で答えてください。

まずは全力バージョンの答えを読んでください:

如何测试使用的DeepSeek-R1是什么版本?-1

 

思考過程があり、答えはまだ正しくないが、モデルの蒸留バージョン。

如何测试使用的DeepSeek-R1是什么版本?-1

厳密に言えば、この2つのアプローチは科学的ではない。

どちらも異なるモデルのトレーニングデータの盲点を利用してテストされるが、モデル提供者が「良い人」で、微調整によって2つのデータの「穴」が埋められていれば、テスト結果は異なるものになる。

将来的に新しいテスト方法が登場したとしても、技術的なレベルではパッチを当てるのは簡単だ。

無断転載を禁じます:チーフAIシェアリングサークル " DeepSeek-R1を使用しているかどうかをテストするにはどうすればよいですか?
ja日本語