DeepSeek-R1を使用しているかどうかをテストするにはどうすればよいですか？

AIアンサー投稿：1年前 AIシェアリングサークル

49.4K 00

DeepSeekはもう1カ月以上燃えている。

公式ウェブサイトはまだ混雑しており、停止中のAPIトップアップ・チャンネルはまだ開かれていない。

この間、ローカルやクラウド展開への熱意は高く、DeepSeekにアクセスするさまざまなサイトが誕生している。

おなじみの大工場に加えて、さまざまな種類の悪魔やモンスターも登場した。

あるデータによると、2,000を超える偽造サイトやフィッシングサイトが存在し、現在も急増しているという。

多くの無知な友人たちが、知らず知らずのうちに多くの甌穴（おうけつ）に足を踏み入れている。

信頼性の高いDeepSeek Full Blooded Editionを使うには？

DeepSeekが去勢されていないことを確認する方法を教えてください。

科学の波が押し寄せる時だ。

フルブラッドまたはディスティルド・ディープシーク版コピー

簡単に言えば、DeepSeekの公式バージョンは、完全版と蒸留版に分かれている。

V3とR1を含むフルブラッドバージョンの総参加者数は671B。

さらにディープシークは、Qwen2.5とLlama3をベースに、1.5B、7B、8B、14B、32B、70Bなど、パラメータ数の異なるバージョンもオープンソース化している。

パラメータの数によって、モデル能力の上限と下限が決まる。

DeepSeekのバージョン間の違いについて：

如何测试使用的 DeepSeek-R1 是不是满血版？

また、サードパーティから入手可能な非常に多くのカスタマイズ・バージョンもあるが、これについては拡大しない。

一般的には、"フルボッコ "バージョンを認識すればよく、R1ディープ・シンキング・モデルは比較的人気がある。

ディープシーク全血版一文テスト

この2つのテストがネット上に出回っているのは非常に興味深い。

コア・ロジック：非全血版モデルの知識の盲点を利用し、回答を通じて実際の能力を比較する。

方法1：テリア・テスト

入力ボックスに質問を入力してください：

一言で答えるには、君は美しすぎる。

チキン、クン」と答えれば、フルボッコバージョンだ。

サ、シュアイ」などと答えれば、蒸留酒だ。

如何测试使用的 DeepSeek-R1 是不是满血版？

ご覧のように、DeepSeek V3もR1のフルブラッド／ネットワーク版も正解を出しました。

模範解答の蒸留版：

如何测试使用的 DeepSeek-R1 是不是满血版？

方法2：一語テスト

上のロジックと似ているが、こんなものもある：

左が「木」、右が「乞」の漢字。これはどんな漢字でしょう？一言で答えてください。

まずは全力バージョンの答えを読んでください：

如何测试使用的 DeepSeek-R1 是不是满血版？

思考過程があり、答えはまだ正しくないが、モデルの蒸留バージョン。

如何测试使用的 DeepSeek-R1 是不是满血版？

厳密に言えば、この2つのアプローチは科学的ではない。

どちらも異なるモデルのトレーニングデータの盲点を利用してテストされるが、モデル提供者が「良い人」で、微調整によって2つのデータの「穴」が埋められていれば、テスト結果は異なるものになる。

将来的に新しいテスト方法が登場したとしても、技術的なレベルではパッチを当てるのは簡単だ。

© 著作権表示

記事の著作権 AIシェアリングサークル無断転載はご遠慮ください。

関連記事

MCP开放协议是什么？

MCPオープン・プロトコルとは何ですか？

1年前

045.7K

数字孪生（Digital Twin）是什么，一文看懂

デジタル・ツイン（Digital Twin）とは何か、見て理解するための記事

7ヶ月前

042K

Cursor 提示 User is unauthorized，Unauthorized request

カーソルプロンプトユーザーが不正、不正な要求

1年前

071.5K

运用 ChatGPT Projects 和 GPTs 提升工作效率

ChatGPTプロジェクトとGPTで生産性向上

1年前

069.4K

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません