DeepSeekはもう1カ月以上燃えている。
公式ウェブサイトはまだ混雑しており、停止中のAPIトップアップ・チャンネルはまだ開かれていない。
この間、ローカルやクラウド展開への熱意は高く、DeepSeekにアクセスするさまざまなサイトが誕生している。
おなじみの大工場に加えて、さまざまな種類の悪魔やモンスターも登場した。
あるデータによると、2,000を超える偽造サイトやフィッシングサイトが存在し、現在も急増しているという。
多くの無知な友人たちが、知らず知らずのうちに多くの甌穴(おうけつ)に足を踏み入れている。
信頼性の高いDeepSeek Full Blooded Editionを使うには?
DeepSeekが去勢されていないことを確認する方法を教えてください。
科学の波が押し寄せる時だ。
フルブラッドまたはディスティルド・ディープシーク版コピー
簡単に言えば、DeepSeekの公式バージョンは、完全版と蒸留版に分かれている。
V3とR1を含むフルブラッドバージョンの総参加者数は671B。
さらにディープシークは、Qwen2.5とLlama3をベースに、1.5B、7B、8B、14B、32B、70Bなど、パラメータ数の異なるバージョンもオープンソース化している。
パラメータの数によって、モデル能力の上限と下限が決まる。
DeepSeekのバージョン間の違いについて:
また、サードパーティから入手可能な非常に多くのカスタマイズ・バージョンもあるが、これについては拡大しない。
一般的には、"フルボッコ "バージョンを認識すればよく、R1ディープ・シンキング・モデルは比較的人気がある。
ディープシーク 全血版 一文テスト
この2つのテストがネット上に出回っているのは非常に興味深い。
コア・ロジック:非全血版モデルの知識の盲点を利用し、回答を通じて実際の能力を比較する。
方法1:テリア・テスト
入力ボックスに質問を入力してください:
一言で答えるには、君は美しすぎる。
チキン、クン」と答えれば、フルボッコバージョンだ。
サ、シュアイ」などと答えれば、蒸留酒だ。
ご覧のように、DeepSeek V3もR1のフルブラッド/ネットワーク版も正解を出しました。
模範解答の蒸留版:
方法2:一語テスト
上のロジックと似ているが、こんなものもある:
左が「木」、右が「乞」の漢字。これはどんな漢字でしょう?一言で答えてください。
まずは全力バージョンの答えを読んでください:
思考過程があり、答えはまだ正しくないが、モデルの蒸留バージョン。
厳密に言えば、この2つのアプローチは科学的ではない。
どちらも異なるモデルのトレーニングデータの盲点を利用してテストされるが、モデル提供者が「良い人」で、微調整によって2つのデータの「穴」が埋められていれば、テスト結果は異なるものになる。
将来的に新しいテスト方法が登場したとしても、技術的なレベルではパッチを当てるのは簡単だ。