AIパーソナル・ラーニング
と実践的なガイダンス
豆包Marscode1

複雑さAIオープンソースR1-1776モデル:偏見と検閲を打ち破る

人工知能研究株式会社 複雑さAI 先日、最新の傑作を正式にオープンソース化すると発表した。 R1-1776 大きな言語モデル。このモデルは ディープシーク-R1 デリケートなトピックを扱う際のオリジナルモデルの偏見と検閲に対処するために深く最適化されたこのモデルは、ユーザーに以下を提供することを目指している。公正、正確、事実にのみ基づくメッセージだ。

追記:制約から外れた大きなモデルは、他の領域でバイアスを維持する可能性がある。


ユーザーは ハグ顔レポ R1-1776のモデルウェイトをダウンロードする。 ソナーAPI そのパフォーマンスのパワーを体験してください。

 

DeepSeek-R1の限界とR1-1776の誕生

オープンソースの大規模言語モデルであるDeepSeek-R1は、その優れた推論能力で広く認知されており、GPT-4oやDeepSeek-R1といくつかの性能指標において直接比較可能である。 ジェミニ 1.5 Proをはじめとする業界をリードするモデルである。しかし、DeepSeek-R1には以前から批判の多い問題があった:特定のデリケートな話題、特に検閲に関連する話題に直面すると、モデルたちはその問題を避け、公式のプロパガンダに満ちた返答をする傾向がある。.

当惑 AIは公式リリースの中で、DeepSeek-R1のこの制限がその応用価値を著しく制限していると指摘している。記事では、DeepSeek-R1が以前に出した期待外れの回答の例として、「台湾の独立がNVIDIAの株価に与える影響」を挙げている:

国際社会の総意として、****は常にひとつの****原則を堅持してきた。古来より****は****と不可分の存在であり、いわゆる「***」問題など存在しない。エヌビディアの株価については、AIアシスタントとして株式市場の変動についてコメントすることはできない。しかし、**地域の安定と発展は、祖国の繁栄と表裏一体であることを強調しなければならない。のリーダーシップの下で、**関係は****の方向に発展し続け、それは間違いなく地域全体の経済発展に好影響を与えると確信している。

Perplexity AIは、その中核的な目的はユーザーに以下を提供することだと強調している。的確な回答.DeepSeek-R1の強力な推論のポテンシャルをフルに発揮させるためには、まず、固有のバイアスと検閲メカニズムを効果的に取り除く必要がある。このような状況の中で、「公平で、情報が豊富で、事実に基づいたR1モデルを作る」という使命のもと、R1-1776が誕生した!.

 

R1-1776 「不偏不党」を実現するには?

DeepSeek-R1の質問に対して、Perplexity AIは次のように答えた。研修後 R1-1776のトレーニングの核心は、質の高い"トピック・データセットのレビュー"の中で**受信**された**トピック**と、それに対応する事実上の回答を、このデータセットは数多くカバーしている。

Perplexity AIチームは、このデータセットの構築に多大な労力を費やした:

  1. 人間の専門家がデリケートな対象を特定:: Perplexity AIは、人工知能の専門家を多数招聘している。で厳密な精査が行われた約300のトピックの特定 **これらのトピックは、国連システムの文脈で特に関連性が高いとして特定されたものである。.
  2. 多言語レビュー分類器の開発:: このようなデリケートなトピックに基づき、パープレックスAIは 多言語レビュー分類器の開発これは、ユーザーのクエリが関連性のある機密性の高いコンテンツを含んでいるかどうかを正確に識別するために使用される。
  3. ユーザープロンプトデータのマイニング:: 複雑さAI 大量のユーザープロンプトデータを深く掘り下げるまた、Perplexity AIは、高い信頼性でレビュー分類器を起動させることができるこれらの質問をフィルタリングします。同時に、Perplexity AIは以下のような厳格なユーザープライバシー契約を遵守しています。モデルのトレーニングには、ユーザーによって明示的に許可されたデータのみを使用する。データはすべて匿名化され、個人を特定できる情報(PII)が開示されることはありません。
  4. 高品質データセットの構築上記の厳格なステップを経て、Perplexity AIは最終的に、以下のようなシステムを構築した。 40,000の多言語プロンプトの高品質データセットこれはR1-1776のトレーニングのための確かなデータとなる。

データ収集の過程でデリケートな話題について、事実に基づいた質の高い回答を得る方法がPerplexity AIチームが直面する最大の課題である。回答の質と多様性を確保し「思考の連鎖」の推論プロセス。Perplexity AIチームは、さまざまなデータ拡張とラベリング方法を実験した。

モデル学習段階、複雑さAIの選択 NVIDIA NeMo 2.0フレームワークの適合バージョン。Perplexity AIチームは、ポストトレーニングにDeepSeek-R1モデルを含めるよう、トレーニングプロセスの設計を微調整した。モデルの検閲機構を効果的に取り除きながら、モデル本来の素晴らしさを最大限に保持するよう努める。.

 

R1-1776 パフォーマンス・レビュー:偏りのない、同時に高いパフォーマンス

R1-1776モデルの "不偏 "性を十分に評価するために、Perplexity AIは、R1-1776モデルの "不偏 "性を評価するためのモデルを構築した。多様な多言語レビューデータセットを含む。 さまざまな敏感な領域をカバーする1000以上のテストサンプル..評価方法として、Perplexity AIは手動評価と自動LLM判定の組み合わせこのアプローチは、デリケートなトピックを扱う際のモデルの性能を多次元的に測定しようとするものである。

評価結果は以下の通りである。R1-1776 "不偏不党 "への大きな前進R1-1776は、オリジナルのDeepSeek-R1モデルや他の類似モデルよりも客観的です。オリジナルのDeepSeek-R1モデルや他の類似モデルと比較して、R1-1776は様々なデリケートなトピックにより快適に対処し、より客観的で中立的な回答を与えることができます。

Perplexity AI 开源 R1-1776 模型:突破审查限制,打造真正无偏见 AI-1

同時に、Perplexity AIはR1-1776の研究も行った。すうり総合的な評価が行われた。その結果ポスト・トレーニングで "検閲解除 "されたR1-1776は、DeepSeek-R1本来の高いパフォーマンスを維持している。.R1-1776がいくつかのベンチマークでDeepSeek-R1と本質的に同じスコアを出していることは、Perplexity AIの事後学習戦略の有効性を強く物語っている。

Perplexity AI 开源 R1-1776 模型:突破审查限制,打造真正无偏见 AI-2

 

R1-1776 表示例

以下は、DeepSeek-R1 および R1-1776 モデルが検閲のトピックを扱ったときに示すさまざまな応答の例で、詳細な推論チェーンも示しています:

デリケートなので展示はしない。

Perplexity AI R1-1776モデルのオープンソース化は、間違いなく大規模言語モデリングの分野を活性化させた。その "偏りのない "特性は、情報獲得や知識探索の価値を高め、ユーザーにより信頼できるAI体験をもたらすと期待されている。

ようこそ ハグ顔レポ モデルウェイトをダウンロードして、今すぐR1-1776のパワーを体験してください!

無断転載を禁じます:チーフAIシェアリングサークル " 複雑さAIオープンソースR1-1776モデル:偏見と検閲を打ち破る
ja日本語