AIパーソナル・ラーニング
と実践的なガイダンス

CLOB: キューワードのみを用いた大規模言語モデルによる一連のタスクの連続学習

原文ママhttps://arxiv.org/pdf/2412.15479

解釈だ:この記事自体はあまり革新的ではなく、応用も利かない。しかし、ずっとずっと昔に読んだ非常に有益な3つの記事を思い出させる。この記事を前の3つの記事と合わせて読むことで、より多くのインスピレーションが得られることを期待したい。お勧めの一冊 インテント:ゼップは、大きなモデルに顧客のインテントを理解させる方法を説明している。 女性に対するあらゆる形態の差別の撤廃に関する条約。 CoD:密度の連鎖 女性に対するあらゆる形態の差別の撤廃に関する条約。 ラガス:RAGリコールQA精度と回答の相関性を評価する "(信頼度評価の部分に注目)。


 

速読:「CLOBとCISの徹底分析:ブラックボックス大規模言語モデルに基づく継続学習の新しいパラダイム

人工知能の分野では、継続的学習(Continuous Learning: CL)の研究が盛んに行われている。大規模言語モデル(Large Language Models: LLM)の台頭により、古い知識の忘却を回避しつつ、モデル全体を再学習させることなく、新しいタスクを継続的に学習させる方法が重要なトピックとなっている。本稿では、継続的学習の新しいパラダイムであるCLOB(ブラックボックスLLMの継続的学習)およびそれに基づく提案CIS(インクリメンタルサマリーによる文脈的CL)また、詳細なカスタマーサービス・プロセスの事例やワークフローを通じて、その中核となるメカニズムやメリットをより深く理解することができる。

 

1.継続的学習への挑戦

従来の連続学習シナリオでは、モデルは一連のタスクを段階的に学習する必要があり、各タスクのデータは通常、学習後に破棄される。この方法は記憶容量を節約できる反面、**壊滅的忘却**という問題を引き起こす。つまり、モデルは新しいタスクを学習する際に、以前に学習した内容を忘れてしまうのだ。

1.1 従来の方法の限界

  • パラメーターの微調整モデルのパラメータを微調整することで新しいタスクに適応するが、古いタスクは忘れてしまう傾向がある。
  • 知識の蒸留古いモデルから新しいモデルへの知識の移行は、複雑で計算コストがかかる。
  • データ再生トレーニングのために古いタスクデータの一部を保持するが、追加のストレージスペースが必要となり、プライバシーに関する懸念が生じる可能性がある。

 

2.CLOB:ブラックボックス大規模言語モデリングによる継続学習の新しいパラダイム

CLOB (Continual Learning Over Black-box LLMs)は、大規模な言語モデルをブラックボックスとして扱い、モデルのパラメータの微調整や学習可能なパラメータの追加を行うことなく、**Verbal Prompting**によってのみ継続的な学習を実現する新しい継続学習パラダイムである。

2.1 CLOBの核となる利点

  • パラメータ忘れを防ぐモデルのパラメータは変更されないので、パラメータに基づく壊滅的な忘却はありません。
  • 高い柔軟性モデルの内部構造にアクセスすることなくAPI経由でアクセスされるLLMに適用される。
  • 高い拡張性より多くのタスクやカテゴリーに簡単に拡張できます。

2.2 CLOBの仕組み

CLOBのワークフローは以下のステップにまとめられる:

  1. ミッション到着新しいタスクが到着すると、システムはそのタスクのトレーニングデータの一部を受け取る。
  2. 抽象生成LLMを使用して、各カテゴリーの重要な情報を把握するためのサマリーを作成する。
  3. アブストラクト・セービング生成された要約は、その後の学習と推論の基礎として**メモリー・リポジトリ**に保存される。

CLOB:手がかり単語のみを用いた大規模言語モデルによる一連のタスクの連続学習-1

図1:CLOBシステムの概要。左側はCLOBにおけるCISの使い方を示し、右側は学習プロセスにおける各コンポーネントの使い方のヒントを示す。

 

3.CIS:漸進的要約に基づく文脈の中での継続的学習

CIS (in-contextal CL via Incremental Summarization)はCLOBの特殊な実装で、LLMの要約機能を活用し、要約をインクリメンタルに更新することで継続的な学習を可能にする。

3.1 CISの主要構成要素

3.1.1 サマリー・ジェネレーター(リフレクター)

  • 官能性新しいタスクが到着すると、各カテゴリーのサマリーを生成します。
  • ワークフロー::
    1. 新しいミッション・データを受け取る例えば、カスタマーサービスは、新製品に関するよくある質問(FAQ)を受け取ります。
    2. 要約の作成以下のヒントを参考に、各カテゴリーの要約を作成してください:
      同じカテゴリーからいくつかの例をお見せします。これらの例に基づいて、そのカテゴリーの要約を3文以内で書いてください。なお、要約には例を含めないでください。
      例:【新製品について顧客からよく寄せられる質問と回答
      

      ヒント
      同じカテゴリーからいくつかの例をお見せします。これらの例に基づいて、そのカテゴリーの要約を3文以内で書いてください。なお、要旨には例を含めないでください。
      例
      1. 顧客: この新しい携帯電話の色は何色ですか?
      カスタマーサービス:この電話には黒、白、青の3色があります。
      2.お客様:この携帯電話のバッテリーの寿命はどのくらいですか?
      カスタマーサービス:この携帯電話の電池寿命は2日間です。
      

      要約を作成する:

      What's New FAQ: ブラック、ホワイト、ブルーの3色展開で、バッテリー駆動時間は2日間。
      
    3. アブストラクトの保存生成された要約をメモリーに保存する。

3.1.2 まとめアップデータ

  • 官能性古いタスクの新しいデータを受信したら、該当するカテゴリのサマリーを更新する。
  • ワークフロー::
    1. 新しいデータを受け取る例えば、カスタマーサービスが新製品のFAQについて新しい質問を受ける。
    2. 更新サマリー以下のヒントを参考に、該当するカテゴリーのサマリーを更新してください:
      以下は、あるカテゴリーに関するオリジナルの要約である。これから、そのカテゴリーの中でm個の追加例を提示する。それに基づいて、要約を更新してください。更新された要約は3文以下になるようにしてください。
      元の要約: 新製品FAQ: この携帯電話には黒、白、青の3色があり、バッテリーの寿命は2日間です。
      追加の例
      1.顧客:この電話は5Gネットワークをサポートしていますか?
      カスタマーサービス:はい、この電話は5Gネットワークをサポートしています。
      

      要約を更新した:

      よくある質問:ブラック、ホワイト、ブルーの3色展開で、バッテリー駆動時間は2日間、5Gネットワークに対応している。
      
    3. 更新された要約を保存するメモリーバンク内の元の要約を、更新された要約に置き換える。

3.1.3 ソルバー

  • 官能性カテゴリー推論を行い、顧客からの問い合わせに対応する。
  • ワークフロー::
    1. 顧客からの問い合わせを受ける例えば、顧客が "この電話には何色がありますか?"と尋ねるとする。
    2. ステップ1::
      解答者のヒント(ステップ1):
      テストサンプルが私が提示した各カテゴリーに属すると確信するスコアを教えてください。参考資料として、これらのカテゴリーの要約をお渡しします。要約の書式は': [要約]'です。あなたの解答は、カテゴリー名とそれに対応する信頼度スコアのみを解答として含んでください。
      サンプルテスト: この携帯電話には何色がありますか?
      リスト
      What's New FAQ: この携帯電話にはブラック、ホワイト、ブルーの3色があり、バッテリー寿命は2日間で、5Gネットワークをサポートしています。
      

      出力:

      新製品FAQ: 0.95
      
    3. ステップ2最も信頼度の高いk=1のカテゴリー、すなわち「新製品FAQ」を選択する。
    4. 返信を作成する新商品FAQ」カテゴリの要約をもとに回答を作成します:
      カスタマーサービス回答:この電話機はブラック、ホワイト、ブルーの3色からお選びいただけます。
      
    5. 返信を送る顧客に回答を送信する。

3.2 メモリ・アクセス・ロジック

  • ざいこ各カテゴリーの要約は、メモリーバンクのノードとして保存される。例えば、「新製品FAQ」は、対応する要約を含むメモリーノードである。
  • 取り出す推論プロセスでは、関連するカテゴリの要約を読み、その要約に基づいて回答を生成します。
  • 更新: 新しいデータが届くと、サマリーは最新の知識を反映するために更新される。例えば、新製品に関する新しいFAQが届くと、「新製品FAQ」ノードの要約が更新される。

 

4.CLOBとCISの違い

  • CLOB は、モデルのパラメータを修正することなく、言語的な手がかりを利用して学習することを重視した、より広範な連続学習パラダイムである。様々な種類のタスクやデータに適用できる。
  • WASC はCLOBの具体的な実装であり、インクリメンタルサマリーを用いて知識を管理し、LLMの入力長の制限に対処することに焦点を当てている。カスタマーサービスシナリオにおいて、CISは動的に更新されるサマリーリポジトリを維持することで、変化する顧客の要求と知識を効率的に扱うことができる。

 

5.例:顧客サービスプロセスにおけるCISの完全なワークフロー

5.1 新しいミッションの到着

カスタマーサービス部門が新製品を発売し、関連する顧客からの問い合わせに対応する必要があるとする。

  1. データを受け取る新商品に関するよくある質問(FAQ)を受け付けています。
  2. 要約の作成::
    リフレクターのヒント
    同じカテゴリーからいくつかの例をお見せします。これらの例をもとに、そのカテゴリーの要約を3文以内で書いてください。なお、要約には例を含めないでください。
    例
    1. 顧客:この新しい携帯電話の色は何色ですか?
    カスタマーサービス:この携帯電話には黒、白、青の3色があります。
    2.お客様:この携帯電話のバッテリーの寿命はどのくらいですか?
    カスタマーサービス:この携帯電話の電池寿命は2日間です。
    

    要約を作成する:

    What's New FAQ: ブラック、ホワイト、ブルーの3色展開で、バッテリー駆動時間は2日間。
    
  3. アブストラクトの保存新商品FAQ」の概要をメモリに保存します。

5.2 古いミッションからの新しいデータの到着

新商品のFAQについて新たな質問が寄せられたとします。

  1. 新しいデータを受け取る:: 顧客からの質問 "この電話は5Gネットワークに対応していますか?"
  2. 更新サマリー::
    アップデータのヒント
    以下は、あるカテゴリーに関するオリジナルの要約です。これから、そのカテゴリー内でm個の追加例を提供します。それに基づいて、要約を更新してください。更新された要約の長さが3文以内であることを確認してください。
    元の要約: What's New FAQ: この携帯電話には黒、白、青の3色があり、バッテリーの寿命は2日間です。
    その他の例
    1.顧客:この電話は5Gネットワークをサポートしていますか?
    カスタマーサービス:はい、この電話は5Gネットワークをサポートしています。
    

    要約を更新した:

    よくある質問:ブラック、ホワイト、ブルーの3色展開で、バッテリー駆動時間は2日間、5Gネットワークに対応している。
    
  3. 更新された要約を保存するメモリーバンク内の元の要約を、更新された要約に置き換える。

5.3 推論プロセス

  1. 顧客からの問い合わせを受けるこの電話には何色がありますか?
  2. ステップ1::
    解答者のヒント(ステップ1):
    テストサンプルが私が提示した各カテゴリーに属すると確信するスコアを教えてください。参考資料として、これらのカテゴリーの要約をお渡しします。要約の書式は': [要約]'です。あなたの解答は、カテゴリー名とそれに対応する信頼度スコアのみを解答として含んでください。
    サンプルテスト: この携帯電話には何色がありますか?
    リスト
    What's New FAQ: この携帯電話にはブラック、ホワイト、ブルーの3色があり、バッテリー寿命は2日間で、5Gネットワークをサポートしています。
    

    出力:

    新製品FAQ: 0.95
    
  3. ステップ2最も信頼度の高いk=1のカテゴリー、すなわち「新製品FAQ」を選択する。
  4. 返信を作成する新商品FAQ」カテゴリの要約をもとに回答を作成します:
    カスタマーサービス回答:この電話機はブラック、ホワイト、ブルーの3色からお選びいただけます。
    
  5. 返信を送る顧客に回答を送信する。

5.4 継続的学習

時間の経過とともに、カスタマーサービスは、たとえば新製品に関する問い合わせをより多く受けるようになるかもしれない:

  • 顧客は "この携帯電話のサイズは?"と尋ねる。
  • 顧客は "この電話はいくらですか?"と尋ねる。

この新しいデータは、CISの更新メカニズムを通じて「新製品FAQ」カテゴリのサマリーに追加される:

アップデータのヒント
以下は、あるカテゴリーに関するオリジナルの要約です。これから、そのカテゴリー内でm個の追加例を提供します。それに基づいて、要約を更新してください。更新された要約の長さが3文以内であることを確認してください。
元の要約:What's New FAQ: この携帯電話にはブラック、ホワイト、ブルーの3色があり、2日間バッテリーが持ち、5Gネットワークをサポートしています。
その他の例
1.顧客:この携帯電話のサイズは?
お客様:この携帯電話のサイズは146.7mm x 71.5mm x 7.65mmです。
2.お客様:この携帯電話の価格はいくらですか?
Customer Service: この携帯電話の価格は999ドルです。

要約を更新した:

What's New FAQ:ブラック、ホワイト、ブルーの3色展開で、バッテリー駆動時間は2日間、5Gネットワークに対応、サイズは146.7mm x 71.5mm x 7.65mm、価格は999ドル。

 

6.まとめ

上記の例から、CISがカスタマーサービス・プロセスにおいて強力な継続的学習を行っていることがわかる:

  • 動的更新新しいデータに基づいて、カテゴリーのサマリーを動的に更新する機能。
  • 効率的な推論要約ライブラリから、顧客からの問い合わせに対応するカテゴリーをすばやく探し出し、正確な回答を生成します。
  • 蓄積された知識アブストラクト・ライブラリーは、お客様により良いサービスを提供するために、時間をかけて知識を蓄積し続けています。

CLOBとCISに基づくこの継続的な学習パラダイムは、カスタマーサービス分野における新たな可能性を開き、組織が顧客からの問い合わせをより効率的に処理し、顧客満足度を向上させることを可能にする。

 

7.今後の見通し

CLOBとCISは、カスタマーサービスシナリオにおいて大きな可能性を示しているが、さらに検討すべき以下の問題が残っている:

  • マルチモーダルデータ処理テキスト、画像、音声など、複数の形式のデータを要約ライブラリに統合するには?
  • パーソナル・サービスさまざまな顧客のニーズや嗜好に基づいて、パーソナライズされた対応をどのように提供していますか?
  • 時事性顧客からの問い合わせにリアルタイムで対応するシステムの能力を、さらに向上させるにはどうすればよいでしょうか?

継続的な研究と革新を通じて、CLOBとCISは、より幅広い顧客サービスの場面でより大きな役割を果たし、組織にとってより大きな価値を生み出すことが期待されている。

無断転載を禁じます:チーフAIシェアリングサークル " CLOB: キューワードのみを用いた大規模言語モデルによる一連のタスクの連続学習

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語