抄録
OpenAIのGPT-4、GoogleのPaLM、MetaのLLaMAなどの大規模言語モデル(LLM)は、人間のようなテキスト生成と自然言語理解を可能にすることで、人工知能(AI)を劇的に変化させてきた。しかし、静的な学習データに依存しているため、動的でリアルタイムのクエリに対応する能力が制限され、その結果、出力が古くなったり、不正確になったりする。Retrieval Augmented Generation(RAG)は、リアルタイムデータ検索を統合することで、LLMを増強し、文脈に関連したタイムリーな応答を提供するソリューションとして登場した。RAGの有望性にもかかわらず、従来のRAGシステムは、静的なワークフローという点で限界があり、多段階の推論や複雑なタスク管理に対応するために必要な柔軟性に欠けている。
Agentic Retrieval Augmented Generation(Agentic RAG)は、RAGプロセスに自律型AIエージェントを組み込むことで、これらの制限を克服する。これらのエージェントは、リフレクション、プランニング、ツール使用、マルチエージェントコラボレーションといったエージェント的デザインパターンを活用し、検索戦略を動的に管理し、文脈理解を反復的に改良し、複雑なタスクの要件を満たすようにワークフローを適応させる。この統合により、Agentic RAGシステムは、幅広いアプリケーションにおいて比類のない柔軟性、スケーラビリティ、およびコンテキストアウェアネスを提供することができます。
このレビューでは、エージェント型RAGについて、その基本原理とRAGパラダイムの進化から包括的に説明する。エージェント型RAGアーキテクチャの分類を詳述し、ヘルスケア、金融、教育などの産業における主要なアプリケーションを強調し、実用的な実装戦略を探求する。さらに、エージェント型RAGを実装するためのフレームワークやツールに関する詳細な洞察を提供しながら、これらのシステムのスケーリング、倫理的な意思決定の確保、実世界のアプリケーションのパフォーマンス最適化の課題について議論する。
キーワード 大規模言語モデル(LLM) - 人工知能(AI) - 自然言語理解 - 検索拡張生成(RAG) - エージェント型RAG - 自律型AIエージェント - 反省 - 計画 - ツールの使用 - マルチエージェント連携 - エージェント型パターン - コンテキスト理解 - 動的適応 - 拡張性 - リアルタイムデータ検索 - エージェント型RAG分類 - 医療アプリケーション - 金融アプリケーション - 教育アプリケーション倫理的AI意思決定 - パフォーマンス最適化 - 多段階推論
1 はじめに
OpenAIのGPT-4、GoogleのPaLM、MetaのLLaMAなどの大規模言語モデル(LLM)[1, 2] [3]は、人間のようなテキストを生成し、複雑な自然言語処理タスクを実行することで、人工知能(AI)を劇的に変化させてきた。これらのモデルは、会話エージェント、自動コンテンツ作成、リアルタイム翻訳など、対話[4]の分野における技術革新を牽引してきた。最近の進歩により、テキストから画像、テキストからビデオへの生成[5]などのマルチモーダルなタスクに機能が拡張され、詳細なプロンプトに基づくビデオや画像の作成と編集が可能になり[6]、生成AIの潜在的な応用範囲が広がっている。
このような進歩にもかかわらず、LLMは静的な事前学習データに依存しているため、依然として大きな制限に直面している。この依存は一般的に、古い情報、幻の応答[7]、ダイナミックな実世界のシナリオに適応できないことにつながる。このような課題から、リアルタイムのデータを統合し、文脈の関連性と精度を維持するために応答を動的に改良できるシステムの必要性が強調されている。
RAGは、LLMの生成能力と外部の検索メカニズム[10]を組み合わせることで、応答の関連性と適時性を高める。これらのシステムは、知識ベース[11]、API、またはWebなどのソースからリアルタイムの情報を取得し、静的な学習データと動的なアプリケーション要件のギャップを効果的に埋める。しかし、従来のRAGワークフローは、線形で静的な設計にまだ制約されており、複雑なマルチステップ推論を実行し、深い文脈理解を統合し、応答を反復的に改良する能力が制限されている。
エージェントの進化 [12] は、AIシステムの能力をさらに向上させた。LLMベースやモバイルエージェント[13]を含む最新のエージェントは、知覚、推論、タスクを自律的に実行できる知的エンティティである。これらのエージェントは、リフレクション[14]、プランニング[15]、ツールの使用、マルチエージェントコラボレーション[16]などのエージェントベースのワークフローパターンを利用し、動的なワークフローを管理し、複雑な問題を解決することができる。
RAGとエージェント知能の融合は、エージェントをRAGプロセスに統合するパラダイムである、エージェント型検索拡張生成(Agentic Retrieval Augmented Generation)[17]を生み出した。従来のRAGとは異なり、Agentic RAGは、検索をオーケストレーションし、関連情報をフィルタリングし、応答を洗練させるために自律的なエージェントを採用しており、精度と適応性が要求されるシナリオで優れている。
この総説では、エージェント型 RAG の基本原理、分類、および応用を探求する。Simple RAG、Modular RAG、Graph RAG [19] などの RAG パラダイムと、Agentic RAG システムへの進化の包括的な概観を提供する。主な貢献として、エージェント型RAGフレームワークの詳細な分類、ヘルスケア[20,21]、金融、教育[22]などの領域における応用、実装戦略、ベンチマーキング、倫理的考察に関する洞察が挙げられる。
本稿の構成は以下の通りである:セクション2はRAGとその進化を紹介し、従来のアプローチの限界を強調する。セクション3では、エージェント知能の原理とエージェントモデルについて詳述する。セクション4は、シングルエージェント、マルチエージェント、グラフベースのフレームワークを含むエージェント型RAGシステムの分類を提供する。セクション5では、エージェント型RAGのアプリケーションを検討し、セクション6では、実装ツールとフレームワークについて議論する。第7節ではベンチマークとデータセットに焦点を当て、第8節ではエージェント型RAGシステムの今後の方向性について結論を述べる。
2 検索機能強化の生成根拠
2.1 検索拡張世代(RAG)の概要
検索補強型生成(RAG)は、大規模言語モデル(LLM)の生成能力とリアルタイムのデータ検索を組み合わせたもので、人工知能の分野における大きな進歩である。LLMは自然言語処理において卓越した能力を発揮しているが、静的な事前学習データに依存するため、古い応答や不完全な応答がしばしば生じる。RAGは、外部ソースから関連情報を動的に取得し、それを生成プロセスに組み込むことで、この制限に対処し、文脈に正確で応答性の高い出力をタイムリーに生成することを可能にする。
2.2 RAGのコア・コンポーネント
RAGシステムのアーキテクチャは、3つの主要コンポーネントを統合している(図1参照):
- 取り出すナレッジベース、API、ベクターデータベースなどの外部データソースへのクエリーを担当。高度なリトリーバーは、検索精度と意味的関連性を向上させるために、密なベクトル検索とTransformerベースのモデルを利用します。
- 補強検索されたデータを処理し、クエリのコンテキストに最も関連性の高い情報を抽出して要約する。
- 生成検索された情報を、事前に学習されたLLMの知識と組み合わせ、首尾一貫した、文脈に適した応答を生成する。
2.3 RAGパラダイムの進化
Retrieval Augmented Generation (RAG)の分野は、文脈に沿った正確さ、拡張性、多段階の推論が重要となる実世界のアプリケーションの複雑化に対処するために、大きな進歩を遂げてきた。単純なキーワードベースの検索から始まり、様々なデータソースと自律的な意思決定プロセスを統合できる、複雑でモジュール化された適応型システムへと変化してきた。この進化は、複雑なクエリを効率的かつ効果的に処理するRAGシステムの必要性が高まっていることを浮き彫りにしている。
このセクションでは、RAGパラダイムの進化を検証し、開発の主要な段階(シンプルRAG、アドバンスRAG、モジュラーRAG、グラフRAG、エージェントベースRAG)、およびそれらの定義的な特徴、長所、および限界について説明する。これらのパラダイムの進化を理解することで、読者は検索と生成能力における進歩、および様々なドメインにおける応用を理解することができる。
2.3.1 シンプルなRAG
単純RAG[23]は、検索強化生成の基本的な実装を表している。図2は、キーワードベースの検索と静的なデータセットに焦点を当てた、単純な検索読み出しワークフローのための単純なRAGを示している。これらのシステムは、TF-IDFやBM25のような単純なキーワードベースの検索技術に依存して、静的データセットから文書を検索する。検索された文書は、言語モデルの生成を強化するために使用される。
シンプルRAGは、そのシンプルさと実装の容易さが特徴で、文脈の複雑さを最小限に抑えたファクトベースのクエリを含むタスクに適している。しかし、いくつかの制限がある:
- 文脈認識の欠如検索された文書は、意味的な理解よりもむしろ語彙的なマッチングに頼っているため、クエリの意味的なニュアンスを捉えられないことが多い。
- 出力の断片化高度な前処理や文脈の統合の欠如は、しばしば支離滅裂な回答や過度に一般的な回答につながる。
- スケーラビリティの問題キーワードベースの検索技術は、大規模なデータセットを扱う場合、パフォーマンスが低下する傾向があり、通常、最も関連性の高い情報を特定できない。
これらの制限にもかかわらず、単純なRAGシステムは、検索と生成を組み合わせるための重要な概念実証を提供し、より複雑なパラダイムへの基礎を築く。
2.3.2 アドバンスドRAG
高度なRAG[23]システムは、意味理解と強化された検索技術を統合することで、単純なRAGの限界を構築する。図3は、アドバンストRAGの意味理解と反復的で文脈を意識した検索プロセスを強調している。これらのシステムは、検索精度を向上させるために、密なパラグラフ検索(DPR)やニューラル・ランキング・アルゴリズムなどの密な検索モデルを利用している。
アドバンスドRAGの主な特徴は以下の通り:
- 密集ベクトル探索クエリとドキュメントは高レベルのベクトル空間で表現され、その結果、ユーザーのクエリと検索されたドキュメントの間のセマンティックアライメントが改善される。
- コンテキストの並べ替えニューラル・モデルは、検索された文書を並べ替え、文脈に最も関連した情報を優先する。
- 反復探索Advanced RAGは、複数の文書にまたがる複雑なクエリの推論を可能にするマルチホップ検索メカニズムを導入している。
これらの進歩により、高度なRAGは、研究合成やパーソナライズされたレコメンデーションなど、高精度で微妙な理解を必要とするアプリケーションに適している。しかしながら、特に大規模なデータセットや多段階のクエリを扱う場合には、計算オーバーヘッドやスケーラビリティの制限という問題が残る。
2.3.3 モジュラーRAG
モジュラーRAG[23]は、柔軟性とカスタマイズに重点を置いたRAGパラダイムの最新の発展形である。これらのシステムは、ドメイン固有の最適化とタスクの適応性を可能にするために、検索と生成のプロセスを個別の再利用可能なコンポーネントに分解する。図4は、モジュラーアーキテクチャを示し、ハイブリッド検索戦略、コンポーザブルプロセス、外部ツールの統合を示している。
モジュール式RAGの主なイノベーションは以下の通り:
- ハイブリッド検索戦略スパースな検索手法(例:スパースエンコーダー - BM25)と密な検索手法(例:DPR - Dense Paragraph Retrieval)を組み合わせることで、様々なタイプのクエリに対する精度を最大化することができます。
- ツール統合リアルタイムのデータ分析やドメイン固有の計算など、特定のタスクを処理するための外部API、データベース、計算ツールの統合。
- コンポーザブル・プロセスモジュール式RAGは、リトリーバー、ジェネレーター、その他のコンポーネントの交換、増強、再構成を可能にし、特定のユースケースへの高度な適応を可能にする。
例えば、金融分析のために設計されたモジュール式RAGシステムは、APIを通じてリアルタイムの株価を取得し、集中的な検索を用いて過去のトレンドを分析し、カスタマイズされた言語モデルを通じて実用的な投資洞察を生成することができる。このようなモジュール性とカスタマイズ性により、モジュール型RAGは複雑で多分野にまたがるタスクに適しており、スケーラビリティと精度の両方を提供します。
2.3.4 フィギュア RAG
グラフRAG [19]は、図5に示すように、グラフベースのデータ構造を統合することで、従来の検索機能拡張生成システムを拡張する。これらのシステムは、マルチホップ推論と文脈強調を強化するために、グラフデータ内の関係と階層を利用する。グラフベースの検索を統合することで、グラフRAGは、特に関係理解を必要とするタスクに対して、より豊かで正確な生成出力を生成することができる。
フィギュアRAGの特徴は、その能力にある:
- ノード接続性エンティティ間の関係を把握し、推論する。
- 階層的知識管理グラフ階層を通して構造化データと非構造化データを扱う。
- コンテクストセンシティブグラフパスを使って関係理解を深める。
しかし、RAGグラフにはいくつかの限界がある:
- 限られたスケーラビリティグラフ構造への依存は、特に広範なデータソースに対するスケーラビリティを制限する可能性がある。
- データ依存意味のあるアウトプットのためには高品質のグラフデータが不可欠であるため、構造化されていないデータセットや注釈が不十分なデータセットへの適用には限界がある。
- 統合の複雑さグラフデータを非構造化検索システムに統合すると、設計と実装が複雑になる。
グラフRAGは、構造化された関係に関する推論が重要な、医療診断や法律研究などの分野での応用に適している。
2.3.5 代理RAG
エージェントベースのRAGは、動的な意思決定とワークフローの最適化が可能な自律型エージェントを導入することで、パラダイムシフトを表している。静的なシステムとは異なり、エージェントベースのRAGは、複雑でリアルタイムかつマルチドメインなクエリに対処するために、反復的な改良と適応的な検索戦略を採用している。このパラダイムは、エージェントベースの自律性を導入しながら、検索と生成プロセスのモジュール性を利用する。
エージェントベースRAGの主な特徴は以下の通り:
- 自決エージェントは、クエリの複雑さに基づいて検索戦略を独自に評価し、管理する。
- 反復的改良検索精度と回答の関連性を向上させるために、フィードバックループを統合する。
- ワークフローの最適化リアルタイムアプリケーションをより効率的にするために、タスクを動的にスケジューリングします。
こうした進歩にもかかわらず、エージェントベースのRAGは多くの課題に直面している:
- 調整の複雑さエージェント間の相互作用を管理するには、複雑な調整メカニズムが必要です。
- 計算オーバヘッド複数のエージェントを使うことで、複雑なワークフローに必要なリソースが増えます。
- スケーラビリティ制約スケーラブルではあるが、システムのダイナミックな性質上、クエリー量が多い場合は圧迫される可能性がある。
エージェントベースのRAGは、顧客サポート、金融分析、アダプティブ・ラーニング・プラットフォームなど、動的適応性と文脈に応じた正確さが重要な分野での応用に優れている。
2.4 従来のRAGシステムの課題と限界
従来のRAG(Retrieval Augmented Generation)システムは、リアルタイムデータ検索を統合することで、大規模言語モデル(LLM)の能力を大幅に拡張してきた。しかし、これらのシステムは、複雑な実世界アプリケーションでの有効性を妨げる多くの重要な課題に依然として直面している。最も顕著な限界は、コンテキストの統合、マルチステップ推論、スケーラビリティとレイテンシの問題である。
2.4.1 コンテキストの統合
RAGシステムが関連情報の検索に成功しても、その情報を生成された応答にシームレスに統合するのに苦労することが多い。検索プロセスの静的な性質と限られた文脈認識は、断片的で一貫性のない、あるいは過度に一般的な出力につながる。
例:「アルツハイマー病研究における最近の進歩と早期治療への影響」といったクエリは、関連する科学論文や医療ガイドラインを生成する可能性がある。しかし、従来のRAGシステムでは、これらの知見を、新しい治療法を特定の患者のシナリオに結びつける首尾一貫した説明にまとめることができないことが多い。同様に、「乾燥地域における小規模農業の持続可能な最善の方法は何か」というようなクエリに対して、従来のシステムでは、一般的な農業方法に関する論文は検索できても、乾燥環境にとって決定的に重要な持続可能な方法は検索できない可能性がある。
表1. RAGパラダイムの比較分析
パラダイム | 主な特徴 | 強み |
---|---|---|
ナイーブRAG | - キーワードベース 回収 (例:TF-IDF。 BM25) | - シンプルで簡単な実装 - 事実ベースのクエリに最適 |
上級RAG | - 高密度検索モデル(DPRなど) - ニューラル・ランキングと再ランキング - マルチホップ検索 | - 高精度検索 - 文脈的関連性の向上 |
モジュラーRAG | - ハイブリッド検索(疎と密) - ツールとAPIの統合 - 構成可能なドメイン固有のパイプライン | - 高い柔軟性とカスタマイズ性 - 多様なアプリケーションに対応 - 拡張性 |
グラフ RAG | - グラフベースの構造の統合 - マルチホップ推論 - ノードを介した文脈の濃縮 | - リレーショナル推論機能 - 幻覚を軽減 - 構造化データタスクに最適 |
エージェントRAG | - 自律エージェント - ダイナミックな意思決定 - 反復的な洗練化 ワークフロー 最適化 | - リアルタイムの変化に対応可能 - マルチドメイン・タスクに対応する拡張性 - 高精度 |
2.4.2 多段階推論
実世界の多くのクエリは、反復的またはマルチホップ推論(複数のステップから情報を検索し、合成する)を必要とする。従来のRAGシステムは、中間的な洞察やユーザーからのフィードバックに基づいて検索を改良する準備ができていないことが多く、その結果、不完全な回答やバラバラの回答になってしまう。
例:"ヨーロッパの再生可能エネルギー政策からどのような教訓が得られ、発展途上国にどのような潜在的経済的影響があるか?"といった複雑なクエリ。政策データ、発展途上地域との関連、経済分析など、複数の情報を調整する必要がある。従来のRAGシステムでは、これらの異質な要素を首尾一貫した対応に結びつけることができないことが多い。
2.4.3 スケーラビリティとレイテンシーの問題
外部データソースの数が増えるにつれて、大規模なデータセットのクエリとランキングはますます計算集約的になる。これは大きな待ち時間につながり、リアルタイム・アプリケーションでタイムリーな応答を提供するシステムの能力を損なう。
例:金融分析やリアルタイムのカスタマーサポートなど、一刻を争う環境では、複数のデータベースへのクエリや、大規模なドキュメントセットでの作業による遅延が、システム全体の実用性を低下させる可能性がある。例えば、高頻度取引における市場動向の取得の遅延は、チャンスを逃す結果になりかねません。
2.5 エージェントベースRAG:パラダイムシフト
従来のRAGシステムは、その静的なワークフローと限られた適応性により、しばしば動的で多段階の推論と複雑な実世界のタスクを処理するのに苦労している。動的な意思決定、反復的な推論、適応的な検索戦略を可能にする自律エージェントを統合することで、エージェントベースのRAGは、以前のパラダイムのモジュール性を維持しながら、固有の限界を克服している。この進化は、より複雑な複数領域のタスクを、より高い精度と文脈理解で解決することを可能にし、エージェントベースRAGを次世代のAIアプリケーションの基盤として位置づける。特に、エージェントベースのRAGシステムは、最適化されたワークフローによって待ち時間を短縮し、出力を段階的に改良することで、従来のRAGのスケーラビリティと有効性を長い間妨げてきた課題に対処する。
3 エージェント・インテリジェンスの核となる原理と文脈
エージェント知能は、エージェントベースの検索拡張世代(RAG)システムの基礎を形成し、従来のRAGの静的で反応的な性質を超えることを可能にする。動的な意思決定、反復的な推論、協調的なワークフローが可能な自律エージェントを統合することにより、エージェントベースのRAGシステムは、より高い適応性と精度を示す。このセクションでは、エージェント・インテリジェンスを支える基本原理について説明する。
AIエージェントの構成要素基本的に、AIエージェントは以下のような構成になっている(図6参照):
- LLM(役割とタスクが定義されている)エージェントの主要な推論エンジンと対話インターフェースとして機能します。ユーザーの問い合わせを解釈し、応答を生成し、一貫性を維持する。
- 記憶(短期および長期)対話中のコンテキストと関連データの取得。短期記憶[25]は即時の対話状態を追跡し、長期記憶[25]は蓄積された知識とエージェントの経験を保存する。
- プランニング(内省と自己批判)内省、クエリ・ルーティング、自己批判[26]を通して、エージェントの反復推論プロセスを導くことで、複雑なタスクが効果的に分解されるようにする[15]。
- ツール(ベクトル検索、ウェブ検索、APIなど)テキスト生成だけでなく、外部リソースやリアルタイムデータ、特殊なコンピューティングにアクセスできるようにエージェントの能力を拡張する。
3.1 代理モデル
エージェントパターン[27, 28]は、エージェントベースのRAG(Retrieval Augmented Generation)システムにおいて、エージェントの振る舞いをガイドする構造化された方法を提供する。これらのパターンは、エージェントが動的に適応し、計画を立て、協力することを可能にし、システムが複雑な実世界のタスクを正確かつスケーラブルに処理できることを保証する。つの主要なパターンがエージェントのワークフローの基礎を形成する:
3.1.1 反射
リフレクションはエージェントのワークフローにおける基本的なデザインパターンであり、エージェントが出力を反復的に評価し、改良することを可能にします。セルフフィードバックメカニズムを統合することで、エージェントはエラー、矛盾、改善点を特定し解決することができ、それによってコード生成、テキスト生成、Q&Aなどのタスクのパフォーマンスを向上させることができます(図7に示すように)。実際には、リフレクションには、エージェントに、その出力の正しさ、スタイル、効率性の観点からの批評を促し、その後の反復にこのフィードバックを組み込むことが含まれる。ユニットテストやウェブ検索などの外部ツールは、結果を検証しギャップを強調することで、このプロセスをさらに強化することができる。
例えば、あるエージェントが出力を生成し、別のエージェントがそれを批評することで、協調的な改善を促進する。例えば、法律研究では、エージェントは、検索された判例を再評価することによって、正確性と包括性を確保するために応答を反復的に改良することができる。Reflectionは、Self-Refine [29]、Reflexion [30]、CRITIC [26]などの研究で、大幅な性能向上を示している。
3.1.2 プランニング
プランニング[15]は、エージェントが複雑なタスクをより小さく管理しやすいサブタスクに自律的に分解することを可能にする、エージェントワークフローの重要なデザインパターンである。この機能は、ダイナミックで不確実なシナリオにおけるマルチホップ推論と反復的な問題解決に不可欠である(図8に示すように)。
プランニングを活用することで、エージェントはより大きな目標を達成するために必要な一連のステップを動的に決定することができる。この適応性により、エージェントは事前に定義できないタスクに取り組むことができ、意思決定の柔軟性を確保することができる。強力ではあるが、プランニングは、リフレクションのような決定論的なワークフローに比べ、予測しにくい結果をもたらす可能性がある。プランニングは、事前に定義されたワークフローでは不十分な、動的な適応を必要とするタスクに特に適している。この技術が成熟するにつれて、領域横断的な革新的なアプリケーションを推進する可能性は、ますます高まっていくだろう。
3.1.3 道具の使用
ツールの使用は、図9に示すように、エージェントが外部のツール、API、または計算リソースと相互作用することによって、その能力を拡張することを可能にする。このモデルは、エージェントが事前に訓練された知識を超えて情報を収集し、計算を実行し、データを操作することを可能にする。ツールをワークフローに動的に統合することで、エージェントは複雑なタスクに適応し、より正確で文脈に即したアウトプットを提供することができる。
最新のエージェントワークフローは、情報検索、計算推論、外部システムとのインタフェースを含む様々なアプリケーションにツールの使用を統合します。このモデルの実装は、GPT-4の機能呼び出し機能と、多数のツールへのアクセスを管理できるシステムの開発によって大きく進化しました。これらの開発により、エージェントが与えられたタスクに最も関連性の高いツールを自律的に選択・実行できる複雑なエージェントワークフローが容易になりました。
ツールの利用はエージェントのワークフローを大きく向上させたが、特に利用可能な選択肢が多数ある場合、ツール選択の最適化には課題が残る。この問題に対処するために、ヒューリスティックに基づく選択など、検索機能付き生成(RAG)に触発された技術が提案されている。
3.1.4 マルチエージェント
マルチエージェントコラボレーション(Multi-Agent Collaboration)[16]は、タスクの特化と並列処理を可能にする、エージェントワークフローにおける重要なデザインパターンである。エージェントは互いに通信し、中間結果を共有することで、ワークフロー全体が効率的で首尾一貫した状態に保たれます。サブタスクを特化したエージェントに割り当てることで、このパターンは複雑なワークフローのスケーラビリティと適応性を向上させる。マルチエージェントシステムにより、開発者は複雑なタスクをより小さく、管理しやすいサブタスクに分解し、異なるエージェントに割り当てることができる。このアプローチはタスクのパフォーマンスを向上させるだけでなく、複雑なインタラクションを管理するための強力なフレームワークを提供する。各エージェントは独自のメモリとワークフローを持ち、ツールの使用、リフレクション、プランニングを含むことができ、ダイナミックで協調的な問題解決を可能にする(図10参照)。
マルチエージェントコラボレーションは大きな可能性を秘めているが、リフレクションやツールの使用など、より成熟したワークフローに比べると、予測可能性の低いデザインパラダイムである。とはいえ、AutoGen、Crew AI、LangGraphのような新しいフレームワークが、効果的なマルチエージェント・ソリューションを実装する新しい方法を提供しつつある。
これらのパターンは、エージェントベースのRAGシステムの成功の礎であり、多様で動的な環境の要求を満たすために、検索と生成のワークフローを動的に適応させることを可能にする。これらのパターンを利用することで、エージェントは従来のRAGシステムの能力を超えた、反復的でコンテキストを意識したタスクを処理することができる。
4 エージェントベースRAGシステムの分類
エージェントベースのRAG(Retrieval Augmented Generation)システムは、その複雑さと設計原理に基づいて、さまざまなアーキテクチャフレームワークに分類することができる。これには、シングルエージェントアーキテクチャ、マルチエージェントシステム、階層的エージェントアーキテクチャが含まれる。各フレームワークは、特定の課題に対処し、異なるアプリケーションにおけるパフォーマンスを最適化することを目的としている。本セクションでは、これらのアーキテクチャを詳細に分類し、その特徴、利点、および限界を明らかにする。
4.1 シングル・エージェント・プロキシ RAG:ルーター
シングルエージェントエージェントベースのRAG[31]は、1つのエージェントが検索、ルーティング、情報統合を管理する集中型の意思決定システムとして機能する(図11に示すように)。このアーキテクチャは、これらのタスクを単一の統一されたエージェントに統合することによってシステムを簡素化し、ツールやデータソースの数が限られている環境に特に適している。
ワークフロー
- 問い合わせの提出と評価ユーザがクエリを送信するとプロセスが開始される。調整エージェント(またはマスター検索エージェント)がクエリを受け取り、それを分析して最も適切な情報源を決定する。
- 知識源の選択クエリの種類に応じて、コーディネーション・エージェントは様々な検索オプションから選択する:
- 構造化データベース表形式データへのアクセスが必要なクエリには、PostgreSQLやMySQLなどのデータベースと相互作用するText-to-SQLエンジンを使用することができます。
- セマンティックサーチ非構造化情報を扱う場合、ベクトルベースの検索を使用して関連文書(PDF、書籍、組織記録など)を検索します。
- インターネット検索リアルタイムまたは幅広い文脈の情報については、ウェブ検索ツールを利用して最新のオンラインデータにアクセスする。
- レコメンダーシステムパーソナライズされたクエリや文脈的なクエリに対しては、システムはレコメンデーション・エンジンを使用して、カスタマイズされた提案を提供します。
- データ統合とLLM合成選択されたソースから関連データが取得されると、そのデータはラージ・ランゲージ・モデル(LLM)に渡され、LLMは収集された情報をまとめ、複数のソースからの洞察を首尾一貫した、文脈に関連した応答に統合する。
- 出力生成最後に、システムは元のクエリに対する包括的でユーザー指向の回答を生成する。この回答は、実用的で簡潔な形式で提示され、オプションとして、使用されたソースの参照または引用が含まれます。
主な特徴と利点
- 一元化されたシンプルさ単一のエージェントがすべての検索とルーティングタスクを処理するため、アーキテクチャの設計、実装、保守が容易です。
- 効率化と資源の最適化エージェントの数が少なく、コーディネーションが単純であるため、システムに必要な計算資源が少なく、クエリーをより速く処理することができる。
- ダイナミックルーティングエージェントは各クエリをリアルタイムで評価し、最も適切な知識ソース(構造化データベース、セマンティック検索、ウェブ検索など)を選択する。
- クロスツールの汎用性複数のデータソースと外部APIをサポートし、構造化ワークフローと非構造化ワークフローの両方をサポート。
- シンプルなシステムに最適タスクが明確に定義されているアプリケーションや、統合要件が限定されているアプリケーション向け(ファイル検索、SQLベースのワークフローなど)。
使用例:カスタマー・サポート
注意を引く: 注文した商品の配送状況を教えてもらえますか?
システムプロセス(シングルエージェントワークフロー)::
- 問い合わせの提出と評価::
- ユーザーは問い合わせを送信し、その問い合わせは調整エージェントによって受信される。
- 代理店と連携して問い合わせを分析し、最も適切な情報源を特定する。
- 知識源の選択::
- 注文管理データベースから追跡詳細を取得する。
- クーリエのAPIからリアルタイムの最新情報を入手。
- オプションとして、天候や物流の遅れなど、配達に影響する現地の状況を特定するためにウェブ検索を行うこともできる。
- データ統合とLLM合成::
- 関連データをLLMに渡し、LLMが情報を統合して首尾一貫した対応を行う。
- 出力生成::
- このシステムは、最新情報と可能な代替案をリアルタイムで追跡できる、実用的で簡潔なレスポンスを生成する。
レスポンシブ::
統合された対応: お荷物は現在輸送中で、明日の夕方に到着する予定です。UPSのリアルタイムのトラッキングによると、お荷物は地域の配送センターにあるようです。
4.2 マルチエージェントRAGシステム
マルチエージェントRAG [31]は、シングルエージェントアーキテクチャをモジュール化し、スケーラブルに進化させたもので、(図12に示すように)複数の専門化されたエージェントを活用することで、複雑なプロセスと多様なクエリタイプを処理することを目的としている。推論、検索、応答生成のすべてのタスクを管理するために単一のエージェントに依存するのとは対照的に、システムは、特定の役割やデータソースに最適化された複数のエージェントに責任を割り当てる。
ワークフロー
- お問い合わせこのプロセスは、コーディネートエージェントまたはマスター検索エージェントによって受信されるユーザクエリから始まる。このエージェントは中央コーディネータとして機能し、クエリの要求に応じて、クエリを専門の検索エージェントに委譲する。
- 専門検索エージェントクエリは複数の検索エージェントに割り当てられ、それぞれが特定のタイプのデータソースやタスクに焦点を当てる。例
- エージェント1例えば、PostgreSQLやMySQLのようなSQLベースのデータベースとのやり取り。
- エージェント2PDF、書籍、社内記録などのソースから非構造化データを取得するためのセマンティック検索を管理します。
- エージェント3ウェブ検索やAPIからリアルタイムの公共情報を取得することに重点を置く。
- エージェント4ユーザーの行動やプロファイルに基づいて、コンテキストに関連した提案を行うレコメンダーシステムを専門としています。
- ツールアクセスとデータ検索各エージェントは、そのドメイン内の適切なツールやデータソースにクエリをルーティングする:
- ベクターサーチ意味的関連性。
- テキストからSQLへ構造化データの場合。
- インターネット検索リアルタイムの公共情報
- API外部サービスや独自システムへのアクセス用。
検索処理は並列に実行されるため、さまざまな種類のクエリを効率的に処理できる。
- データ統合とLLM合成検索が完了すると、エージェントの全データはラージ・ランゲージ・モデル(LLM)に渡され、LLMは検索された情報を、複数のソースからの洞察をシームレスに統合する、首尾一貫した文脈に関連したレスポンスに統合する。
- 出力生成このシステムは、包括的な回答を生成し、実用的で簡潔なフォーマットでユーザーに送り返す。
主な特徴と利点
- モジュラリゼーション各エージェントは独立して動作するため、システム要件に応じてエージェントをシームレスに追加または削除できます。
- スケーラビリティ複数のエージェントの並列処理により、大量のクエリを効率的に処理できる。
- 業務の専門化各エージェントは、特定のタイプのクエリやデータソースに最適化され、精度と検索関連性を向上させます。
- 効率タスクを専用のエージェントに割り当てることで、ボトルネックを最小限に抑え、複雑なワークフローのパフォーマンスを向上させます。
- 多用途研究、分析、意思決定、カスタマーサポートなど、さまざまな分野での応用が可能です。
挑戦
- 調整の複雑さエージェント間のコミュニケーションとタスクの委譲を管理するには、複雑な調整メカニズムが必要です。
- 計算オーバヘッド複数のエージェントの並列処理は、リソース使用量を増加させる可能性があります。
- データ統合異なるソースからの出力を首尾一貫した応答に統合することは容易ではなく、高度なLLM能力を必要とする。
使用例:学際的研究アシスタント
注意を引く欧州における再生可能エネルギー導入の経済的・環境的影響とは?
システムプロセス(マルチエージェントワークフロー)::
- エージェント1SQLクエリを使用して経済データベースから統計データを取得します。
- エージェント2セマンティック検索ツールを使って関連する学術論文を検索。
- エージェント3再生可能エネルギーに関する最新のニュースや政策をウェブ検索する。
- エージェント4レポートや専門家のコメントなど、関連するコンテンツを提案するリファーラル・システム。
レスポンシブ::
統合された対応EUの政策報告書によると、欧州における再生可能エネルギーの導入により、過去10年間で温室効果ガス排出量は20%削減された。経済面では、再生可能エネルギーへの投資により、約120万人の雇用が創出され、太陽光発電と風力発電の分野が大きく成長している。最近の学術研究では、系統安定性やエネルギー貯蔵コストの面で、潜在的なトレードオフがあることも浮き彫りになっている。"
4.3 階層型エージェントベースRAGシステム
階層型エージェントベースのRAG [17]システムは、情報の検索と処理に構造化されたマルチレベルのアプローチを使用し、効率と戦略的意思決定を改善する(図13に示すように)。エージェントは階層構造に組織化され、上位のエージェントが下位のエージェントを監督・指導する。この構造により、マルチレベルの意思決定が可能になり、クエリが最も適切なリソースによって処理されることが保証される。
ワークフロー
- お問い合わせ受付この問い合わせは、トップレベルのエージェントが受信し、最初の評価と委託を担当する。
- 戦略的意思決定トップレベルのエージェントは、クエリの複雑さを評価し、どの下位エージェントやデータソースを優先するかを決定します。クエリのドメインによっては、特定のデータベース、API、または検索ツールが、より信頼できる、または関連性があるとみなされるかもしれません。
- 部下への委任トップレベルのエージェントは、特定の検索方法(SQLデータベース、ウェブ検索、独自システムなど)を専門とする下位レベルのエージェントにタスクを割り当てる。これらのエージェントは、割り当てられたタスクを独立して実行します。
- 重合と合成上位エージェントは、下位エージェントからの結果を収集・統合し、情報を統合して首尾一貫した対応を行う。
- レスポンス・デリバリー最終的に、総合的に判断された回答がユーザーに返されます。
主な特徴と利点
- 戦略的優先順位付けトップレベルエージェントは、クエリの複雑さ、信頼性、コンテキストに基づいて、データソースやタスクに優先順位をつけることができる。
- スケーラビリティ複数のエージェントレベルにタスクを割り当てることで、非常に複雑で多面的なクエリを処理することができます。
- 意思決定能力の強化: : 高いレベルのエージェントが、全体的な正確さと一貫した対応を向上させるために、戦略的な監督を行う。
挑戦
- 調整の複雑さ複数のレベルにまたがるロバストなエージェント間コミュニケーションを維持することは、コーディネーションのオーバーヘッドを増加させる可能性がある。
- 資源配分ボトルネックを避けながら、レベル間のタスクを効率的に分配するのは容易ではない。
使用例:財務分析システム
注意を引く現在の市場動向に基づく再生可能エネルギーへの投資オプションは?
システムプロセス(階層的エージェントワークフロー)::
- ヒエラルキーの頂点に立つエージェントクエリの複雑さを評価し、妥当性の低いデータソースよりも信頼性の高い金融データベースや経済指標を優先する。
- 中堅エージェント独自のAPIや構造化SQLデータベースからリアルタイムの市場データ(株価や業界業績など)を取得。
- 下級エージェント最近の発表や政策についてウェブ検索を行い、専門家の意見やニュース分析を追跡するために紹介システムを参照する。
- 重合と合成:: 量的データと政策的洞察を統合したトップレベルの代理集計結果。
レスポンシブ::
統合された対応現在の市場データによると、再生可能エネルギーのシェアは、主に政府の支援政策と投資家の高い関心によって、過去四半期に15%増加した。アナリストは、風力発電と太陽光発電のセクターは今後も勢いを増し、グリーン水素のような新興技術はリスクは中程度だが高いリターンをもたらす可能性があると見ている。"
4.4 代理修正RAG
Corrective RAG [32] [33]は、検索結果を自己修正する機能を導入し、文書の利用を高め、応答生成の質を向上させる(図14に示す)。ワークフローにインテリジェント・エージェントを組み込むことで、Corrective RAG [32] [33]は、エラーを最小化し、関連性を最大化するために、文脈文書と応答の反復的な改良を保証する。
RAGの核となる考え方の修正Corrective RAGの基本原理は、検索された文書を動的に評価し、修正アクションを実行し、生成されたレスポンスの品質を向上させるためにクエリを改良する能力にある。Corrective RAGはその手法を以下のように調整する:
- 文書の妥当性評価取得された文書は関連性評価エージェントによって評価される。関連性閾値以下の文書は修正ステップのトリガーとなる。
- 問い合わせの改良と強化クエリは、より良い結果を得るために検索を最適化する意味理解を使用するクエリ絞り込みエージェントによって絞り込まれます。
- 外部ソースからの動的検索コンテキストが不十分な場合、外部の知識検索エージェントはウェブ検索を実行するか、検索されたドキュメントを補完するために別のデータソースにアクセスする。
- 応答合成検証され洗練された情報はすべて、最終的なレスポンス生成のためにレスポンス合成エージェントに渡される。
ワークフロー修正RAGシステムは、5つの主要なエージェントによって構築されている:
- コンテキスト検索エージェントベクトルデータベースから最初のコンテキスト文書を検索する。
- 関連性評価エージェント検索された文書の関連性を評価し、関連性のない文書や曖昧な文書にフラグを立て、是正措置を講じる。
- 問い合わせ絞り込みエージェント検索効率を向上させるためにクエリを書き換え、結果を最適化するためにセマンティックな理解を用いる。
- 外部知識検索エージェント文脈に沿った文書が不十分な場合は、ウェブ検索を実行するか、別のデータソースにアクセスします。
- レスポンス合成剤検証されたすべての情報を、首尾一貫した正確な回答に統合する。
主な特徴と利点
- 反復修正関連性のない検索結果やあいまいな検索結果を動的に識別し修正することで、高い応答精度を確保します。
- 動的適応検索精度を向上させるためのリアルタイムウェブ検索とクエリ絞り込みの統合。
- プロキシ・モジュラー各エージェントは、効率的でスケーラブルなオペレーションを保証するために、特別なタスクを実行します。
- 事実上の保証RAGを修正することで、検索・生成されたすべてのコンテンツを検証し、幻覚や誤報のリスクを最小限に抑えることができる。
使用例:学術研究アシスタント
注意を引くジェネレーティブAIの最新の研究成果とは?
システムプロセス(RAGワークフローの修正)::
- お問い合わせユーザーはシステムにクエリーを提出する。
- 文脈検索::
- コンテキスト検索エージェント生成AIに関する発表論文のデータベースから最初の文書を取得する。
- 検索された文書は、評価のために次のステップに渡される。
- 関連性の評価:
- 関連性評価エージェント文書とクエリの一致を評価する。
- 文書を関連、あいまい、無関係に分類する。無関係な文書には是正措置のためのフラグを立てる。
- 是正措置(必要な場合):
- 問い合わせ絞り込みエージェント特異性を高めるためにクエリを書き換える。
- 外部知識検索エージェントウェブ検索を行い、外部情報源から追加の論文や報告書を入手する。
- レスポンスの合成。
- レスポンス合成剤検証された文書を包括的で詳細な要約に統合する。
反応だ。
統合された対応: "最近の生成AIの研究成果には、拡散モデル、テキストからビデオへのタスクにおける強化学習、大規模モデル学習のための最適化技術の進歩などがある。詳細はNeurIPS 2024とAAAI 2025で発表された研究をご覧ください。"
4.5 適応エージェントベースRAG
Adaptive Retrieval Augmented Generation(Adaptive RAG)[34]は、入力されるクエリの複雑さに基づいてクエリ処理戦略を動的に適応させることで、大規模言語モデル(LLM)の柔軟性と効率を向上させる。静的な検索ワークフローとは異なり、Adaptive RAG [35]は、図15に示すように、クエリの複雑さを分析し、シングルステップの検索からマルチステップの推論、あるいは単純なクエリでは検索を完全にバイパスするなど、最も適切なアプローチを決定する分類器を採用している。
適応型RAGの核となる考え方 適応型RAGの基本原理は、クエリの複雑さに応じて検索戦略を動的に調整する能力にある。適応型RAGは以下のようにその方法を調整する:
- シンプルクエリ追加検索を必要とする事実問題(例:「水の沸点は何度ですか?)追加検索を必要とする事実の質問(例えば、"水の沸点は何度ですか?")に対して、システムは既存の知識を使って直接答えを生成します。
- シンプルクエリ例:「最新の電気料金の請求状況は?など)、システムは関連する詳細を取得するためにシングルステップの検索を実行します。
- コンプレックスクエリ例:「過去10年間でX市の人口はどのように変化し、その要因は何か?など)、システムは多段階の検索を使用し、中間結果を徐々に洗練させ、包括的な答えを提供する。
ワークフローアダプティブRAGシステムは、3つの主要コンポーネントで構成されている:
- クラシファイヤーの役割
- より小さな言語モデルがクエリを分析し、その複雑さを予測する。
- 分類器は、過去のモデル結果やクエリーパターンから自動的にラベル付けされたデータセットを用いて学習される。
- ダイナミックな戦略選択。
- 単純なクエリの場合、システムは不必要な検索を避け、LLMを使って直接レスポンスを生成する。
- 単純なクエリの場合、関連するコンテキストを取得するためにシングルステップの検索プロセスを使用する。
- 複雑なクエリに対しては、反復的な改良と推論の強化を確実にするために、マルチステップ検索を作動させる。
- LLMの統合。
- LLMは、検索された情報を首尾一貫した応答に統合する。
- LLMと分類器の間の反復的な相互作用により、複雑なクエリを改良することができる。
主な特徴と利点
- 動的適応: 計算効率と応答精度を最適化するために、クエリの複雑さに検索戦略を適応させる。
- 資源効率複雑なクエリを確実に処理する一方で、単純なクエリでは不必要なオーバーヘッドを最小限に抑える。
- 精度の向上:反復的な改良により、複雑なクエリを高い精度で解決することができる。
- 熟練ドメイン固有のツールや外部APIなど、追加のパスを統合するために拡張することができます。
使用例。 カスタマーサポート・アシスタント
ヒント なぜ私の小包は遅れているのですか?
システムプロセス(Adaptive RAG Workflow)。
- お問い合わせカテゴリー
- 分類器はクエリを分析し、それが多段階の推論を必要とする複雑なクエリであると判断する。
- ダイナミックな戦略選択。
- このシステムは、複雑さの分類に基づく多段階の検索プロセスを作動させる。
- 多段階検索。
- 注文データベースから追跡詳細を取得します。
- Courier API からリアルタイムのステータスアップデートを取得します。
- 天候や地域の混乱など、外的要因をウェブ検索で調べる。
- レスポンスの合成。
- LLMは、検索されたすべての情報を包括的かつ実用的な対応に統合する。
反応だ。
統合された対応お荷物は、お住まいの地域の悪天候により遅れております。現在、配送センターにあり、2日以内に到着する予定です。また、施設でのお受け取りも可能です。"
4.6 グラフベースのエージェントベースRAG
4.6.1 Agent-G:グラフRAGのためのエージェントベースのフレームワーク
Agent-G[8]は、グラフ知識ベースと非構造化文書検索を組み合わせた革新的なエージェントベースのアーキテクチャを導入している。構造化データソースと非構造化データソースを組み合わせることで、このフレームワークはRAG(Retrieval Augmented Generation)システムの推論と検索精度を向上させる。図16に示すように、高品質の出力を保証するために、モジュール化されたレトリーバー・ライブラリ、動的なエージェントの相互作用、およびフィードバック・ループを採用している。
Agent-Gの核となる考え方 Agent-Gの基本原理は、グラフ知識ベースとテキストファイルを利用して、検索タスクを専門エージェントに動的に割り当てる能力にある:
- グラフィカルな知識ベース構造化されたデータを使用して、関係、階層、つながりを抽出する(例:医療領域における疾患と症状のマッピング)。
- 非構造化文書従来のテキスト検索システムは、グラフデータを補完するために文脈情報を提供していた。
- 批評モジュール検索された情報の関連性と品質を評価し、クエリとの整合性を確認する。
- フィードバックループ検証や再問い合わせを繰り返しながら、検索や合成を洗練させていく。
ワークフローAgent-Gシステムは4つの主要コンポーネントで構成されている:
- レトリーバー・ライブラリー
- モジュール化されたエージェントのセットは、グラフベースや非構造化データの検索に特化している。
- エージェントは、クエリの要件に基づいて関連するソースを動的に選択する。
- 批評モジュール。
- 検索されたデータの関連性と品質を検証する。
- 信頼性の低い結果にフラグを付け、再検索や精緻化を行う。
- 動的エージェント・インタラクション。
- タスクに特化したエージェントは、異なるタイプのデータを統合するために協力する。
- 図とテキストソースの間の協調的な検索と合成を確実にする。
- LLMの統合。
- 検証されたデータを首尾一貫した回答にまとめる。
- 批評モジュールからの反復的なフィードバックは、クエリの意図との整合性を保証する。
主な特徴と利点
- 強化推論ダイアグラム内の構造化された関係と、非構造化文書からの文脈情報を組み合わせる。
- 動的適応検索戦略のクエリ要件への動的適応。
- 精度の向上批評モジュールは、回答に無関係なデータや質の低いデータが含まれるリスクを低減します。
- スケーラブルなモジュール性:: 拡張性を高めるため、特殊なタスクを実行する新しいエージェントの追加をサポート。
使用例:医療診断
ヒント 2型糖尿病の一般的な症状と心臓病との関係は?
システムプロセス(Agent-G ワークフロー)。
- クエリーの受信と配信:システムはクエリを受け取り、質問に完全に答えるために、グラフ構造化データと非構造化データの両方を使用する必要性を特定する。
- チャート・ファインダー
- 医療知識グラフから2型糖尿病と心臓病の関係を抽出。
- グラフの階層と関係を探ることにより、肥満や高血圧などの共通の危険因子を特定する。
- ドキュメント・レトリバー
- 医学文献から2型糖尿病の症状(口渇の増加、頻尿、疲労など)に関する記述を検索する。
- グラフベースのインサイトを補足するためにコンテキスト情報を追加する。
- 批評モジュール。
- 検索されたグラフデータと文書データの関連性と品質を評価する。
- 信頼度の低い結果にフラグを立て、絞り込みや再問い合わせを行う。
- 応答合成LLM は、グラフ・リトリーバーとドキュメント・リトリーバーからの検証データを統合し、クエリーの意図に沿った一貫性のあるレスポンスを提供する。
反応だ。
統合された対応2型糖尿病の症状には、のどの渇きの増加、頻尿、疲労感などがある。糖尿病と心臓病の間には50%の相関関係があり、主に肥満や高血圧などの危険因子を共有していることが研究で示されている。"
4.6.2 GeAR: 検索拡張生成のためのグラフ拡張エージェント
GeAR[36]は、グラフベースの検索メカニズムを統合することで、従来の検索拡張世代(RAG)システムを強化するエージェントベースのフレームワークを導入している。グラフ拡張技術とエージェントベースのアーキテクチャを利用することで、GeARは、図17に示すように、マルチホップ検索シナリオにおける課題に対処し、複雑なクエリを処理するシステムの能力を向上させる。
GeARの核となる考え方 GeARは2つの重要な革新技術によってRAGのパフォーマンスを向上させる:- グラフィカルエクステンショングラフ構造化されたデータを含むように検索プロセスを拡張することで、従来のベースライン検索機能(BM25など)を強化。
- プロキシフレームワーク検索タスクをより効率的に管理するためにグラフ拡張を利用したエージェントベースのアーキテクチャを統合し、検索プロセスにおける動的かつ自律的な意思決定を可能にする。
ワークフローGeARシステムは、次のような構成要素によって運営されている:
- 図 拡張モジュール。
- グラフベースのデータを検索プロセスに組み込むことで、システムは検索プロセス中にエンティティ間の関係を考慮することができる。
- 接続されたエンティティを含むように検索空間を拡張することによって、ベースラインサーチャーがマルチホップクエリを処理する能力を強化する。
- エージェントベースの検索。
- エージェントフレームワークは、検索プロセスを管理するために使用され、エージェントがクエリの複雑さに基づいて検索戦略を動的に選択し、組み合わせることを可能にする。
- エージェントは、検索された情報の関連性と精度を向上させるために、グラフの拡張を使用して検索パスを自律的に決定することができる。
- LLMの統合。
- 検索された情報とグラフ拡張の利点をLarge Language Modelling (LLM)の機能と組み合わせることで、首尾一貫した文脈に関連した回答を生成する。
- この統合により、非構造化文書と構造化グラフデータの両方からインスピレーションを得た生成プロセスが保証される。
主な特徴と利点
- 強化されたマルチホップ探索GeARのグラフ拡張機能により、相互に関連する複数の情報についての推論を必要とする複雑なクエリを処理することができます。
- 代理人による意思決定プロキシフレームワークは、検索戦略の動的かつ自律的な選択を可能にし、効率と関連性を向上させる。
- 精度の向上GeARは、構造化されたグラフデータを統合することで、検索された情報の精度を向上させ、より正確で文脈に適した応答を生成する。
- スケーラビリティエージェントフレームワークはモジュール化されているため、必要に応じて検索ストラテジーやデータソースを追加することができます。
使用例:マルチホップ・クイズ
ヒント J.K.ローリングの師匠に影響を与えた人物は?
システムプロセス(GeARワークフロー)。
- ヒエラルキーの頂点に立つエージェントクエリのマルチホップ性を評価し、質問に答えるためにグラフ展開と文書検索を組み合わせる必要性を判断する。
- 図 拡張モジュール。
- J.K.ローリングの恩師を、このクエリのキーとなる存在として特定する。
- 文学的関係マップ構造からデータを探ることで、メンターが影響を受けた文学をたどる。
- エージェントベースの検索。
- エージェントは、メンターの影響に関する関連情報を収集するために、グラフを拡張した検索パスを自律的に選択する。
- テキストデータソースへのクエリにより、メンターとその影響に関する構造化されていない詳細の追加コンテキストを統合する。
- 応答合成LLMを使用して、グラフと文書検索プロセスからの洞察を組み合わせ、クエリの複雑な関係を正確に反映したレスポンスを生成する。
反応だ。
統合された対応J.K.ローリングの師匠である[師匠の名前]は、[有名な作品やジャンル]で知られる[作家の名前]から多大な影響を受けた。この繋がりは、文学史における連鎖的な関係を浮き彫りにしており、影響力のあるアイデアが何世代もの作家に受け継がれることがよくある。"
4.7 エージェントベースRAGにおけるエージェントベースの文書ワークフロー
エージェントドキュメントワークフロー(ADW)[37]は、エンドツーエンドの知識作業を自動化することで、従来の検索拡張生成(RAG)パラダイムを拡張する。これらのワークフローは、文書の解析、検索、推論、およびインテリジェントなエージェントによる構造化出力を統合する、複雑な文書中心のプロセスをオーケストレーションする(図18参照)。ADWシステムは、状態を維持し、マルチステップワークフローをオーケストレーションし、ドメイン固有のロジックを文書に適用することによって、インテリジェント文書処理(IDP)とRAGの限界に対処する。
ワークフロー
- ドキュメントの解析と情報の構造化::
- 企業レベルのツール(LlamaParseなど)を使用して文書を解析し、請求書番号、日付、ベンダー情報、項目、支払条件などの関連データフィールドを抽出する。
- その後の処理のために構造化データを整理する。
- クロスプロセス状態維持::
- システムは、問題の文書コンテキストの状態を維持し、複数段階のワークフローにわたって一貫性と関連性を確保します。
- 様々な処理段階を経た文書の進捗状況を追跡します。
- 知識検索::
- 外部の知識ベース(LlamaCloudなど)やベクトルインデックスから関連する参照を取得する。
- 意思決定を強化するために、ドメイン固有のガイダンスをリアルタイムで取得する。
- エージェントベースのスケジューリング::
- インテリジェントエージェントは、ビジネスルールを適用し、マルチホップ推論を実行し、実行可能な推奨事項を生成する。
- パーサー、リトリーバー、外部APIなどのコンポーネントをオーケストレーションし、シームレスな統合を実現します。
- 実用的なアウトプットの生成::
- 出力は、特定のユースケースに合わせて構造化されたフォーマットで表示される。
- 推奨事項や抽出された洞察を、簡潔で実用的なレポートにまとめる。
ユースケース:請求書支払いワークフロー
注意を引く提出された請求書と関連ベンダーの契約条件に基づき、支払いアドバイスレポートを作成する。
システムプロセス(ADWワークフロー)::
- 請求書を解析し、請求書番号、日付、ベンダー情報、入力項目、支払条件などの主要な詳細を抽出する。
- 支払条件を確認し、適用される割引やコンプライアンス要件を特定するために、適切なベンダー契約を取得する。
- 当初の支払額、早期支払割引の可能性、予算への影響分析、戦略的支払アクションを含む支払勧告レポートを作成します。
レスポンシブ請求書 INV-2025-045 は $15,000.00 で処理されました。小計が $10,000.00 を超えているため、5% の一括発注割引が適用されている。小計が$10,000.00を超えるため、5%の一括発注割引が適用されています。
主な特徴と利点
- コンディション維持プロセス間の一貫性を確保するために、ドキュメントのコンテキストとワークフローのステージを追跡します。
- マルチステッププログラミング複数のコンポーネントや外部ツールを含む複雑なワークフローを扱う。
- 領域固有の知性的確なアドバイスのために、オーダーメイドのビジネスルールとガイドラインを適用。
- スケーラビリティモジュール化されたダイナミックなエージェント統合により、大規模なドキュメント処理をサポートします。
- 生産性の向上意思決定における人間の専門性を高めながら、反復作業を自動化する。
4.8 エージェントベースRAGフレームワークの比較分析
表2は、従来のRAG、エージェントベースのRAG、エージェントベースのドキュメントワークフロー(ADW)の3つのアーキテクチャフレームワークの包括的な比較分析である。この分析では、それぞれの長所、短所、および最適なシナリオを強調し、異なるユースケースに適用するための貴重な洞察を提供している。
表 2: 比較分析: 従来の RAG 対 エージェントベースの RAG 対 エージェントベースのドキュメントワークフロー(ADW)
性格描写 | 従来のRAG | 代理RAG | エージェントベースのドキュメントワークフロー(ADW) |
---|---|---|---|
再集計 | 分離された検索と生成タスク | マルチエージェントコラボレーションと推論 | ドキュメント中心のエンド・ツー・エンドのワークフロー |
コンテキストのメンテナンス | 制約 | メモリモジュールによる実現 | マルチステップワークフローにおけるステータスの維持 |
動的適応 | ミニマム | 御前 | ドキュメントのワークフローに合わせる |
ワークフローの構成 | 裂孔 | マルチエージェントタスクのオーケストレーション | 統合されたマルチステップ・ドキュメント処理 |
外部ツール/APIの使用 | 基本的な統合(検索ツールなど) | ツールによる拡張(APIやナレッジベースなど) | ビジネスルールやドメイン固有のツールとの深い統合 |
スケーラビリティ | 小規模なデータセットやクエリに限定 | スケーラブルなマルチエージェントシステム | スケーラブルな複数分野の企業ワークフロー |
複合推論 | ベーシック(簡単なクイズなど) | エージェントによる多段階推論 | 文書間の構造化推論 |
主要アプリケーション | Q&Aシステム、知識検索 | 学際的な知識と推論 | 契約審査、請求書処理、クレーム分析 |
ゆうせい | シンプルで迅速なセットアップ | 高精度の協調的推論 | エンド・ツー・エンドの自動化、ドメイン固有のインテリジェンス |
挑戦 | 文脈の理解不足 | 調整の複雑さ | リソースのオーバーヘッド、フィールドの標準化 |
比較分析により、従来のRAGからエージェントベースのRAG、そしてエージェントベースのドキュメントワークフロー(ADW)への進化の軌跡を強調する。従来の RAG は、基本的なタスクのためのシンプルさと展開のしやすさという利点を提供する一方で、エージェントベース RAG は、マルチエージェントコラボレーションを通じて強化された推論機能と拡張性を導入する。ADW は、エンドツーエンドの自動化とドメイン固有のプロセスとの統合を促進する、堅牢なドキュメント中心のワークフローを提供することによって、これらの進歩を基礎とする。各フレームワークの長所と限界を理解することは、特定のアプリケーションのニーズと運用要件に最も適したアーキテクチャを選択する上で非常に重要である。
5 代理RAGの適用
エージェントベースのRAG(Retrieval Augmented Generation)システムは、様々な領域において変革の可能性を示している。リアルタイムのデータ検索、生成機能、自律的な意思決定を組み合わせることで、これらのシステムは複雑でダイナミック、かつマルチモーダルな課題に対処する。本セクションでは、エージェントベースのRAGの主要なアプリケーションを探求し、これらのシステムがカスタマーサポート、ヘルスケア、金融、教育、法律ワークフロー、クリエイティブ産業などのドメインをどのように形成しているかを詳述する。
5.1 カスタマーサポートとバーチャルアシスタント
エージェントベースのRAGシステムは、リアルタイムでコンテキストを意識した問い合わせ解決を可能にすることで、カスタマーサポートに革命をもたらしている。従来のチャットボットやバーチャルアシスタントは、静的なナレッジベースに依存することが多く、その結果、一般的な回答や時代遅れの回答になっていました。対照的に、エージェントベースのRAGシステムは、動的に最も関連性の高い情報を取得し、ユーザーのコンテキストに適応し、パーソナライズされた応答を生成します。
ユースケース:Twitch広告の販売強化 [38]
例えば、TwitchはAmazon Bedrock上のRAGを使ったエージェンシースタイルのワークフローを活用し、広告セールスを効率化している。このシステムは、広告主データ、過去のキャンペーン実績、視聴者統計を動的に取得し、詳細な広告提案を作成することで、業務効率を大幅に向上させている。
主なメリット
- 対応の質の向上パーソナライズされた、文脈に関連した応答は、ユーザーのエンゲージメントを高めます。
- 経営効率複雑な問い合わせを自動化することで、手作業によるサポート担当者の作業負荷を軽減します。
- リアルタイムの適応性リアルタイムのサービス停止や価格更新など、進化するデータを動的に統合。
5.2 医療と個別化医療
ヘルスケアにおいて、患者固有のデータと最新の医学研究を組み合わせることは、十分な情報に基づいた意思決定を行う上で非常に重要である。エージェントベースのRAGシステムは、臨床ガイドライン、医学文献、患者履歴をリアルタイムで検索し、臨床医の診断や治療計画を支援することで、これを可能にします。
使用例:患者事例の要約 [39]
エージェントベースのRAGシステムは、患者の症例要約の生成に応用されている。例えば、電子カルテ(EHR)と最新の医学文献を統合することで、臨床医がより迅速で十分な情報に基づいた判断を下せるよう、包括的なサマリーを生成する。
主なメリット
- パーソナル・ケア個々の患者のニーズに合わせて推奨する。
- 時間効率関連研究の検索を効率化し、医療従事者の貴重な時間を節約します。
- 精度推奨が最新のエビデンスと患者固有のパラメータに基づいていることを確認する。
5.3 法的・契約的分析
エージェントベースのRAGシステムは、迅速な文書分析と意思決定のためのツールを提供し、法務ワークフローの実行方法を再定義しています。
使用例:契約の見直し [40]
法務エージェントスタイルのRAGシステムは、契約を分析し、重要な条項を抽出し、潜在的なリスクを特定します。セマンティック検索機能と法的知識のマッピングを組み合わせることで、契約書レビューの煩雑なプロセスを自動化し、コンプライアンスを確保し、リスクを軽減します。
主なメリット
- リスク識別標準句から逸脱した句に自動的にフラグを立てる。
- 効率契約審査にかかる時間を短縮する。
- スケーラビリティ多数の契約を同時に処理する。
5.4 財務およびリスク分析
エージェント・ベースのRAGシステムは、投資判断、市場分析、リスク管理にリアルタイムの洞察を提供することで、金融業界を変革しています。これらのシステムは、リアルタイムのデータストリーム、過去のトレンド、予測モデリングを統合し、実用的なアウトプットを生成します。
ユースケース:自動車保険のクレーム処理 [41]
自動車保険では、代理店ベースのRAGがクレーム処理を自動化する。例えば、保険契約の詳細を検索し、事故データと組み合わせることで、規制要件へのコンプライアンスを確保しながらクレームアドバイスを生成する。
主なメリット
- リアルタイム分析リアルタイムの市場データに基づく洞察を提供。
- リスク軽減予測分析と多段階推論を用いて潜在的なリスクを特定する。
- 意思決定能力の強化過去のデータとリアルタイムのデータを組み合わせて、包括的な戦略を立てる。
5.5 教育
教育は、エージェントベースのRAGシステムが大きな進歩を遂げたもう一つの分野である。これらのシステムは、学習者の進歩や好みに適応した説明、学習教材、フィードバックを生成することで、適応学習を可能にする。
使用例:研究論文の作成 [42]
高等教育では、エージェントベースのRAGは、複数の情報源から得られた重要な知見を統合することによって、研究者を支援するために使用されている。例えば、"量子コンピューティングの最新の進歩は何か?"と問い合わせた研究者は、参考文献を含む簡潔な要約を受け取ることができる。と問い合わせた研究者は、参考文献を含む簡潔な要約を受け取ることができ、研究の質と効率が向上する。
主なメリット
- オーダーメイドの学習パス個々の生徒のニーズや成績レベルに合わせて内容を調整する。
- 魅力的な交流インタラクティブな説明と個人的なフィードバックを提供する。
- スケーラビリティ様々な教育環境への大規模展開に対応。
5.6 マルチモーダルワークフローにおけるグラフ拡張アプリケーション
Graph Enhanced Agent-based RAG(GEAR)は、グラフ構造と検索メカニズムを組み合わせたもので、相互接続されたデータソースが重要なマルチモーダルワークフローにおいて特に効果的である。
使用例:市場調査の作成
GEARは、テキスト、画像、動画を合成してマーケティング・キャンペーンに使用することができる。例えば、"環境に優しい製品の新たなトレンドは何か?" というクエリを実行すると、顧客の嗜好、競合他社の分析、マルチメディア・コンテンツを含む詳細なレポートが作成される。というクエリーは、顧客の嗜好、競合他社の分析、マルチメディア・コンテンツを含む詳細なレポートを生成します。
主なメリット
- マルチモーダル機能テキスト、画像、ビデオデータを統合して総合的に出力。
- 創造性の向上マーケティングとエンターテインメントのための革新的なアイデアとソリューションを生み出す。
- 動的適応変化する市場動向と顧客ニーズに適応する。
エージェントベースのRAGシステムは、幅広いアプリケーションで使用されており、その多用途性と変革の可能性を示しています。パーソナライズされたカスタマーサポートから、適応教育、グラフで強化されたマルチモーダルワークフローまで、これらのシステムは複雑でダイナミック、かつ知識集約的な課題に対応しています。検索、生成、エージェントのインテリジェンスを統合することで、エージェントベースのRAGシステムは次世代のAIアプリケーションへの道を開いています。
6 エージェントベースRAGのためのツールとフレームワーク
エージェントベースの検索機能強化型生成(RAG)システムは、検索、生成、エージェントの知能を組み合わせることで、大きな進化を遂げている。これらのシステムは、意思決定、クエリ再構築、適応ワークフローを統合することにより、従来のRAGの機能を拡張する。以下のツールとフレームワークは、実世界のアプリケーションの複雑な要件に対応するエージェントベースのRAGシステムの開発を強力にサポートする。
主要なツールとフレームワーク
- LangChainとLangGraphLangGraphは、ループ、状態の永続性、人間とコンピュータのインタラクションをサポートするグラフベースのプロセスを導入することで、これを補完し、エージェントシステムにおける洗練されたオーケストレーションと自己修正メカニズムを可能にする。
- ラマインデックスLlamaIndexの[44] Agent-based Document Workflow (ADW)は、文書処理、検索、構造化推論のエンドツーエンドの自動化を可能にする。メタエージェントアーキテクチャを導入し、サブエージェントがより小さな文書セットを管理し、コンプライアンス分析や文脈理解などのタスクはトップレベルのエージェントによって調整される。
- ハグする顔のトランスフォーマーとQdrantHuggingFace[45]は、埋め込みタスクと生成タスクのために事前に訓練されたモデルを提供し、Qdrant[46]は、アダプティブ・ベクトル検索機能によって検索ワークフローを強化し、エージェントがスパース・ベクトルとデンス・ベクトルを動的に切り替えてパフォーマンスを最適化することを可能にする。
- CrewAIとAutoGencrewAI[47]は、階層的・逐次的プロセス、強力なメモリシステム、ツール統合をサポートしている。ag2[48](以前はAutoGen[49,50]として知られていた)は、高度なコード生成、ツール実行、意思決定サポートを備えたマルチエージェントコラボレーションに優れている。
- OpenAIスウォームフレームワークエージェントの自律性と構造化されたコラボレーションに重点を置き、人間工学に基づいた軽量なマルチエージェント・オーケストレーション [51] を可能にするために設計された教育フレームワークです。
- バーテックスAIによるエージェントベースRAGグーグルによって開発されたVertex AI [52]は、エージェントベースのRAG(Retrieval Augmentation Generation)とシームレスに統合され、機械学習モデルの構築、展開、拡張のためのプラットフォームを提供する。
- エージェントベースRAGのためのAmazon BedrockAmazon Bedrock [38]は、エージェントベースのRAG(Retrieval Augmentation Generation)ワークフローを実装するための強力なプラットフォームを提供します。
- IBMワトソンとエージェントベースのRAGIBMのwatsonx.ai [53]は、エージェントベースのRAGシステムの構築をサポートしている。例えば、Granite-3-8B-Instructモデルを使用して、複雑なクエリに答え、外部情報を統合することで応答精度を向上させることができる。
- Neo4jとベクトルデータベースオープンソースのグラフデータベースとして有名なNeo4jは、複雑なリレーショナルクエリやセマンティッククエリの処理に優れている。Neo4jに加え、Weaviate、Pinecone、Milvus、Qdrantのようなベクトルデータベースは、効率的な類似検索と検索機能を提供し、高性能なエージェントベースの検索拡張生成(RAG)ワークフローのバックボーンを形成する。
7 ベンチマークとデータセット
現在のベンチマークとデータセットは、エージェントベースとグラフ拡張を含む検索拡張生成(RAG)システムを評価するための貴重な洞察を提供する。RAGのために特別に設計されたものもあれば、様々なシナリオにおける検索、推論、生成能力をテストするために適応されたものもある。データセットは、RAGシステムの検索、推論、生成コンポーネントをテストするために重要である。表3は、下流タスクに基づくRAG評価のための主要なデータセットについて述べている。
ベンチマークは、構造化されたタスクと指標を提供することにより、RAGシステムの評価を標準化する上で重要な役割を果たす。以下のベンチマークは特に関連性が高い:
- BEIR(情報検索のベンチマーキング)バイオインフォマティクス、金融、Q&Aの各分野にまたがる17のデータセットを対象とし、様々な情報検索タスクにおける組み込みモデルの性能を評価するために設計された汎用ベンチマークである[54]。
- MS MARCO (マイクロソフト機械読解)段落のランク付けとQ&Aに焦点を当てたこのベンチマークは、RAGシステムの集中的な検索タスクに広く使用されている[55]。
- TREC(テキスト検索会議、ディープラーニングトラック)段落検索と文書検索のためのデータセットを提供し、検索パイプラインにおけるランキングモデルの品質を強調する[56]。
- MuSiQue (マルチホップ逐次質問)複数の文書にまたがるマルチホップ推論のベンチマークであり、個別のコンテク ストから情報を検索し、合成することの重要性を強調している[57]。
- 2WikiマルチホップQAウィキペディアの2つの記事にまたがるマルチホップQAタスクのために設計されたデータセットで、複数のソースからの知識を結びつける能力に焦点を当てている[58]。
- AgentG(知識融合のためのエージェントベースRAG)複数の知識ベースにわたる動的な情報合成を評価するエージェントベースのRAGタスク用に特別に調整されたベンチマーク[8]。
- 鍋QAマルチホップQAベンチマークは、相互に関連するコンテクストの検索と推論を必要とし、複雑なRAGワークフローの評価に適している[59]。
- RAGBenchTRACeの評価フレームワークを用いた、産業分野にわたる100,000の事例を含む、大規模で解釈可能なベンチマーク。
- BERGEN (検索機能拡張生成のベンチマーク)標準化された実験でRAGシステムを系統的にベンチマークするためのライブラリ [61].
- FlashRAGツールキットは12のRAGメソッドを実装し、効率的で標準化されたRAG評価をサポートする32のベンチマークデータセットを含む[62]。
- GNN-RAGこのベンチマークは、知識グラフクイズ(KGQA)[63]における検索品質と推論性能に焦点を当て、ノードレベルとエッジレベルの予測タスクにおけるグラフベースRAGシステムの性能を評価する。
表3:RAGによって評価されたダウンストリームタスクとデータセット([23]から引用)
フォーム | ミッションの種類 | データセットと参考文献 |
---|---|---|
質疑応答(QA) | シングルジャンプQA | ナチュラルクエスチョン(NQ)[64]、トリビアQA[65]、SQuAD[66]、ウェブクエスチョン(WebQ)[67]、ポップクエスチョン(PopQA)[68]、MSマルコ[55 |
マルチホップQA | HotpotQA[59]、2WikiMultiHopQA[58]、MuSiQue[57]。 | |
長文の質疑応答 | ELI5[69]、NarrativeQA(NQA)[70]、ASQA[71]、QMSum[72] | |
ドメイン別QA | キャスパー[73]、COVID-QA[74]、CMB/MMCUメディカル[75] | |
多肢選択式QA | QUALITY [76]、ARC(参照なし)、CommonSenseQA [77] | |
フィギュアQA | GraphQA [78] | |
グラフベースのQ&A | イベント理論のメタ抽出 | WikiEvent[79]、RAMS[80]。 |
オープン・ドメインでの対話 | ウィザーズ・オブ・ウィキペディア(WoW)[81]。 | |
対話 | パーソナルな対話 | KBP[82]、DuleMon[83]。 |
タスク指向の対話 | カムレスト[84] | |
パーソナライズされたコンテンツ | アマゾンのデータセット(おもちゃ、スポーツ、美容) [85] | |
推薦理由 | HellaSwag [86]、CommonSenseQA [77]。 | |
常識的推論 | CoTの推論 | CoT推論[87]、CSQA[88] |
その他 | 複合推論 | MMLU(参考文献なし)、WikiText-103[64]。 |
言語理解 | ||
ファクトチェック/検証 | FEVER[89]、PubHealth[90] | |
抄録 | 戦略QAテキストの要約 | ストラテジーQA【91 |
要約 | WikiASP[92]、XSum[93]。 | |
テキスト生成 | 長い抄録 | NarrativeQA(NQA)[70]、QMSum[72] |
テキスト分類 | ストーリー | 伝記データセット(参照なし)、SST-2 [94] |
センチメント分析の一般的分類 | ||
コード検索 | プログラミング検索 | VioLens [95]、TREC [56]、CodeSearchNet [96]。 |
堅牢性 | 検索の堅牢性 | NoMIRACL [97] |
言語モデリングの頑健性 | ウィキテキスト-103 [98] | |
数学 | すうり | GSM8K [99] |
機械翻訳 | 翻訳タスク | JRC-アッキーズ[100] |
8 結論
エージェントベースのRAG(Retrieval Augmented Generation)は、自律型エージェントを統合することで、従来のRAGシステムの限界を克服する、人工知能における革新的な進歩である。エージェント知能を活用することで、これらのシステムは動的な意思決定、反復推論、協調的なワークフローの能力を導入し、より高い精度と適応性で複雑な実世界のタスクを解決することを可能にします。
このレビューでは、RAGシステムの進化を、初期実装からモジュラーRAGのような先進的なパラダイムまで調査し、それぞれのパラダイムの貢献と限界を強調する。RAGプロセスへのエージェントの統合は、静的なワークフローと限られた文脈適応性を克服するエージェントベースのRAGシステムの出現につながる重要な発展となっている。ヘルスケア、金融、教育、クリエイティブ産業にわたるアプリケーションは、これらのシステムの変革の可能性を示し、パーソナライズされたリアルタイムでコンテキストを認識したソリューションを提供する能力を実証している。
その将来性にもかかわらず、エージェントベースのRAGシステムは、さらなる研究と革新を必要とする課題に直面している。マルチエージェントアーキテクチャにおける協調の複雑さ、スケーラビリティ、レイテンシーの問題、また倫理的な配慮は、強固で責任ある展開を保証するために対処されなければならない。さらに、エージェントの能力を評価するために特別に設計されたベンチマークやデータセットの欠如は、大きな障壁となっている。マルチエージェントコラボレーションやダイナミックな適応性など、エージェントベースのRAGのユニークな側面を捉える評価手法の開発は、この分野を発展させる上で極めて重要である。
今後の展望として、検索機能を強化した世代とエージェント知能の融合は、ダイナミックで複雑な環境におけるAIの役割を再定義する可能性を秘めている。これらの課題に取り組み、将来の方向性を模索することで、研究者と実務家はエージェントベースRAGシステムの可能性を最大限に引き出し、業界や領域を横断する変革的なアプリケーションへの道を切り開くことができる。AIシステムが進化し続ける中、エージェントベースRAGは、急速に変化する世界のニーズに対応する、適応的で、文脈を認識し、インパクトのあるソリューションを創造するための礎石となる。
書誌
[1] Shervin Minaee、Tomas Mikolov、Narjes Nikzad、Meysam Chenaghlu、Richard Socher、Xavier Amatriain、。
高建峰.大規模言語モデル:サーベイ、2024年.
[2] Aditi Singh. 言語モデルの探求:包括的な調査と分析.知識管理、人工知能、電気通信における研究方法論に関する国際会議。
Engineering (RMKMATE), pages 1-4, 2023.
[3] Wayne Xin Zhao, Kun Zhou, Junyi Li, Tianyi Tang, Xiaolei Wang, Yupeng Hou, Yingqian Min, Beichen Zhang.
張俊傑、董子丹、杜一帆、陳楊、陳玉碩、陳志鵬、江金浩、任瑞陽。
Yifan Li, Xinyu Tang, Zikang Liu, Peiyu Liu, Jian-Yun Nie, and Ji-Rong Wen.大規模言語に関する調査
モデル、2024年
[4] Sumit Kumar Dam, Choong Seon Hong, Yu Qiao, and Chaoning Zhang.A complete survey on llm-based ai.
チャットボット、2024年
[5] Aditi Singh. A survey of ai text-to-image and ai text-to-video generators.
on Artificial Intelligence, Robotics and Control (AIRC), pages 32-36, 2023.
[6] Aditi Singh, Abul Ehtesham, Gaurav Kumar Gupta, Nikhil Kumar Chatta, Saket Kumar, and Tala Talaei Khoei.
プロンプト・エンジニアリングの探求:スウォット分析によるシステマティック・レビュー、2024年。
[7] レイ・ファン、ウェイジャン・ユー、ウェイタオ・マー、ウェイホン・ジョン、チャンイン・フォン、ハオティエン・ワン、チャンロン・チェン、ウェイファ
彭、馮小成、秦冰、劉廷。 大規模言語モデルにおける幻覚に関するサーベイ:原理、
ACM Transactions on Information Systems, November 2024.
[8] Meng-Chieh Lee, Qi Zhu, Costas Mavromatis, Zhen Han, Soji Adeshina, Vassilis N. Ioannidis, Huzefa Rangwala.
agent-g: An agentic framework for graph retrieval augmented generation, 2024.
[9] 趙鵬昊、張海林、余琴漢、王正仁、耿雲騰、傅芳成、楊玲、文涛
ai-generatedコンテンツのための検索-拡張生成:調査、2024年。
[10] Zhengbao Jiang, Frank F. Xu, Luyu Gao, Zhiqing Sun, Qian Liu, Jane Dwivedi-Yu, Yiming Yang, Jamie Callan.
アクティブ検索拡張世代、2023年。
[11] Yikun Han, Chunjiang Liu, and Pengfei Wang. A comprehensive survey on vector database: Storage and retrieval.
技術、挑戦、2023年。
[12] Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Zhang, Zhiyuan Chen, Jiakai Tang.
Xu Chen, Yankai Lin, Wayne Xin Zhao, Zhewei Wei, and Jirong Wen.大規模言語モデルに基づく調査
のフロンティア コンピューター Science, 18(6), March 2024.
[13] Aditi Singh, Saket Kumar, Abul Ehtesham, Tala Talaei Khoei, and Deepshikha Bhati. large language modeldriven immersive agent.IoT Congress (AIIoT), pages 0619-0624, 2024.
[14] Matthew Renze and Erhan Guven. llmエージェントにおける自己省察:問題解決能力への影響, 2024.
[15] Xu Huang, Weiwen Liu, Xiaolong Chen, Xingmei Wang, Hao Wang, Defu Lian, Yasheng Wang, Ruiming Tang.
llmエージェントのプランニングを理解する:調査、2024年。
[16] Taicheng Guo, Xiuying Chen, Yaqi Wang, Ruidi Chang, Shichao Pei, Nitesh V. Chawla, Olaf Wiest, and.
張翔良:大規模言語モデルベースのマルチエージェント:進歩と課題の調査、2024年。
[17] Chidaksh Ravuru, Sagar Srinivas Sakhinana, and Venkataramana Runkana.エージェント検索による拡張
時系列分析のための世代、2024年。
[18] Jie Huang and Kevin Chen-Chuan Chang. Towards reasoning in large language models: Survey, 2023.
[19] Boci Peng, Yun Zhu, Yongchao Liu, Xiaohe Bo, Haizhou Shi, Chuntao Hong, Yan Zhang, and Siliang Tang.
グラフ検索-拡張世代:調査、2024年。
[20] Aditi Singh, Abul Ehtesham, Saifuddin Mahmud, and Jong-Hoon Kim. Revolutionising mental health care.
ラングチェーンを通して:大規模言語モデルとの旅。
Communication Workshop and Conference (CCWC), pages 0073-0078, 2024.
[21] Gaurav Kumar Gupta、Aditi Singh、Sijo Valayakkad Manikandan、Abul Ehtesham.
一般的な病気の症状を認識するための大規模言語モデルの可能性、2024年。
[22] Aditi Singh、Abul Ehtesham、Saket Kumar、Gaurav Kumar Gupta、Tala Talaei Khoei.
教育における生成的aiの使用:報酬ベースの学習アプローチ。 ティム・シュリッペ、エリック・C・K・チェン、および
Tianchong Wang編『Artificial Intelligence in Education Technologies: New Development and Innovative(教育技術における人工知能:新たな発展と革新)』。
Practices, pages 404-413, Singapore, 2025. Springer Nature Singapore.
[23]ユンファン・ガオ、ユン・シオン、シンユー・ガオ、カン・シャン・ジア、ジンリウ・パン、ユクシー・ビー、イー・ダイ、ジアウェイ・スン、メン・ワン、および
王昊芬:大規模言語モデルのための検索補強生成:サーベイ、2024年。
[24] ウラジーミル・カルプヒン、バラス・オグズ、セウォン・ミン、パトリック・ルイス、レデル・ウー、セルゲイ・エドゥノフ、ダンチー・チェン、ウェン˘・。
タウ・イー. オープンドメイン質問応答のための密なパッセージ検索, 2020.
[25] Zeyu Zhang, Xiaohe Bo, Chen Ma, Rui Li, Xu Chen, Quanyu Dai, Jieming Zhu, Zhenhua Dong, and Ji-Rong
大規模言語モデルベースのエージェントの記憶メカニズムに関する調査, 2024.
[26] Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang, Nan Duan, and Weizhu Chen. 評論家:大
言語モデルは、ツールによるインタラクティブな批評によって自己修正することができる, 2024.
[27] Aditi Singh, Abul Ehtesham, Saket Kumar, and Tala Talaei Khoei. エージェント型ワークフローによるAIシステムの強化
2024 IEEE World AI IoT Congress (AIIoT), pages 527-532, 2024.
[28] DeepLearning.AI.エージェントはいかにしてllmのパフォーマンスを向上させるか https://www.deeplearning.ai/the-batch/
How-agents-can-improve-llm-performance/?ref=dl-staging-website.ghost.io, 2024.アクセス:2025-01-13.
[29] アマン・マダーン、ニケット・タンドン、プラカー・グプタ、スカイラー・ハリナン、ルユ・ガオ、サラ・ウィグレフ、ウリ・アロン、ヌハ
ディジリ、シュリマイ・プラブモエ、ヤン・イーミン、シャシャンク・グプタ、ボドトワ・プラサド・マジュムダー、キャサリン・ハーマン。
Selfrefine: 自己フィードバックによる反復的洗練、2023年。
[30] Noah Shinn, Federico Cassano, Edward Berman, Ashwin Gopinath, Karthik Narasimhan, and Shunyu Yao.
リフレクション:言語強化学習による言語エージェント, 2023.
[31]ウィービエイト・ブログ エージェントラグとは https://weaviate.io/blog/what-is-agentic-rag#:~:text=is%
20AgenticRAG-,,ofthenonagenticpipeline. accessed: 2025-01-14.
[32] Shi-Qi Yan, Jia-Chen Gu, Yun Zhu, and Zhen-Hua Ling. Corrective retrieval augmented generation, 2024.
[33] ラングラフ CRAGチュートリアル。langgraph crag: Contextualised retrieval-augmented generation tutorial.
//langchain-ai.github.io/langgraph/tutorialss/rag/langgraph_crag/. アクセス:2025-01-14.
[34] Soyeong Jeong, Jinheon Baek, Sukmin Cho, Sung Ju Hwang, and Jong C Park. Adaptive-rag: Learning to adapt.
質問の複雑性を通じて検索を強化した大規模言語モデル, 2024.
[35] LangGraph Adaptive RAG チュートリアル. langgraph adaptive rag: 適応検索-拡張生成チュートリアル. https://langchain-ai.github.io/langgraph/tutorialss/rag/langgraph_adaptive_rag/.
アクセス:2025-01-14
[36] 沈志利、貂晨欣、パブロス・ヴギウクリス、パスカル・メリタ、シュリラム・ピラマナヤガム、ダミアン・グラウ、ダンダン
Tu、Zeren Jiang、Ruofei Lai、Yang Ren、Jeff Z. Pan. Gear: Graph-enhanced agent for retrieval-augmented.
世代、2024年
[37] LlamaIndex. エージェントによる文書ワークフローの導入 https://www.llamaindex.ai/blog/
agentic-document-workflowsの紹介、2025年。
[38]AWSマシンラーニング・ブログ.Twitchがamazonでragを使ったエージェントワークフローを使った方法
https://aws.amazon.com/blogs/machine-learning/。
how-twitch-used-agentic-workflow-with-rags-on-amazon-bedrock-to-supercharge-ad-sales/、
アクセス:2025-01-13.
[39] LlamaCloud Demo Repository. llamacloudを使用した患者症例要約ワークフロー。
//github.com/run-llama/llamacloud-demo/blob/main/examples/document_workflows/
patient_case_summary/patient_case_summary.ipynb, 2025.
[40] LlamaCloud Demo Repository. llamacloudを使った契約書レビューのワークフロー https://github.com/
run-llama/llamacloud-demo/blob/main/examples/document_workflow/contract_review/を実行します。
contract_review.ipynb, 2025. accessed: 2025-01-13.
[41] LlamaCloud Demo Repository. llamacloudを使用した自動車保険請求ワークフロー。
//github.com/run-llama/llamacloud-demo/blob/main/examples/document_workflows/auto_
insurance_claims/auto_insurance_claims.ipynb, 2025. accessed: 2025-01-13.
[42] LlamaCloud Demo Repository. llamacloudを使用した研究論文レポート作成ワークフロー.
https://github.com/run-llama/llamacloud-demo/blob/main/examples/report_generation/
research_paper_report_generation.ipynb, 2025. accessed: 2025-01-13.
[43] LangGraph Agentic RAG Tutorial. langgraph agentic rag: Nodes and edges tutorial. https://langchain-ai.
github.io/langgraph/tutorialss/rag/langgraph_agentic_rag/#nodes-and-edges.にアクセスしました。
2025-01-14.
[44] LlamaIndexブログ。llamaindexとエージェントラグ。https://www.llamaindex.ai/blog/
agentic-rag-with-llamaindex-2721b8a49ff6. Accessed: 2025-01-14.
[https://: Hugging Face.co.jp/learn/cookbook/ja/agent_rag. エージェント・ラグ:クエリ再定式化とセルフクエリで検索拡張世代をターボチャージする。Huggingface.co/learn/cookbook/ja/agent_rag. Accessed: 2025-01-14.
[46] Qdrant Blog. agentic rag: ragとエージェントを組み合わせて情報検索を強化する。https://qdrant.
tech/articles/agentic-rag/. アクセス:2025-01-14.
[47] クルーAI crewai:AIプロジェクトのためのgithubリポジトリ。https://github.com/crewAIInc/crewAI、2025年。
アクセス:2025-01-15
[48] AG2AI Contributors. Ag2: A github repository for advanced generative ai research. https://github.com/
ag2ai/ag2, 2025. accessed: 2025-01-15.
[49] Qingyun Wu, Gagan Bansal, Jieyu Zhang, Yiran Wu, Beibin Li, Erkang Zhu, Li Jiang, Xiaoyun Zhang, Shaokun
Zhang, Jiale Liu, Ahmed Hassan Awadallah, Ryen W White, Doug Burger, and Chi Wang. オートジェン有効化
マルチエージェント会話フレームワークによる次世代LLMアプリケーション。
[50] Shaokun Zhang, Jieyu Zhang, Jiale Liu, Linxin Song, Chi Wang, Ranjay Krishna, and Qingyun Wu. トレーニング。
ICML'24、2024。
[51】OpenAI。 スウォームhttps://github.com/openai/swarm。
アクセス:2025-01-14
[52] LlamaIndex ドキュメント。頂点aiを使用したエージェントラグ。https://docs.llamaindex.ai/en/stable/
examples/agent/agentic_rag_using_vertex_ai/. アクセス:2025-01-14.
[53] IBM Granite Community. Agentic rag: Ai agents with theibm granite models. https://github.com/
ibm-granite-community/granite-snack-cookbook/blob/main/recipes/AI-Agent/Agentic_。
RAG.ipynb. Accessed: 2025-01-14.
[54] Nandan Thakur, Nils Reimers, Andreas Rücklé, Abhishek Srivastava, and Iryna Gurevych. Beir: A heterogenous.
情報検索モデルのゼロショット評価のためのベンチマーク, 2021.
[55] Payal Bajaj, Daniel Campos, Nick Craswell, Li Deng, Jianfeng Gao, Xiaodong Liu, Rangan Majumder, Andrew
マクナマラ、バスカール・ミトラ、トリ・グエン、ミール・ローゼンバーグ、シャ・ソン、アリーナ・ストイカ、サウラブ・ティワリー、トン
ms marco: a human generated machine reading comprehension dataset, 2018.
[56] Nick Craswell, Bhaskar Mitra, Emine Yilmaz, Daniel Campos, Jimmy Lin, Ellen M. Voorhees, and Ian Soboroff.
TREC2022ディープラーニングトラックの概要。 NIST, TREC, March 2023.
[57] Harsh Trivedi、Niranjan Balasubramanian、Tushar Khot、Ashish Sabharwal.
2022年、シングルホップによる問題構成。
[58] Xanh Ho, Anh-Khoa Duong Nguyen, Saku Sugawara, and Akiko Aizawa. マルチホップqaデータセットの構築
推論ステップの包括的な評価のために、2020年
[59] Zhilin Yang, Peng Qi, Saizheng Zhang, Yoshua Bengio, William W. Cohen, Ruslan Salakhutdinov, and Christopher D. Manning.diverse, explainable multi-hop question answering, 2018.
[60] Robert Friel, Masha Belyi, and Atindriyo Sanyal. Ragbench: Explainable benchmark for retrieval-augmented.
発電システム、2024年
[61] David Rau, Hervé Déjean, Nadezhda Chirkova, Thibault Formal, Shuai Wang, Vassilina Nikoulina, and Stéphane
クリンチャント・ベルゲン: 検索拡張世代のためのベンチマーク・ライブラリ, 2024.
[Flashrag: A modular toolkit for efficient.
2024年、検索拡張世代研究。
[63] Costas Mavromatis and George Karypis. Gnn-rag: Graph neural retrieval for large language model reasoning.
2024.
[64] トム・クヴィアトコウスキー, ジェニマリア・パロマキ, オリビア・レッドフィールド, マイケル・コリンズ, アンカー・パリク, クリス・アルベルティ, ダニエル
エプスタイン, イリア・ポロスーヒン, ジェイコブ・デブリン, ケントン・リー, クリスティーナ・トゥタノワ, リオン・ジョーンズ, マシュー・ケルシー, ミンウェイ
Chang、Andrew M. Dai、Jakob Uszkoreit、Quoc Le、Slav Petrov. 自然な質問:質問のベンチマーク
計算言語学会論文誌, 7:452-466, 2019.
[65] Mandar Joshi, Eunsol Choi, Daniel S. Weld, and Luke Zettlemoyer. triviaqa: large scale distantly supervised.
読解力のためのチャレンジデータセット、2017年。
[66] Pranav Rajpurkar, Jian Zhang, Konstantin Lopyrev, and Percy Liang. Squad: 100,000+ questions for machine.
2016年、文章理解
[67] Jonathan Berant, Andrew K. Chou, Roy Frostig, and Percy Liang. 質問と回答のペアからのフリーベースの意味解析。Methods in Natural Language Processing, 2013.
[68] Alex Mallen, Akari Asai, Victor Zhong, Rajarshi Das, Daniel Khashabi, and Hannaneh Hajishirzi.
信頼言語モデル:パラメトリック記憶とノンパラメトリック記憶の有効性の調査、
ジョーダン・ボイド=グラバー、岡崎尚明編『第61回米国協会年次総会講演要旨集
Computational Linguistics (Volume 1: Long Papers), pages 9802-9822, Toronto, Canada, July 2023.
計算言語学のために。
[69]アンジェラ・ファン、ヤシーヌ・ジャーニテ、イーサン・ペレス、デヴィッド・グランジェ、ジェイソン・ウェストン、マイケル・アウリ Eli5:ロングフォーム
質問に答える、2019年。
[70] Tomáš Kociský, Jonathan Schwarz, Phil Blunsom, Chris Dyer, Karl Moritz Hermann, Gábor Melis, and Edwardˇ.
Grefenstette.ナラティカ読解力チャレンジ。
[71] Ivan Stelmakh, Yi Luan, Bhuwan Dhingra, and Ming-Wei Chang. Asqa: Factoid questions meet long form.
2023年
[72] ミン・ジョン、ダ・イン、タオ・ユー、アフマド・ザイディ、ムテシア・ムトゥマ、ラーフル・ジャ、アーメド・ハッサン・アワダッラー、アスリ
Celikyilmaz, Yang Liu, Xipeng Qiu, and Dragomir Radev. QMSum: A new benchmark for query-based.
5905-5921ページ、2021年6月。
[73] Pradeep Dasigi, Kyle Lo, Iz Beltagy, Arman Cohan, Noah A. Smith, and Matt Gardner.研究論文に固定された情報探索の質問と回答のデータセット。
ゼットレモイヤー、ディレク・ハッカニ=トゥール、イズ・ベルタギー、スティーブン・ベサード、ライアン・コッテレル、タンモイ・チャクラボルティ、イーチャオ
周編著『2021年米国協会北米支部会議議事録』(日本経済新聞出版社)。
Computational Linguistics: Human Language Technologies, pages 4599-4610, Online, June 2021.
計算言語学のために。
[74] Timo Möller, Anthony Reina, Raghavan Jayakumar, and Malte Pietsch. COVID-QA: A question answering.
ACL 2020 Workshop on Natural Language Processing for COVID-19 (NLP-COVID),.
2020.
[75] Xidong Wang, Guiming Hardy Chen, Dingjie Song, Zhiyi Zhang, Zhihong Chen, Qingying Xiao, Feng Jiang.
Cmb:中国語の包括的な医療ベンチマーク。
2024.
[76]リチャード・ユアンジェ・パン、アリシア・パリッシュ、ニティシュ・ジョシ、ニキータ・ナンギア、ジェイソン・ファン、アンジェリカ・チェン、ヴィシャック
Padmakumar、Johnny Ma、Jana Thompson、He He、Samuel R. Bowman.
長い入力テキスト、はい!、2022年。
[77] Alon Talmor、Jonathan Herzig、Nicholas Lourie、Jonathan Berant.
ジル・バースタイン、クリスティ・ドーラン、タマール・ソロリオ編。
計算機学会北米支部2019年会議録
Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), pages 4149-4158, Minneapolis, United States.
ミネソタ、2019年6月。計算言語学会。
[78] Xiaoxin He, Yijun Tian, Yifei Sun, Nitesh V. Chawla, Thomas Laurent, Yann LeCun, Xavier Bresson, and Bryan
g-retriever:テキストグラフの理解と質問応答のための検索拡張生成。
2024.
[79] Sha Li, Heng Ji, and Jiawei Han. Document-level event argument extraction by conditional generation, 2021.
[80] Seth Ebner、Patrick Xia、Ryan Culkin、Kyle Rawlins、Benjamin Van Durme. 複数の文の議論
リンク、2020年
[81] エミリー・ディナン、スティーブン・ローラー、カート・シャスター、アンジェラ・ファン、マイケル・アウリ、ジェイソン・ウェストン。
知識ベースの会話エージェント、2019年。
[82] Hongru Wang, Minda Hu, Yang Deng, Rui Wang, Fei Mi, Weichao Wang, Yasheng Wang, Wai-Chung Kwan.
アーウィン・キング、カム・ファイ・ウォン:パーソナライズされた知識ベースのソースプランナーとしての大規模言語モデル
対話、2023年
[83] Xinchao Xu, Zhibin Gou, Wenquan Wu, Zheng-yu Niu, Hua Wu, Haifeng Wang, and Shihang Wang.
長期ペルソナ記憶によるオープンドメインの会話、2022年。
[84] ツン・シェン・ウェン、ミリカ・ガシッチ、ニコラ・ムルクシッチ、リナ・M・ロハス=バラホナ、ペイ=ハオ・スー、ステファン・ウルテス、ダヴィッド´.
(訳注:この論文では、"neural dialogue systems. "と題されている。
Proceedings of 2016 Conference on Empirical Methods in Natural Language Processing, pages 2153-2162, , 2016 Conference of Empirical Methods in Natural Language Processing.
2016年11月、テキサス州オースティン。計算言語学会。
[85] Ruining He and Julian McAuley. Ups and downs: Modelling visual evolution of fashion trends with one-class.
協調フィルタリング: 第25回ワールド・ワイド・ウェブ国際会議WWW '16予稿集, ページ
507-517, ジュネーブ共和国・カントン, CHE, 2016. 国際ワールド・ワイド・ウェブ会議ステアリング
委員会
[86] Rowan Zellers, Ari Holtzman, Yonatan Bisk, Ali Farhadi, and Yejin Choi. HellaSwag: Can a machine really.
Anna Korhonen, David Traum, and Lluís Màrquez, editors, Proceedings of the 57th session of the Commission on Human Rights.
Annual Meeting of Association for Computational Linguistics, pages 4791-4800, Florence, Italy, July 2019.
計算言語学会。
[87] キム・スンゴン、チュ・セジュン、キム・ドヨン、チャン・ジョエル、イェ・ソンヒョン、シン・ジャミン、ソ・ミンジュン。
コット・コレクション:思考連鎖の微調整による言語モデルのゼロショット学習と少数ショット学習の改善、
2023.
[88] Amrita Saha, Vardaan Pahuja, Mitesh M. Khapra, Karthik Sankaranarayan, and Sarath Chandar, Complex.
逐次的な質問応答:リンクされた質問と答えのペアを知識で会話する学習に向けて
2018年のグラフ。
[89] James Thorne, Andreas Vlachos, Christos Christodoulopoulos, and Arpit Mittal.
Marilyn Walker, Heng Ji, and Amanda Stent, editors, Proceedings of 2018.
計算言語学会北米支部会議:人間の言語
Technologies, Volume 1 (Long Papers), pages 809-819, New Orleans, Louisiana, June 2018.ルイジアナ州ニューオーリンズ.
計算言語学。
[90] Neema Kotonya and Francesca Toni. Explainable automated fact-checking for public health claims, 2020.
[91] Mor Geva, Daniel Khashabi, Elad Segal, Tushar Khot, Dan Roth, and Jonathan Berant.
暗黙の推論ストラテジーを用いた質問応答ベンチマーク, 2021.
[92] Hayashi Hiroaki, Prashant Budania, Peng Wang, Chris Ackerson, Raj Neervannan, and Graham Neubig. Wikiasp.
多領域のアスペクトに基づく要約のためのデータセット, 2020.
[93] Shashi Narayan, Shay B. Cohen, and Mirella Lapata. 詳細はいいから、概要だけ教えて! トピックを意識する
極端な要約のための畳み込みニューラルネットワーク, 2018.
[94] Richard Socher, Alex Perelygin, Jean Wu, Jason Chuang, Christopher D. Manning, Andrew Ng, and Christopher.
Potts.センチメントツリーバンク上の意味合成性のための再帰的ディープモデル、
ティモシー・ボールドウィン、アンナ・コルホネン、カレン・リブスク、スティーブン・ベサード編『2013年国際サッカー連盟大会プロシーディングス・オブ・ザ・イヤー(Proceedings of 2013
自然言語処理における経験的方法に関する会議、ページ1631-1642、シアトル、ワシントン州。
2013年10月、米国、計算言語学会。
[95] Sourav Saha, Jahedul Alam Junaed, Maryam Saleki, Arnab Sen Sharma, Mohammad Rashidujaman Rifat.
Mohamed Rahouti、Syed Ishtiaque Ahmed、Nabeel Mohammed、Mohammad Ruhul Amin. Vio-lens:新しいレンズ。
さまざまな形態の共同体暴力につながるソーシャルネットワークの投稿の注釈付きデータセットとその評価。
Firoj Alam, Sudipta Kar, Shammur Absar Chowdhury, Farig Sadeque, and Ruhul Amin, editors, Proceedings.
of the First Workshop on Bangla Language Processing (BLP-2023), pages 72-84, Singapore, December 2023.
計算言語学会。
[96] Hamel Husain、Ho-Hsiang Wu、Tiferet Gazit、Miltiadis Allamanis、Marc Brockschmidt。 Codesearchnet
課題:セマンティックコード検索の現状を評価する、2020年。
[97] Nandan Thakur, Luiz Bonifacio, Xinyu Zhang, Odunayo Ogundepo, Ehsan Kamalloo, David Alfonso-Hermelo.
李小光、劉群、陳博穎、レザゴリザデ、ジミー・リン。
ロバストな検索支援生成のための多言語関連性評価データセット, 2024.
[98] Stephen Merity, Caiming Xiong, James Bradbury, and Richard Socher. pointer sentinel mixture models, 2016.
[99] Karl Cobbe, Vineet Kosaraju, Mohammad Bavarian, Mark Chen, Heewoo Jun, Lukasz Kaiser, Matthias Plappert.
ジェリー・トゥーレック、ジェイコブ・ヒルトン、中野礼一郎、クリストファー・ヘッセ、ジョン・シュルマン。
2021年、数学の単語問題を解く。
[100] Ralf Steinberger, Bruno Pouliquen, Anna Widiger, Camelia Ignat, Tomaž Erjavec, Dan Tufi¸s, and Dániel Varga.
JRC-Acquis:20以上の言語による多言語整列並列コーパス。
Choukri, Aldo Gangemi, Bente Maegaard, Joseph Mariani, Jan Odijk, and Daniel Tapias, editors, Proceedings of.
The Fifth International Conference on Language Resources and Evaluation (LREC'06), Genoa, Italy, May 2006.
欧州言語資源協会(ELRA)。