大規模言語モデル(Large Language Model:LLM)は、Transformerアーキテクチャを中核とし、膨大なテキストデータに対して学習されたディープラーニングシステムである。このアーキテクチャの自己アテンションメカニズムは、言語の長距離依存関係を効果的に捉えることができる。このモデルの「ラージ...
はじめに 近年、大規模言語モデル(Large Language Models: LLM)は人工知能の分野で目覚ましい発展を遂げ、その強力な言語理解・生成能力により、様々な領域で幅広い応用が行われている。しかし、LLMは、外部ツールを呼び出す必要がある複雑なタスクを扱う際に、依然として多くの課題に直面している。
概要 情報検索システムは、大規模な文書コレクションへの効率的なアクセスに不可欠である。最近のアプローチでは、大規模言語モデル(Large Language Models:LLM)を用いてクエリの拡張を行い、検索性能を向上させているが、一般的に、高価な教師あり学習や蒸留技術に依存しており、多大な計算リソースと手動でラベル付けされたデータを必要とする。