GraphRAGプロジェクトは、構造化されていないテキストに含まれる暗黙的な関係を利用して、AIシステムがプライベートデータセットで回答できる質問の範囲を拡大することを目的としている。
従来のベクトルRAG(または「意味検索」)に対するグラフRAGの主な利点は、データセット全体に関する質問に答えることができることである。 グローバル検索例えば、"データの主要テーマは何か"、"Xへの最も重要な影響は何か"、"Xにとって最も重要な影響は何か "などである。あるいは "Xにとって最も重要な影響は何か?". 対照的に、ベクトル ラグ に詳しい。 ローカル検索これは、答えがクエリに似ており、特定のテキストエリアで見つけることができることを意味し、通常、"who"、"what"、"when"、"where "などの質問に使用されます。where "の質問。
最近の記事では、GraphRAGによって作成されたダイジェストベースの豊富なデータインデックスを活用し、ローカル検索性能とグローバル検索コストをそれぞれ向上させる2つの新しいクエリメカニズムが紹介されている。
本論文では、グラフを強化した新しいRAGアプローチ、LazyGraphRAGを紹介する。これは、ソースデータを事前に要約する必要性を排除し、ユーザーやユースケースによっては手の届かない先行インデックス作成コストを回避するものである。
LazyGraphRAGの主な利点は、コストと品質におけるスケーラビリティである。様々な競合アプローチ(標準ベクトルRAG、RAPTOR、GraphRAG局所探索、大域探索、DRIFT探索機構を含む)の中で、LazyGraphRAGはコストと品質の範囲で優れている:
- LazyGraphRAGのデータ索引付けコストはベクトルRAGと同じで、完全なGraphRAGのコストの0.1%である。
- LazyGraphRAGは、ベクトルRAGと同程度のクエリコストで、長いコンテキストのベクトルRAGやGraphRAG DRIFT検索(ベクトルRAGを凌駕する最近導入されたRAG手法)、GraphRAGの局所検索を含む、局所化されたクエリにおいて競合する全ての手法を凌駕する。
- 同じLazyGraphRAGコンフィギュレーションでも、グローバルクエリではGraphRAGグローバル検索と同等の回答品質を示すが、クエリコストでは700倍以上の削減.
- 4%をGraphRAG, LazyGraphRAGを用いてグローバルに検索した場合のクエリコスト。競合するすべての方法を大幅に上回るグラフRAGのグローバル検索にはC2レベル(ほとんどのアプリケーションで推奨されるコミュニティ階層の第3レベル)が含まれる。
LazyGraphRAGは間もなくオープンソースのGraphRAGライブラリーに加わり、標準的なベクトルRAGに匹敵するコストで、軽量データインデックスに対するローカルおよびグローバルクエリーのための統一されたクエリーインターフェースを提供する。
LazyGraphRAG:ベクトルRAGとグラフRAGの利点を融合させる
LazyGraphRAGは、Vector RAGとGraphRAGの長所を組み合わせ、それぞれの限界を克服することを目指している:
- ベクトルRAGは ベスト・ファースト・サーチこれは、クエリとの類似度を使用して、ソース・テキストの最も一致するブロックを選択します。しかし、グローバルクエリに対するデータセットの幅は考慮されていません。
- グラフラグのグローバル検索は 幅優先探索また、ソーステキストのエンティティのコミュニティ構造を使用し、データセットの全領域を考慮したクエリの回答を保証する。しかし、局所的なクエリに対する最適なコミュニティは考慮されていない。
LazyGraphRAGは最良優先探索と幅優先探索のダイナミクスを反復深化的に組み合わせる(表1)。このアプローチは、完全なGraphRAGの大域的探索メカニズムに比べて「不活性」であり、LLMの使用を遅らせ、答え生成の効率を大幅に改善する。総合的な性能は一つの主要なパラメータで測定できる。関連性テストの予算- このパラメータは、コストとクオリティのトレードオフを一貫した方法でコントロールする。
グラフラグ | レイジーグラフ | |
---|---|---|
インデックスの構築 | a) LLMを使用して、エンティティとその関係を抽出し、記述する。 b) LLMを使用して、各エンティティと関係に関するすべての観測結果を要約する。 | a) NLPの名詞句抽出を用いて概念とその共起を抽出する b) グラフ統計を用いて概念マップを最適化し、階層的コミュニティ構造を抽出する |
サマリー・インデックス | LLMを使用して、各コミュニティのエンティティと関係を要約する。 | なし - "inert "メソッドは、クエリ時まですべてのLLMの使用を延期する。 |
問い合わせの絞り込み | なし - 常にオリジナルのクエリを使用 | LLMを使用して、a) 関連するサブクエリを特定し、それらを拡張クエリに再結合する。 |
マッチングクエリ | なし - すべてのクエリは、すべてのコミュニティ要約 (幅が先) | それぞれについて q サブクエリー[3-5]: - テキストブロックの埋め込みとブロック-コミュニティーの関係を利用して、まずクエリーとの類似性でテキストブロックをソートし、次にその上位から順にソートする。k テキストブロックのランキング最優先事項) - LLMベースの文レベルの関連性評価ツールを使って、上位にランクされたコミュニティの関連性を評価する。k 未テストのテキストブロックの関連性を採点した (幅が先) - で z 連続したコミュニティは、関連するテキストのブロックをゼロ個生成し、関連するサブコミュニティ(反復的な深化関連するコミュニティが残っていない、または到達していない場合 関連性テストの予算/q 午前0時失効 |
答えのマッピング | LLMを使用して、コミュニティ要約のランダムバッチを並列処理することにより、生のクエリに答える | それぞれについて q サブクエリ[3-5]: - 関連するテキストブロックから概念的なサブグラフを構築 - 概念のコミュニティ割り当てを使用して、関連するブロックをグループ化 - 関連するコンテンツのみに焦点を当てる方法としてLLMを使用して、関連するブロックのグループからサブクエリに関連するステートメントを抽出 - 抽出されたステートメントをランク付けしてフィルタリング事前に定義されたコンテキストウィンドウサイズに合うように、抽出された文のランク付けとフィルタリングを行う。 |
回答数の削減 | LLMを使用して、マッピングされた回答を使用して元のクエリに答える | LLMを使用して、抽出されたマッピングステートメントを使用して拡張クエリに答える |
LazyGraphRAG:詳細な仕組み
一言で言えば、LazyGraphRAGの核となる考え方は、「オンデマンドで構築し、実行しながらチェックする」である。
- インデックスの構築と抽象化(オンデマンド)LazyGraphRAGは、事前に構築された完全なインデックスの代わりに、自然言語処理(NLP)技術を利用し、クエリを受信した際に動的に主要な概念とその関係を抽出する。この情報はグラフ構造に整理され、このグラフはクエリの進行に合わせて継続的に最適化・改良される。
- クエリの最適化とコンテンツ検索LazyGraphRAGは、テキストチャンク埋め込みなどのテクニックを使って、クエリをリアルタイムで最適化し、概念間の関連性を分析することで、最も関連性の高いデータをピンポイントで特定する。
- 回答の生成と統合システムは、関連するテキスト断片からより小さなサブグラフを構築し、これらを首尾一貫した、正確で、クエリに一致する回答に統合する。
LazyGraphRAGのパフォーマンス:数字が物語っている!
LazyGraphRAGを様々なレベルの相関テスト予算で、また様々な競合メソッドとテストした結果、以下のような結果が得られた:
- データセット:: 5,590のAP通信ニュース記事(許可を得て使用)
- 諮る100の合成クエリー(ローカル50、グローバル50)。
- 規範包括性、多様性、エンパワーメント(例.こちら(説明したように、LLMを使用して、各指標について肯定的な回答の各組を比較する)。
- 前提条件LazyGraphRAGには、3つの相関テスト予算設定と、GraphRAGと文献にある8つの競合条件が含まれている(表2)。
前提条件 | 説明 |
---|---|
Z100_Lite | LazyGraphRAG、相関テスト予算100、全ステップで低コストのLLMモデルを使用。 |
Z500 | LazyGraphRAG、関連性テスト予算500、低コストのLLMを使用した関連性テスト、より高度な(より高コストの)LLMを使用したクエリの絞り込みとマッピング/縮小回答生成 |
Z1500 | LazyGraphRAG、関連性テスト予算1,500、低コストのLLMを使用した関連性テスト、より高度な(高コストの)LLMを使用したクエリの絞り込みとマッピング/縮小回答生成 |
C1 | コミュニティ・レベルでのGraphRAGグローバル検索 1 |
C2 | コミュニティレベルでのGraphRAGグローバル検索 2 |
C3_ダイナミック | GraphRAGのコミュニティレベル3でのグローバル検索では、動的なコミュニティ選択(in)を使用する。過去の記事(コスト削減ソリューション) |
LS | GraphRAG ローカル検索 |
ドライブ | グラフグラフDRIFT検索 |
SS_8K | 意味検索、8k入力トークンのベクトルRAG検索 |
SS_64K | 意味検索、ベクトルRAGは64kの入力トークンを検索(ベクトルRAGに対する長いコンテクストウィンドウの効果をチェックするため) |
ラプター | LazyGraphRAGと類似した特徴を持つ、階層的クラスタリングに基づくRAG手法。 |
図1は8つの競合条件に対するLazyGraphRAGの勝率を示している。低コストのLLMモデル(SS_8Kと同じコスト)を用いた100回の相関テストという最も低い予算レベルでは、LazyGraphRAGはローカルクエリとグローバルクエリの両方で、グローバルクエリのGraphRAGグローバル検索条件を除く全ての条件を大きく上回る。より高度なLLMモデル(C2クエリコストで4%)を用いて相関テストの予算を500増やすと、LazyGraphRAGはローカル、グローバルクエリの両方で全ての条件を大きく上回る。相関テストの予算を1,500まで増やすとLazyGraphRAGの勝率は上昇し続け、コストと品質の点でスケーラビリティを示す。
図1.関連性テスト予算(100, 500, 1,500)における、(ローカル、グローバル)クエリと(包括性、多様性、エンパワーメント)メトリクスの組み合わせごとの、競合条件に対するLazyGraphRAGの勝率を示すクラスタ化された棒グラフ。
表3に比較例を示す。
質問:2024年の健康保険プランの一般加入期間中に、米国の個人が健康保険プランを選択する際に考慮すべき要素について説明してください。
ベクターRAG(64Kコンテクスト) | レイジーグラフ |
---|---|
# 2024年の保険加入開始時に考慮すべき事項
オープンエンロールメント期間中に医療保険プランを選択することは複雑なプロセスである可能性がありますが、考慮すべき重要な要因を理解することは、個人が情報に基づいた意思決定を行うのに役立ちます。以下に、留意すべき重要な点をいくつか挙げる。 ## カバレッジとネットワーク 保険会社は、病院や医師をカバーするネットワークを形成している。保険会社は病院や医師の保障ネットワークを形成しており、あなたが希望する医療提供者が検討中のプランのネットワークに含まれているかどうかを確認することは極めて重要である。HMOやEPOは、そのネットワーク外の緊急時以外の医療に対する請求をカバーしない。[データ:情報源(47419、47421、47420、47410、47408)]。 ## 費用:保険料、控除額、自己負担限度額 健康保険プランに関連する費用を理解することは不可欠である。 これには、毎月の保険料、控除額、自己負担額、および共同保険が含まれる。プランは通常、プラチナ、ゴールド、シルバー、ブロンズなどのレベルに分類され、ブロンズプランは一般に保険料は低いが、自己負担額は高い[データ:情報源(47411, 47411)]。プランは通常、プラチナ、ゴールド、シルバー、ブロンズなどのレベルに分類され、ブロンズプランは一般に保険料は低いが自己負担額は高い[Data: Sources (47411, 47412, 47416, 47414, 47418)]。 さらに、自己負担限度額を考慮することも重要である。自己負担限度額とは、保険がすべての費用をカバーし始めるまでに、カバーされるサービスに対して1年間に支払わなければならない最高額のことである[Data: Sources (47411)]。保険がすべての費用をカバーするようになる[データ:情報源(47416、47415)]。 ##税額控除と費用負担軽減 所得が低い人は、保険料負担を軽減するために所得に応じた税額控除を受ける資格があるかもしれない。 これらの控除を申請する際には、過剰に受け取った控除を返済する必要がないように、来年度の所得を正確に見積もることが重要である[Data: Sources (47413)]。これらのクレジットを申請する際には、余分なクレジットを返済する必要がないよう、来年度の所得を正確に見積もることが重要である[Data: Sources (47412, 47413)]。 さらに、連邦貧困レベルの 250% 未満の所得者は、シルバー・プランを選択した場合、費用負担軽減の資格を得る可能性がある。を選択することにより、控除額や自己負担限度額を引き下げることができる[Data: Sources (47417, 47418)]。 ## メディケイドとメディケアに関する特別な考慮事項 メディケイドからの移行者については、マーケットプレイスプランはメディケイドと比較して保険料や自己負担額が高くなる可能性があることを理解しておくことが重要である。さらに、メディケイドから脱退した人の多くは、登録期間の延長によりマーケットプレイスプランに登録できる可能性がある[Data: Sources (6262, 6285, 6286, 6287)]。さらに、メディケイドから脱退した人の多くは、加入期間の延長によりマーケットプレイスのプランに加入できる可能性がある[Data: Sources (6284,6285,6286,6287)]。 高齢者にとって、メディケアのオープン登録期間では、従来のメディケアとメディケア・アドバンテージ・プランの切り替えが可能である。高齢者にとって、メディケアのオープン登録期間では、従来のメディケアとメディケア・アドバンテージ・プランの切り替えが可能であり、処方薬保険や歯科、視力などの追加給付についても考慮される[Data: Sources (72060, 72061, 72062, 72063, 72064)]。 ##支援とリソース 医療保険の複雑さを理解することは困難であり、保険代理店や政府出資のナビゲーターに支援を求めることは有益である。このような専門家は、特定のプランを勧めることなく、個人の選択肢を理解し、十分な情報に基づいた意思決定を支援することができる[Data: Sources (47424, 47425, 47426)]。これらの専門家は、特定のプランを薦めることなく、個人の選択肢を理解し、十分な情報に基づいた意思決定を行う手助けをすることができる[Data: Sources (47424, 47425, 47426)]。 ##結論 適切な健康保険プランを選ぶには、保障ネットワーク、費用、税額控除や費用負担軽減の資格、利用可能な援助など、さまざまな要素を慎重に検討する必要がある。適切な健康保険プランを選ぶには、保障ネットワーク、費用、税額控除や費用負担軽減の資格、利用可能な援助など、さまざまな要素を慎重に検討する必要がある。こうした点を十分に評価することで、来年度の医療ニーズや経済状況に最も適したプランを選ぶことができる。 |
### 健康保険プランの種類
2024年の一般加入期間中に医療保険プランを選択する場合、米国の個人にはいくつかの選択肢がある。 1. **マーケットプレイス・プラン**:これらは、医療費負担適正化法(Affordable Care Act:ACA)の下で利用できるもので、プラチナ・レベル、ゴールド・レベル、シルバー・レベル、ブロンズ・レベルに分類される。ブロンズ・プランは一般に保険料が低いが自己負担額が大きく、プラチナ・プランは保険料が高いが自己負担額が小さい。データ:情報源(47411、47420、47421)]。 2.低価格の市場プラン**:これらのプランには高額な免責金額が設定されていることが多く、ほとんどの保険が適用されるまでに患者は数千ドルを支払う必要がある。また、年間自己負担限度額は、個人で$9,000、家族で$18,000を超えることもある[データ:情報源(47415、47416、47414)]。47414)]. 3. **排他的プロバイダー組織(EPOs)および健康維持組織(HMOs)**:EPOs および HMOs は、一般に患者を医師のネットワークに制限し、プライマリケア医 師がケアを指示することを要求する。EPO と HMO は、一般に患者を医師のネットワークに制限し、プライマリ・ケア医にケアを指 導することを要求する。 これらは安価な傾向があるが、ネットワーク外の柔軟性に欠ける [データ:情報源(47420, 47421, 43218)]。これらの保険は安い傾向にあるが、ネットワーク外の柔軟性に欠ける[データ:情報源 (47420, 47421, 43218, 43217)]。 4.**Preferred Provider Organizations (PPO)**:これらのプランはネットワーク外のサービスを認めるが、 費用は高い。これらは HMO や EPO よりも柔軟性がある [データ:情報源(43217)]。 5. **高免責医療保険(HDHP)**:個人保険では免責金額$1,600以上、家族保険では免責金額$3,200以上、自己負担限度額はそれぞれ$8,050または$16,100以下の保険と定義される。HDHPは通常、保険料が安く、企業が健康貯蓄口座(Health Saving Account、以下HDHP)を提供することもある。は免責金額をカバーするためにHSA(健康貯蓄口座)に拠出することもある[データ:出典(43227、43226)]。 6.メディケア・アドバンテージ**:連邦政府のメディケアプログラムの民間運営版で、主に65歳以上を対象としている。メディケア・アドバンテージ**:メディケアの民間運営版で、主に65歳以上を対象としている。メディケア[データ:情報源(72063、72061、72060、72062)]。 7.**短期健康保険プラン**:これらのプランは3ヵ月に制限され、新しい規則では最大4ヵ月までしか更新できない。一時的な保障を目的とするが、包括的な給付がないことが多い[データ:出典(97999、97995、97996、97997)]。 ### 費用要因:保険料、控除額、自己負担額、自己負担限度額 2024年の医療保険プランの全体的なコストは、いくつかの要因に影響される。 - 保険料**:加入している健康保険プランのために毎月支払う一定の費用である。 保険料は上昇を続けており、インフレもあって2023年には家族プラン、シングルプランともに7%の顕著な上昇が見られる。2023年の保険料は、インフレの影響もあり、ファミリープラン、シングルプランともに7%の上昇となった[データ:情報源(83383, 83382, 83384, 83385, 83381, + more)]。 - 免責金額**:保険金が支払われる前に、医療サービスを受けるために自己負担する金額。 HDHPの場合、免責金額は個人保険で最低$1,600、家族保険で最低$3,200である[データ:出典(43226)]。免責金額は、個人保険の場合は最低$1,600、家族保険の場合は最低$3,200である[Data: Sources (43226, 43225)]。 - 自己負担金と共済金**:医療サービスを受けるたびに支払う費用です。 自己負担金は定額ですが、共済金はサービス費用の一定割合です。自己負担額は定額であるのに対し、共同保険はサービス費用の一定割合である。 - 自己負担限度額**:1年間に保険対象となるサービスに対して支払う金額の上限です。 例えば、HDHPの自己負担限度額は、個人保険の場合$8,050以下、家族保険の場合$16,100以下となっています[データ:出典(43227)43226]。例えば、HDHP の自己負担限度額は、個人保険の場合 $8,050 以下、家族保険の場合 $16,100 以下である [Data: Sources (43227, 43226)]。 ##プロバイダー・ネットワーク:ネットワーク内 vs ネットワーク外 医療機関のネットワークは、医療保険プランを選択する上で極めて重要な要素である。 - イン・ネットワーク・プロバイダー**:保険プランと協定を結び、低料金のサービスを提供している医師や病院のこと。希望する医師や専門医がネットワーク内にいるかどうかを確認することで、費用を大幅に節約することができる[データ:情報源(43216, 47419)]。 - ネットワーク外プロバイダー**:これらのプロバイダーからのサービスは通常より高額であり、緊急時を除き、まったくカバーされない場合もある。PPO プランはある程度のネットワーク外補償を提供するが、より高額であり、HMO と EPO は一般に緊急時以外のネットワーク外診療をカバーしない[データ:情報源(432121, 47421)]。PPO プランは若干のネットワーク外補償を提供するが費用は高く、HMO と EPO は一般に緊急時以外のネットワーク外診療をカバーしない[Data: Sources (43217, 47421)]。 ### 特定の医療ニーズとサービス 医療保険プランを選択する際には、個人の医療ニーズを考慮する必要がある。 - 処方箋医薬品**: 薬剤の適用範囲は変更される可能性があるため、あなたの薬がプランのフォーミュラリーでカバーされていることを確認する。薬剤の適用範囲は毎年変更される可能性があるため、薬剤がプランのフォーミュラリーでカバーされていることを確認する [データ:情報源(43220, 43218, 43219)]。 - メンタルヘルスサービス**:メンタルヘルス治療への保険適用は不可欠であり、特に新規則により保険会社はこれらのサービスの保険適用を拡大する傾向にある [Data: Sources (97031, 97028, 97027, 97030, 97033, +more)] 。特に、新しい規則が保険者にこれらのサービスの適用を増やすよう促しているため、メンタルヘルス治療の適用は不可欠である [Data: Sources (97031, 97028, 97027, 97030, 97033, +more)]。 - メディケア・サプリメント保険(Medigap)は、慢性疾患管理におけるメディケアのギャッ プをカバーするのに役立つ[Data: Sources (93367) 93368]。(メディキャップ保険(Medigap)は、慢性疾患管理におけるメディケアのギャップをカバーするのに役立つ[Data: Sources (93367, 93368)]。 - 予防医療**:がん検診やHIV予防のような予防医療サービスの保険適用はACAの下で義務付けられているが、現在進行中の法廷闘争のため、その将来は不透明である。しかし、現在も法廷闘争が続いているため、その将来は不透明である[データ:出典(71106、71109、71098、71099、71100、+その他)]。 ### オープンエンロールの主な日付とステップ 2024年の健康保険プランの一般加入期間には、いくつかの重要な日付とステップがある。 - マーケットプレイスプラン**:一般募集は2023年11月1日に開始され、ほとんどの州で12月中旬まで行われ、2024年1月16日に終了する[データ:情報源(47419, 47411, 47416, 47421, 47409, +more)]。2024年[データ:情報源(47419、47411、47416、47421、47409、+more)]。 - メディケア**:2023 年 10 月 15 日から 2023 年 12 月 7 日まで、メディケアの一般登録が行われる。 この期間中、個人は従来のメディケア、メディケア・アドバンテージ・プラン、処方薬プランのいずれかを選択することができる[Data: Sources (72061, 72063, 72060, 72062)]。この期間中、個人は従来のメディケア、メディケア・アドバンテージ・プラン、処方薬プランのいずれかを選択することができる[Data: Sources (72061, 72063, 72060, 72062)]。 - 特別加入期間**:失業や引っ越しなどのライフイベントにより保険加入を失った個人は、特別加入期間の資格を得ることができる。例えば、メディケイドから外れた者は、2024年7月までマーケットプレイスのプランに加入することができる[データ:情報源(6288、6289)]。 これらの要素を考慮することで、2024年の医療保険加入について十分な情報を得た上で決定することができ、医療ニーズや経済状況に最適なプランを選択することができる。医療ニーズと経済状況に最も適したプランを選択することができる。 |
LazyGraphRAGは、単一の柔軟なクエリメカニズムが、LLMデータ要約のような初期コストをかけることなく、ローカル-グローバルクエリ範囲において、様々な専用クエリメカニズムを大幅に上回る可能性があることを示している。LazyGraphRAGの高速で事実上自由なインデックス作成は、単発のクエリ、探索的分析、ストリーミングデータのユースケースに理想的であり、相関テストの予算が増加するにつれて解答の質をスムーズに向上させる能力は、RAG手法のベンチマーク(例えば、"RAG手法XはタスクZにおいて予算Yに勝る")に貴重なツールとなる。LazyGraphRAG")。
これは、すべてのグラフ強化RAGは不活性であるべきだという意味なのだろうか?そうではない:
- エンティティ、リレーションシップ、コミュニティのサマリーに対するGraphRAGデータインデックスは、Q&A以外の用途(例えば、レポートの閲覧や共有など)にも使用できる。
- LazyGraphRAGのような検索機構と組み合わせた、エンティティ、リレーションシップ、コミュニティのサマリーのGraphRAGデータインデックス化は、LazyGraphRAG単独よりも良い結果をもたらすかもしれない。
- LazyGraphRAGに似た検索メカニズム(例えば、先取り宣言やトピック抽出など)をサポートするように設計された新しいタイプのGraphRAGデータ索引付けは、最良の結果をもたらすかもしれない。
LazyGraphRAG自体も含めて)すべての進展は、今後しばらくの間、このような方向性を模索していくことになる。 GraphRAG GitHubリポジトリ 投稿