AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー

RAGにおけるDeepSeek R1:実務経験のまとめ

RAGにおけるDeepSeek R1:実践経験のまとめ-1

ディープシーク R1はその最初のリリースで強力な推論能力を示した。このブログポストでは、R1の推論機能の詳細を紹介する。 ディープシークR1 法律文書を専門とするRAG(Retrieval-Augmented Generation)システムの構築経験。


私たちがLegal Documentsを選んだ理由は、法律専門家がしばしば、膨大な数の判例、法令、法律評論の中から検索するという困難な作業に直面するからです。どんなに注意深くリサーチを行っても、内容を正確に要約することはおろか、適切な文書を見つけることさえ難しいのです。そこで ラグ あなたが大きな変化をもたらすことができる分野(ハーヴェイのAIも参照)。

DeepSeek R1とQwen2を埋め込みモデルとして使用し、大規模な法的文書データセットに基づいてRAGを構築した。RAG構築プロセス全体をオープンソース化した。 ブイエルエルエム 歌で応える スカイパイロット 何がうまくいき、何がうまくいかないのか。

自分で体験してみたい🔥? オンラインデモをお試しください:ここをクリック.

このRAGビルド・プロセスをオープンソース化しました。 こちらをクリック.私たちがどのように組み合わせているのか、自由に探ってみてください。 vLLM + スカイパイロット 高速で安定したスケーラブルなパフォーマンスを実現します。

RAGにおけるDeepSeek R1:実践経験のまとめ-2

なぜ法的文書にRAGを付けるのか?

Retrieval Augmentation Generation (RAG)は、正確性とトレーサビリティが最重要視される法律などの分野で極めて重要です。特殊なレトリーバーと強力な大規模言語モデル(LLM)ジェネレーターを組み合わせることで、最適な結果を得ることができます:

  1. 関連性の高い文書の取り出す
  2. 推理力のある文章生成
  3. 直接参照幻覚の減少

このRAGを構築するために、我々は以下のものを使用した:

  • 掟の山 データセットのサブセット(法律相談に焦点を当てたもの);
  • クロマDB エンベッディングの保存とクエリのためのベクトルリポジトリとして機能する;
  • クウェン2 検索埋め込みモデルとして
  • ディープシークR1 最終的な答えとしてモデルを作成する。

システム全体は ブイエルエルエム を通過させることができる。 スカイパイロット あらゆるクラウドにシームレスにデプロイし、最適なGPUの可用性と費用対効果を確保します。オープンソースのRAGビルドプロセスの全容はこちらからご覧いただけます。

貴重な経験:注意と禁忌

1.DeepSeek R1を検索に使用しないでください。

(躊躇なく ディープシークR1 は優れた推理力を持つが不適切エンベッドを生成するために - 少なくとも今のところは。

我々は、特殊なエンベッディング・モデルを使うことで アリババNLP/gte-Qwen2-7B-インストラクト(現在MTEBに在籍) ヒットチャート (最高ランクの埋め込みモデル)とDeepSeek R1で生成された埋め込みを比較。

これら2つのモデルそれぞれを用いて、データセットに対する埋め込みを生成し、2つのベクトルデータベースを構築する。そして、同じクエリを両方のモデルに使用し、それぞれのベクトルデータベースにおいて最も類似した埋め込み上位5つを検索する。

お問い合わせ 少額訴訟の呼出状が届きました。

検索結果: Qwen2 DeepSeek-R1の検索結果
[CA] 少額訴訟に関する質問 電話勧誘員を雇い、法律にもかかわらず電話をかけ続ける会社を訴えることはできますか?
[CO]保険で支払われた病院の請求書について、裁判所から召喚状が届きました......証拠はあるのですが、解決するためにはやはり弁護士を雇う必要があるのでしょうか? 元恋人の娘が万引きで逮捕されたらどうするか?
3,500ドルのローンを踏み倒したとして訴えられているんだ。 深夜、仕事を終えてほとんど誰もいない駐車場に出ると、2人の男が車のドアをこじ開けるのが見えた。あなたは彼らに止めるように言ったが、彼らはあなたを無視した。あなたは拳銃を隠し持っている。
ルームメイトの猫がナッツ入りのトレイルミックスのスナック菓子を食べてしまい、獣医に診せたところ1500ドル以上の請求が来た。彼女は私にその代金を支払わせるために少額訴訟を起こすと脅しているが、そのスナックが私のものであるという証拠はない。心配すべきでしょうか? ミズーリ州マリファナ所持で物的証拠なし。
最近、支払ったと思っていた借金の民事召喚状を受け取った。 犬を人に仕掛ける」ことは合法なのか?

なぜ違いが生まれるのか?

上の表では、DeepSeek R1 の検索結果が大幅に悪化しています。これはなぜでしょうか?

DeepSeek R1のアーキテクチャは主に推論に重点を置いており、順序的思考と論理的接続を重視しています。つまり、DeepSeek R1 はドキュメントを意味空間にマッピングしません。

対照的に、Qwen2変異体(GTE-QWEN2-7B-インストラクション意味類似性タスクに特化したトレーニングこれは、特定の文言に関係なく、概念的に類似した文書が緊密にクラスタリングされた高次元空間を作成することができます。

この学習アプローチの違いは、Qwen2がクエリの意図をうまく捉えているのに対し、DeepSeek R1は、テーマ的には関連性があるが、実際には無関係な検索結果を導く推論パスをたどることがあることを意味する。

DeepSeek R1は、埋め込み用に微調整されていない限り、RAGの検索埋め込みモデルとして使用すべきではありません。

2.R1との世代:印象的な推理力

(躊躇なく R1 埋め込みには若干の困難があるが、我々はそれを見つけることができた。 生成 その能力は注目に値する。R1の思考連鎖アプローチを活用することで、我々は観察した:

  • より強い一貫性: このモデルは、複数の文書から情報を合成し、関連する箇所を明確に参照することができる。
  • 幻覚の減少: R1 「自分自身」の内部で推論し、それぞれの結論をデータで検証する。

いくつかの例を見てみよう:

例1:リースの解約

質問だ: 賃貸契約を解除したいのですが、家主が許可してくれません。

ディープシークR1の思考プロセスを見る

リースを解約したいのですが、大家が許してくれません。どのような選択肢があるのかわかりません。提供された書類をもとに、物事を整理しようとしています。

まず、ペーパー1で借家契約の早期解約のペナルティについて読んだ記憶がある。ある人が、18ヶ月の借家契約の15ヶ月後に借家契約を終了させることは可能か、と質問したところ、答えはイエス、ただし家主が同意するか、新しい借主が見つかった場合に限る、というものだった。つまり、もし私が早期に賃貸契約を終了させたい場合、家主が同意するか、すぐに再賃貸ができない限り、家主は私に責任を負わせる可能性があるということです。これは可能なルートのように思えますが、大家が交渉に応じてくれるかどうかはわかりません。

次に、論文 2 では、誰かが賃貸借契約を解除したい理由は結婚するためである。回答は、賃貸借契約では、賃貸借契約を解除するために手数料を支払うことを認めている場合もあれば、賃貸借期間の終了まで待つ必要がある場合もあることを示唆しています。そこで、私の賃貸契約に、転貸条項や譲渡条項など、解約を認める条項があるかどうかを確認することができる。もしそうでなければ、違約金を支払うか、リース期間終了まで待つ必要があるかもしれない。

論文3は、介助犬による賃貸契約の解除について論じている。選択肢としては、違約金を支払う、転貸する、別の介助犬を探す、賃貸期間が満了するまで待つ、などが挙げられている。しかし、特別な理由がない限り、賃貸契約を解除することは、通常、何らかの結果をもたらすことを示している。

論文4では、家主が家賃を値上げしたため、ユーザーは短い通知期間について質問した。回答は、理論的には30日間の通知期間が必要であるが、家主は次の借家契約まで元の家賃を支払うことに同意するなどの妥協案を提示することができると述べている。大家が賃貸契約を解除することを拒否した場合、より高い家賃を支払うという選択肢を提案してみることは可能かもしれないが、それが私の経済的負担の範囲内かどうかはわからない。

資料5には、大家が猫を飼っていることを理由に賃貸契約の更新を拒否したことが記載されている。回答は、大家は法的に賃貸契約を更新する義務はなく、したがって賃貸契約を更新しないという選択肢もあるというものだった。このことから、私の大家も同じような裁量権を持っているのではないかと考えたが、それが拒否の理由であったかどうかはわからない。

論文6では、賃貸借契約が更新され、新たな条件が付けられた場合について論じている。回答では、貸主は既存の賃貸借契約が満了するまで、その賃貸借契約を尊重しなければならないとしている。したがって、貸主が賃貸借契約を解除することを拒否した場合、賃貸借契約に更新しないことを認める特別条項がない限り、賃貸借契約が終了するまで待たなければならないということになりかねない。

論文7と8は、賃貸オフィスが直面する賃貸契約の更新の難しさについて論じている。資料には、評判が悪いなどの理由で大家が賃貸契約を更新したくない場合があるが、法的には大家は賃貸契約を更新しないという選択ができると書かれている。このことは、貸主にはある程度の権限があることを示唆しているが、特別な理由がない限り、早期に賃貸契約を解除する法的義務はないのかもしれない。

資料9では、退去前の30日前通知義務について説明しています。入居時に契約書にサインしていなくても、貸主は通知を要求することがあります。したがって、通知なしに退去した場合、罰金を科されたり、残りの賃貸期間の家賃を支払わなければならなくなったりする可能性があります。

最後に、論文10は、シェアルームの同居人が退去する際に、賃借人が家賃の全額を負担する状況を扱っています。回答は、転貸による家賃の分担を提案している。私が退去する場合、私の分を転貸しようとすることはできるかもしれませんが、賃貸条件次第でしょう。

要約すると、賃貸契約に早期解約に関する条項があるかどうかを確認する必要がある。なければ、家主が同意しない限り、違約金を支払わなければならないかもしれません。引っ越しなど正当な理由があれば、家主と交渉することもできる。転貸が可能であれば、それが解決策になるかもしれないが、賃貸契約でそれが認められているかどうかを確認する必要がある。また、他に方法が見つからなければ、賃貸契約が自然に終了するまで待てるかどうかも検討すべきです。

View Reply by ディープシークR1

提供された書類の分析に基づき、貸主が早期解約を拒否した場合のリース解約の構造的アプローチを以下に示す:

1.リース契約の見直し
早期解約条項:借家契約に早期解約に関する条項があるかどうかを確認してください。このような条項がある場合は、違約金を支払うか、家主に事前に解約を通知することが法的に義務付けられている場合があります [1]。
転貸または譲渡:賃貸借契約において、転貸または譲渡が認められているかどうかを確認する。これにより、罰金や訴訟を回避できる可能性がある[2]。
2.家主の裁量を理解する
あなたの裁量による更新:特に、賃貸契約に早期解約を明確に認める条項がない場合、家主は賃貸契約の更新を拒否する権利を有する場合がある。この場合、あなたは期間満了まで賃貸借契約を守る必要があるかもしれません[6][8]。
3.経済的影響の考慮
違約金:貸主の同意なしに借家契約を早期解約した場合、金銭的な違約金を科される可能性があることを覚悟しておくこと。これには、追加家賃の支払いや損害保証金の支払いが含まれる可能性があります [1][9]。
4.交渉の模索
条件交渉:転居など、早期解約の正当な理由がある場合は、違約金の減額や早期解約の許可について家主と交渉することができる[2]。
5.解決策としてのサブリース
スペースの転貸:可能であれば、経済的負担を補うために賃貸の一部を転貸することを検討する[10]。
6.将来計画
リース満了まで待つ:早期解約が不可能な場合は、リース満了まで 滞在する計画を立てる。これにより、罰金や法的問題を避けることができる[6][8]。
結論

何か行動を起こす前に、必ず賃貸条件をよく確認すること。早期解約が認められない場合は、転貸を検討するか、リースが終了するのを待ちましょう。家主と交渉できる場合は、これが最善の方法かもしれません。具体的な状況については、必ず法律の専門家に相談してください。

例2:少額裁判所

質問だ。 係争中の債務について少額訴訟の呼出状が届きました。どのように準備すればよいでしょうか?

ディープシークR1の思考プロセスを見る

今、少額訴訟の呼出状が届きました。何から始めればいいのかよくわからないのですが、どう準備すればいいのか考えなければなりません。検索結果から判断すると、同じような状況を経験した人が何人かいるようなので、彼らの経験から何か学べるかもしれません。

まず、借金の性質を理解しておく必要があるだろう。ドク5では、すでに支払っていると思っていた借金の召喚状を受け取った人がいる。彼らはなぜ別の召喚状が届いたのか理解できない。だから、この債務が有効かどうかを確認する必要がある。私の記録を確認するか、債権者に債務証明を求めるべきだろう。ドキュメント10によると、訴状を拒否して証拠を求めるのがいいようだ。そうすれば、借金の信憑性を疑うことができる。

次はケースの準備だ。資料1では、同じような問題を扱った人がいて、10分以内にケースを提示できるようにしなさいというアドバイスがあった。つまり、簡潔に、すべての証拠を整理しておく必要があるということだ。支払いの領収書、債権者からの和解を示す手紙、資料2のような保険証書など、私が借金を負っていないことを証明する書類を集めておく必要がある。

証人の問題も考えなければなりません。ドキュメント4では、同居人が獣医の請求書のことでこの人を裁判にかけると脅しているが、訴えられなければ脅しは無視するようにとアドバイスされている。しかし、もし私が訴えられたら、私を裏付ける証人を用意しなければなりません。おそらく、払おうとしていたときに一緒にいた友人か、資料7にあるように家の状態を証言できる元借主だろう。

裁判の流れを理解することは重要である。資料7にあるように、少額訴訟で勝訴した後、家主が控訴を申し立てたため、再び裁判所に出頭しなければならなくなった。また同じ手続きを踏まなければならないのである。ですから、勝訴しても控訴の手続きがあることを知っておく必要があります。必要であれば、もう一度自分のケースを提出できるように準備しておく必要がある。

召喚状と答弁書についても検討する必要がある。ドク5では、誰かが答弁書に応じなければならない。もし応じなければ、不履行判決を受けるかもしれない。従って、私は期限内に返答し、自分の弁明を明確に述べなければならない。

弁明書の提出が次のステップである。資料10には、たとえオファーがあったとしても、必ず断って証拠を求めるべきだと書かれている。そうすることで、その後の交渉で有利になる。私は自分の主張と証拠をすべて弁明書に記載する。

また、自分の経済状況を考えることも重要である。資料6では、支払えずに収監される懸念がありましたが、債務者監獄は存在しないことが明らかになりました。しかし、私の経済状況について裁判所とコミュニケーションをとることは必要です。どうしても支払えない場合は、資料5にあるように、合理的な努力をしたことを示し、分割払いのプランを提示する必要がある。

法的な問題について確信が持てない場合は、弁護士に相談すべきかもしれません。文書3では、その人は引っ越しをしており、裁判の期日があります。債務整理の弁護士に相談することは、特に他の借金や複雑な問題を抱えている場合に役立つかもしれません。

最後に、法廷審問の準備をしなければなりません。時間通りに到着し、適切な服装をし、すべての書類を準備することが肝要である。資料7では、この人は証拠をしっかり準備して勝訴したのだから、私もそれに倣うべきだ。

要約すると、私は次のことをする必要があります:借金の確認、証拠の準備、裁判手続きの理解、召喚状への正しい対応、場合によっては弁護士への相談、そして裁判のための整理整頓と準備。関連書類を引用することで、私の決定をサポートすることができます。

View Reply by ディープシークR1

以下は、提供された法的文書の分析に基づき、係争中の債務に関する少額裁判所呼出状作成のための構造化され整理された計画である:

債務の検証
債権者の証明を確認する: 債権者から提供された書類を確認し、債務の有効性と詳細を確認することから始める。この情報を使って、あなた自身の記録や事前のやり取りと照合する。
書類の要求:債権者に連絡し、裁判所の判決書や和解契約書など、債務の正式な証拠を要求する。このステップは、論文10で推奨されているように、債務の信憑性に異議を唱えるために不可欠である。
ケースの準備
証拠の収集:資料2および8で述べたように、支払領収書、債権者からの和解を示す書簡、保険証書など、関連する証拠をすべて収集する。
証拠の整理と提出: 資料 1 のアドバイスに従って、すべての証拠を整理し、法廷で提出できるようにする。必要であれば、支払いに立ち会った友人や、問題の物件の元借主などの目撃者の証言を含めることを検討する。
裁判手続きの理解
複数回の審問に備える:勝訴した場合、資料7に記載されているように、上訴手続きが行われる可能性があることに注意すること。必要であれば、再度ケースを提示できるよう準備しておくこと。
裁判手続きに慣れる:審理の仕組みや裁判官の役割など、小法廷の基本を学ぶ。
召喚状および起訴状への対応
答弁書の提出: 不履行判決を避けるため、召喚状にはタイムリーに対応すること。文書10で推奨されているように、弁明書に弁明を明確に記載し、債務証明を要求する。
起訴の否認:資料10にあるように、交渉の機会を生かすため、常に起訴を否認する。
財務状況への配慮
財務状況を伝える:借金を支払えない場合は、財務状況を示し、資料5で説明されているように分割払いの計画を提示する。債務を解決するために合理的な努力をしたことを証明すること。
必要に応じて弁護士に相談
法的アドバイスを求める:状況が複雑であったり、法的な立場が不明であったりする場合は、資料3で提案されているように、特に他の債務や複雑な問題が絡んでいる場合は、債務整理の弁護士に相談すること。
法廷審問の準備
時間厳守と準備:早めに到着し、適切な服装をし、必要書類をすべて持参する。よく準備されたケースの成功例については、資料7の例を参照のこと。
余分なステップを考慮する
同居人や目撃者への通知:借金が共有財産に関わるものである場合は、資料4で述べたように、目撃者や同居人でサポートしてくれる人がいれば通知することを検討する。

これらのステップに従うことで、少額訴訟の審理に自信を持って対応し、自分の訴えを効果的に提示し、自分の権利を守ることができます。

これらの例から、DeepSeek R1 には優れた推論能力があることがわかります。その思考プロセスは、ソースとなる法的文書からどのように結論を導き出すことができるかを明確に示しています:

  • R1はまず コヒーレントモデル それは、その詳細な推論プロセスに反映されている:まず、早期契約解除の罰金について覚えていることがあるのだが......。 資料1には......。 この「検索前の推論」アプローチにより、モデルは検索前に複数のソースからの概念を体系的に結びつけることができる。
  • リースの解約や少額訴訟のような複雑なシナリオに対処する場合、R1は、次のように考えている。 幻覚はない。 各文書に対する理解を明示的に整理するのではなく (それを総合すると......。).
  • 最後に、ジェネレーターは、結論と出典をリンクする正確な参照を使用して、その推論を説明します。これによって、質問から推論、回答への明確な連鎖が保証され、厳密性とアクセシビリティが保証される。

様々な法的クエリを試した結果、このモデルはソース文書から情報を抽出できるだけでなく、その内容を学習し推論することができることがわかった。

結論 質疑応答と要約のタスクではR1 段階的な法的推論の「金鉱」である。作成段階でこれを使えば、失望することはほとんどないだろう。

3.エンジニアリングは依然として重要

キューのデザイン

高度な推理力があるからといって、うまく設計されたキュー・ワードの必要性がなくなるわけではない。手がかりとなる言葉による明示的な指導は、次のような場合に不可欠であることがわかった。

  • 駆り立てる 文書参照 全体を通して答えを出す。
  • 幻覚の防止 出典を挙げるか、知らないと述べるか」というやり方だ。
  • 最終的な回答を読みやすくするための構成 .

実験では、以下のような手がかりとなる単語を作った:

あなたは、法律文書や関連コンテンツの分析を支援するAIアシスタントです。回答する際は、以下のガイドラインに従ってください:
- 提供される検索結果では、各文書は [Document X begin]... [Document X end] のようにフォーマットされています。[ここでXは文書番号です。
- 引用は[citation:X](Xは文書番号)の形式で行い、関連情報の後に引用を記述してください。
- 引用は末尾だけでなく、回答全体を通して行いましょう。
- 情報が複数の文書からのものである場合は、[citation:1][citation:2]のように複数の引用を使用してください。
- すべての検索結果が関連するわけではありません。関連する情報だけを評価し、使用してください。
- 長い回答の場合、読みやすくするために、段落やセクションで内容を構成してください。
- 提供された文書に答えが見つからない場合は、情報をでっち上げるのではなく、直接記述してください。
- ドキュメントの中には、非公式なディスカッションやRedditへの投稿が含まれている場合があります。
- 回答にはできるだけ多くの引用を含めてください。
まず、タグであなたの思考プロセスを説明してください。
そして、思考プロセスの後に最終的な答えを述べてください。

ドキュメントのチャンキング

加えて、我々は次のことを発見した。 正確な文書検索には効果的な文書チャンキングが不可欠.文書をチャンキングすることで、各埋め込みが特定のトピックをより正確に表現できるようになり、各埋め込み生成に必要な時間が短縮されます。 トークン 数量。

NLTKによる)センテンスベースのセグメンテーションを使って、ドキュメントをチャンクする。また、各チャンクの先頭と末尾には、隣接するチャンクと重複するコンテンツが含まれる。これにより、全体的な文脈を失うことなく、モデルが部分的な参照をより理解しやすくなる。以下は、ドキュメントのチャンキングに使用されるコードである:

def chunk_document(document, chunk_size=2048, overlap=512).
"""文ベースの分割を使用して、ドキュメントを重複するチャンクに分割する。""""
text = document['text'].
チャンク = []"
# 最初に文単位で分割
文 = nltk.sent_tokenise(text)
カレントチャンク = [] (現在のチャンク)
現在の長さ = 0
for sentence in sentences: sentence_len = len(sentence)
sentence_len = len(sentence)
# この文を追加するとチャンクのサイズを超える場合は、現在のチャンクを保存する
if current_length + sentence_len > chunk_size and current_chunk.
chunk_text = '.join(current_chunk)
chunks.append({
'id': document['id']、
'name': document['name']、
'content': document['text']、
'chunk_start': len(' '.join(current_chunk[:-(2 if overlap > 0 else 0)]) if overlap > 0 else 0、
# その他のメタデータフィールド...
})
# 最後の数文をオーバーラップとして保持する
overlap_text = '.join(current_chunk[-2:]) # 最後の2文を保持する
current_chunk = [overlap_text] if overlap > 0 else [].
カレント_レングス = len(overlap_text) if オーバーラップ > 0 else 0
current_chunk.append(文)
current_length += sentence_len + 1 # +1 for space

要点のまとめ

  1. 文字ベースの分割ではなく、文ベースのトークン分割にNLTKを使用してください。
  2. ドキュメントのコンテキストは、ブロック間で重複するセンテンスを保持することによって維持される。

4. vLLMは効率的で速い。

法律文書データは膨大な量であるため、RAG用の埋め込みデータを生成するには長い時間がかかる。

当初はHuggingFaceの センテンス・トランスフォーマー最初にNvidia L4 GPUで実行しましたが、いつもの「CUDAメモリ不足」エラーに遭遇しました。最初にNvidia L4 GPUで実行しましたが、いつもの「CUDAメモリ不足」エラーに遭遇しました。その後、Nvidia A100を試してみたところ センテンス・トランスフォーマー を完全にロードするには57GBのDRAMが必要である。 アリババNLP/gte-Qwen2-7B-インストラクト モデル

RAGにおけるDeepSeek R1:実践経験のまとめ-3

に切り替えた。 ブイエルエルエムこれは、高スループットでメモリ効率の良いLLM推論およびサービスエンジンである。

vLLMでは、標準的なNvidia L4 GPU(~24GB DRAM)でモデルを実行できます。GCPでは、Nvidia L4は約$0.7/時間ですが、Nvidia A100は少なくとも$2.9/時間です。

Nvidia A100(80GB DRAM)でvLLMとセンテンストランスを比較すると、以下のことがわかります。 vLLMはQwen2の埋め込みを最大5.5倍高速に生成する!.

10,000の法的文書(合計15,000チャンク)を処理する場合:

  • 標準文 変流器 処理時間:約5.5時間
  • vLLM処理時間:約1時間

RAGにおけるDeepSeek R1:実践経験のまとめ-4

以下はvLLM上で実行される。 アリババNLP/gte-Qwen2-7B-インストラクト をクリックして、組み込みSkyPilotのYAML設定を生成します:

name: compute-legal-embeddings
リソース
# vLLMは~24GB DRAM GPUを必要とし、SentenceTransformerは57GBを必要とします。
アクセラレータ:{L4:1, A100:1}
envs.
start_idx: ${start_idx}.
end_idx: ${end_idx}.
file_mounts.
/output.
名前: my-bucket-for-embedding-output。
モード: MOUNT
セットアップ: |pip install torch==2.5
pip install torch==2.5.1 vllm==0.6.6.post
...
envs.
MODEL_NAME: "Alibaba-NLP/gte-Qwen2-7B-instruct"
実行: |.
python -m vllm.entrypoints.openai.api_server  \.
--ホスト 0.0.0.0
--model $MODEL_NAME  \
-max-model-len 3072  \
---タスク embed &
python scripts/compute_embeddings.py ¦スタートIDX
--start-idx $START_IDX ୧-͈ᴗ-͈ᴗ
--end-idx $END_IDX ୧-͈ᴗ-͈ᴗ
--chunk-size 2048
--chunk-overlap 512  \
--vllm-endpoint http://localhost:8000

5.エンベデッドに100時間以上かけさせない - 並列処理にSkyPilotを使う!

1つのL4 GPUで法的文書のエンベッドを生成するのに100時間かかります。スポット・インスタンスを活用することで、時間とコストを劇的に削減できます:

原始時代 100のスポット例
100時間 1時間(100倍加速)
(製造原価 $70.1 | $28.2(2.4倍貯まる)

RAGにおけるDeepSeek R1:実践経験のまとめ-5

結果 エンベッドを生成するのに何日も待つ必要はもうない。私たちのタスクはダイナミックに拡張でき、大規模なデータセットに直面しても、プロトタイプからプロダクションへと迅速に移行することができます。

評決を下す

造る ディープシーク R1 RAG いくつかのポイントを学ぼう:

  1. Qwen2のような特殊な埋め込みモデルで検索能力を強化する。
  2. R1の推論機能は、複雑な法的クエリを処理するために生成段階で利用される。
  3. (キュー・ワード)エンジニアリングは、引用を制御し、コンテンツを構造化するための鍵であり続ける。
  4. vLLMで推論効率を高め、大幅なスピードアップを実現。
  5. AIコンピューティングをクラウドや自社インフラで拡張し、計算時間とコストを削減。

もっと知りたい?

注目してほしい: RAGシステムは、法的調査および分析のための強力なツールですが、有資格の法律専門家に代わるものではありません。その出力は法的助言とみなされるべきではありません。

シーディーエヌワン
無断転載を禁じます:チーフAIシェアリングサークル " RAGにおけるDeepSeek R1:実務経験のまとめ

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語