QwenLong-L1.5 - Ali Tongyi Lab オープンソース長文推論モデル

堆友AI

QwenLong-L1.5とは何ですか?

QwenLong-L1.5は、Alibaba Tongyi Labsが開発したオープンソースの長文推論モデルであり、超長文(例えば1M-4Mトークン)を含む複雑な推論問題の解決に焦点を当てている。すなわち、知識グラフ、SQL構文解析、マルチインテリジェンス体フレームワークによる高品質なマルチホップ推論データの生成、学習の安定性を動的にバランスさせる適応的エントロピー制御戦略AEPoの提案、超長文をチャンク単位で処理し、リアルタイムでメモリ要約を更新するメモリエージェントアーキテクチャの設計である。このモデルは、LongBench-V2や他のリストにおいてGPT-5やGemini-2.5-Proを凌駕し、特に超長文テキストタスクにおいて優れており、数学的推論などの汎用能力も向上している。

QwenLong-L1.5 - 阿里通义实验室开源的长文本推理模型

QwenLong-L1.5の特徴

  • 長い文脈の推論が大幅に改善QwenLong-L1.5は、体系的なポストトレーニングスキームにより、物理的なコンテキストウィンドウ(256K)を超えるタスクを扱う、長いコンテキストの推論に優れています。
  • 革新的なデータ合成と強化学習戦略マルチホップ追跡可能性とグローバルに分散された証拠推論を必要とする挑戦的なタスクの作成に焦点を当てた新しいデータ合成プロセスを開発し、タスクバランスサンプリングや適応的エントロピー制御ポリシーの最適化などの強化学習戦略を導入して、長いコンテキスト学習を安定化させた。
  • 強力なメモリ管理フレームワーク多段階融合強化学習とメモリ更新機構を組み合わせることで、1回の推論で256Kのコンテキストウィンドウ外の長いタスクを処理することができる。
  • 優れたパフォーマンス長いコンテキストのベンチマークでは、QwenLong-L1.5 がベースラインモデル Qwen3-30B-A3B-Thinking を平均 9.9 ポイント上回り、GPT-5 や Gemini-2.5-Pro などのトップモデルに匹敵する性能を達成しました。メモリスマートボディフレームワークは、超ロングタスク(100万~400万トークン)において、スマートボディベースラインに対して9.48ポイントの性能向上を達成しています。
  • ざいげんをひろげるこのモデルは、研究者や開発者が簡単に使えるようにオープンソース化されている。

QwenLong-L1.5の主な利点

  • 超長文処理能力物理的なコンテキストウィンドウ(256K)を超えるタスクを処理でき、長い文書や複雑なデータセットなど、超長文の推論や分析処理に適しています。
  • 革新的なトレーニング戦略タスクバランスサンプリングや適応的エントロピー制御政策最適化(AEPO)などの強化学習手法を組み合わせることで、長いコンテクストタスクにおけるモデルの安定性と性能を効果的に向上させる。
  • 効率的なメモリ管理メモリ更新機構と多段融合強化学習により、長文中の情報を効率的に管理し、超長文タスク(100万~400万トークン)の効率的な処理を実現。
  • 優れたパフォーマンス長いコンテキストのベンチマークでは、QwenLong-L1.5はベースラインモデルを大幅に上回り、GPT-5やGemini-2.5-Proのようなトップモデルに匹敵します。

QwenLong-L1.5の公式ウェブサイトは?

  • GitHubリポジトリ:: https://github.com/Tongyi-Zhiwen/Qwen-Doc
  • HuggingFaceモデルライブラリ:: https://huggingface.co/Tongyi-Zhiwen/QwenLong-L1.5-30B-A3B
  • arXivテクニカルペーパー:: https://arxiv.org/pdf/2512.12967

QwenLong-L1.5の対象者

  • 自然言語処理(NLP)研究者QwenLong-L1.5の長文文脈処理能力と革新的な学習ストラテジーは、長文推論やメモリ管理といった最先端の問題を研究するための新たなツールを研究者に提供し、自然言語処理分野の研究進展に貢献します。
  • 人工知能開発者オープンソースであるため、インテリジェントな顧客サービス、文書分析、コンテンツ作成などの長文テキスト処理アプリケーションの構築に最適で、開発者は高性能な長文テキスト処理機能を迅速に開発することができます。
  • データサイエンティストQwenLong-L1.5は、大規模なテキストデータセットを扱う際に、長いテキストの分析と推論を効果的に実行することができ、データ分析や機械学習タスクを支援する強力なサポートをデータサイエンティストに提供します。
  • コーポレート・テクニカル・チームQwenLong-L1.5は、金融、法律、医療、その他の業界など、長文を扱う必要がある企業にとって、契約書、報告書、医療記録などの長文データをより効率的に処理し、業務の効率を向上させることができます。
  • 学術研究者学術研究、特に文学研究、史料分析などの長文分析を伴う分野では、QwenLong-L1.5は研究者がテキストの深い情報を掘り起こすための研究ツールとして使用することができます。
  • 教育者教育分野では、QwenLong-L1.5は、長文の小論文の自動添削や学術論文の分析など、教育支援に使用することができ、教育者により効率的な教育支援ツールを提供します。
© 著作権表示

関連記事

コメントなし

コメントに参加するにはログインが必要です!
今すぐログイン
なし
コメントはありません