AIパーソナル・ラーニング
と実践的なガイダンス
TRAE

AI知識 5ページ

OpenAI-o3 与 Monte-Carlo 思想-首席AI分享圈

OpenAI-o3とモンテカルロのアイデア

o3が個人的な洞察をお伝えします。テストタイム・スケーリング法の進展は、私たちが考えていたよりもずっと早かった。しかし、その道筋は実は少し入り組んでいることを提案したい。AGIを追求するOpenAIの国難を救う方法だ。 強化学習と近道思考 ...

如何为RAG应用选择最佳Embedding模型-首席AI分享圈

RAGアプリケーションに最適なエンベデッドモデルの選び方

ベクトル埋め込みは、現在の検索拡張世代(RAG)アプリケーションの中核をなしている。ベクトル埋め込みは、データオブジェクト(テキスト、画像など)の意味情報をキャプチャし、それらを数値の配列として表現する。現在の生成AIアプリケーションでは、これらのベクトルEmbeddingは通常Embeddingモデルによって生成されます。RAGへの応募方法 ...

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化-首席AI分享圈

DB-GPTの実世界シナリオにおけるRAG最適化に関する10,000語の記事。

まえがき 過去2年間で、検索拡張生成(RAG、Retrieval-Augmented Generation)技術は徐々に拡張知能の中心的な構成要素となってきた。検索と生成の2つの機能を組み合わせることで、RAGは外部の知識を取り込むことができ、複雑なシナリオにおける大規模なモデルの応用を広げることができる。

2025年值得入坑的 AI Agent 五大框架-首席AI分享圈

2025年に参入する価値のあるAIエージェントのフレームワーク トップ5

エージェント これまで私が目にした最も一般的な訳語は「知的身体」だが、直訳すると「エージェント」だ。 Agenticは何と訳すべきだろうか?私は "agentic "の方が適切だと感じている。 そこで、読者を混乱させないために、本稿では英語をそのまま使うことにする。 LLMの発達に伴い、AIの能力...

朴素、有效的RAG检索策略:稀疏+密集混合检索并重排,并利用“提示缓存”为文本块生成整体文档相关的上下文-首席AI分享圈

シンプルで効果的なRAG検索戦略:疎+密のハイブリッド検索と並べ替え、そしてテキストチャンクの全体的な文書関連コンテキストを生成するための「キューキャッシング」の使用。

AIモデルが特定のシナリオで役立つためには、通常、背景知識を利用する必要がある。例えば、カスタマー・サポート・チャットボットは、それがサービスを提供する特定のビジネスを理解する必要があり、法的分析ボットは、過去の多数のケースにアクセスする必要がある。 開発者はしばしば、検索オーグメンテ...

小白也能看懂的大模型微调知识点-首席AI分享圈

初心者でも理解できる大規模なモデル微調整の知識ポイント

大規模モデルのファインチューニングの全過程 ファインチューニングの際には、上記のプロセスに厳密に従うことが推奨される。例えば、データセットの構築が十分でなく、最終的にファインチューニングしたモデルの効果の低さがデータセットの質の問題であることが判明した場合、事前の努力は無駄になり、問題...

万字长文梳理基于LLM的Text-to-SQL发展进程-首席AI分享圈

LLMベースのText-to-SQLの開発プロセスを整理する1万字の記事

OlaChat AI デジタル・インテリジェンス・アシスタント 1万字の徹底分析でText-to-SQL技術の過去と現在をお届けします。 論文:次世代データベース・インターフェース:LLMベースのText-to-SQLに関する調査 自然言語の問題から正確なSQLを生成すること(Text-to-SQL)は、長い歴史を持つ...

Late Chunking×Milvus:如何提高RAG准确率-首席AI分享圈

レイト・チャンキング×ミルバス:RAGの精度を高める方法

01.背景 RAGアプリケーションの開発において、最初のステップは文書をチャンキングすることであり、効率的な文書のチャンキングは、効果的に後続の想起コンテンツの精度を向上させることができます。効率的なドキュメントチャンキングは、その後のリコールコンテンツの精度を効果的に向上させることができます。 どのように効率的にチャンキングするかは議論のホットトピックであり、固定サイズチャンキング、ランダムサイズチャンキング、スライディングウィンドウ...などがあります。

Anthropic总结构建高效智能体简单且有效的方法-首席AI分享圈

人間学は、効率的な知性を構築するためのシンプルで効果的な方法をまとめている。

この1年間、私たちは様々な業界で大規模言語モデル(LLM)エージェントを構築するチームと仕事をしてきました。一貫して、最も成功した実装は、複雑なフレームワークや特殊なライブラリを使用せず、シンプルでコンポーザブルなパターンによって構築されていることがわかりました。 この投稿では、私たちがお客様との共同作業や私たち自身の作業から学んだことを共有します。

多为来自Anthropic的专家关于Prompt Engineering的讨论-首席AI分享圈

人間工学の専門家がプロンプト・エンジニアリングについて語る

AI概要 概要 AIキューエンジニアリングを深く掘り下げたもので、Anthropicの複数の専門家が、研究、消費者、企業など様々な観点からキューエンジニアリングの理解と実践経験を共有する座談会形式となっている。 記事では、キューエンジニアリングの定義、重要性、どのように...

Scaling Test-Time Compute:向量模型上的思维链-首席AI分享圈

テスト時間計算のスケーリング:ベクトル・モデルに関する思考の連鎖

テスト時間計算のスケーリングは、OpenAIがo1モデルをリリースして以来、AI界隈で最もホットな話題の一つとなっている。簡単に言えば、事前学習や事後学習の段階で計算能力を積み上げるのではなく、推論段階(つまり大規模言語モデルが出力を生成するとき)で計算した方が良いということだ...

2024年度RAG清单,RAG应用策略100+-首席AI分享圈

2024 RAG目録、RAG応用戦略 100以上

  2024年を振り返ると、大きなモデルは日々変化し、何百もの知的体が競争している。AI応用の重要な一翼を担うRAGもまた、"群雄割拠 "の様相を呈している。年初にModularRAGが熱を帯び続け、GraphRAGが輝き、中旬にはオープンソースツールが本格化し、ナレッジグラフが新たな機会を創出し、年末にはグラフィカルな推論が...。

Best-of-N 越狱法:对输入内容进行简单的随机变形并反复尝试,就能让主流 AI 系统突破安全限制产生有害回应-首席AI分享圈

Best-of-N脱獄:入力の単純なランダムモーフィングと、主流のAIシステムにセキュリティ制約を突破させて有害な反応を生成させる試みを繰り返す。

近年、生成AI(GAI)や大規模言語モデル(LLM)の急速な発展に伴い、そのセキュリティや信頼性の問題が注目されている。最近の研究で、Best-of-N jailbreak(略してBoN)と呼ばれるシンプルで効率的な攻撃手法が発見された。を入力することで...

卷起来了!长文本向量模型分块策略大比拼-首席AI分享圈

ロールアップ長文ベクトルモデル チャンキング戦略 コンペティション

ロングテキスト・ベクター・モデルは、10ページ分のテキストを1つのベクターにエンコードできる。 多くの人はこう考える。 必ずしもそうではない。 直接使ってもいいのか?チャンクすべきか?最も効率的な分割方法は?この記事では、長文ベクトルモデルの様々なチャンキング戦略について、長所と短所を分析しながら徹底討論します...

如何有效测试 LLM 提示词 - 从理论到实践的完整指南-首席AI分享圈

LLMキューを効果的にテストする方法 - 理論から実践まで完全ガイド

  I. プロンプトをテストする根本原因:LLMはプロンプトに対して非常に敏感であり、微妙な言い回しの変更によって出力が大きく異なる可能性があります。 プロンプトがテストされていない場合、次のようなことが発生する可能性があります。 事実と異なる情報 不適切な回答 不要なAPIコストの浪費 II. プロンプトの体系的な最適化 ...

AI工学部:1.キュー・エンジニアリング

🚀 プロンプト・エンジニアリング プロンプト・エンジニアリングは、ジェネレーティブAIの時代における重要なスキルであり、言語モデルが望ましい出力を生成するよう導くための効果的な命令を設計する技術と科学である。DataCampが報告しているように、この新しい学問分野では、AIモデルから望ましい出力を生成するためのプロンプトを設計し、最適化することが含まれる(...

AI工程学院:2.1从零开始实现 RAG-首席AI分享圈

AI工学アカデミー:2.1 RAGをゼロから実装する

概要 このガイドでは、純粋なPythonを使ってシンプルなRAG(Retrieval Augmented Generation)システムを作成する手順を説明します。埋め込みモデルと大規模言語モデル(LLM)を使って、関連ドキュメントを検索し、ユーザークエリに基づいて応答を生成します。 https://github.com/adithya-s-k/A...

AI工程学院:2.2基本 RAG 实现-首席AI分享圈

AIエンジニアリング・アカデミー:2.2 基本的なRAGの実装

はじめに 検索機能付き生成(RAG)は、大規模な言語モデルの利点と、知識ベースから関連情報を検索する機能を組み合わせた強力な手法である。このアプローチは、特定の検索された情報に基づくことで、生成される応答の品質と精度を向上させる。

ja日本語