AIパーソナル・ラーニング
と実践的なガイダンス
豆包Marscode1

ラージ・ランゲージ・モデル(LLM)の評価に関するプロダクト・マネージャーのための実践コース

AI製品チームやAIリーダーを対象に、LLMベースの製品を評価する方法を紹介。プログラミングの知識は不要で、簡単に学習を始めることができます。このコースは 9 2024年12月 スタート。

 

何を学ぶか

LLM評価の基本:評価方法とベンチマークからLLMセーフガード、カスタムLLM評価ツールの作成方法まで。このコースは、AIの品質と観測可能性の中核となる概念を習得したいAIプロダクトマネージャーやAIリーダーのために設計されています。


LLMアプリケーションのライフサイクルの各フェーズの評価:実験フェーズから生産監視フェーズまで。

どのように評価データセットを設計し、合成データを使用して多様なテストケースを生成するか。

LLMアプリケーションで起こりうる問題:幻覚、即時注入、制御不能のクラッキングなど。

生産環境におけるLLMの観測可能性をどのように構築するか:トレーサビリティ、アセスメント、セーフガード。

LLM評価方法:LLM評価ツール、正規表現、予測指標。

実践例:RAG(検索補強生成システム)、QAシステム、インテリジェントエージェントの評価方法。

 

リリースを待っている

無断転載を禁じます:チーフAIシェアリングサークル " ラージ・ランゲージ・モデル(LLM)の評価に関するプロダクト・マネージャーのための実践コース
ja日本語