Langfuse：LLMアプリケーションのためのオープンソース観測・デバッグプラットフォーム

30.9K 00

はじめに

LangfuseはオープンソースのLLM（大規模言語モデル）エンジニアリングプラットフォームです。呼び出しの観察、プロンプトの管理、実験の実行、結果の評価のためのツールを提供することで、LLMアプリケーションのトレース、デバッグ、最適化を支援します。Langfuseチームによって開発されたこのプラットフォームは、LangChainやOpenAIなどのフレームワークをサポートしています。langfuseはクラウドサービス（無料パッケージあり）とセルフホストオプションを提供しており、本番環境への導入が容易で実績があります。

代理店およびラグランタイムは、ラングスミスと同様に視覚化され、観察される。

機能一覧

応用観察LLMアプリケーションの各コールをトレースし、入出力、レイテンシ、コストを記録する。
キュー・マネジメントバージョン管理とチームワークの調整をサポートする、キュー・ワードの一元管理。
データセット管理テストデータセットを作成し、モデルやキューの効果を比較するための実験を行う。
評価ツール:: ユーザーフィードバック、手動ラベリング、自動評価による出力品質のチェックのサポート。
デバッグ・サポート詳細なログとユーザーセッションを表示し、問題を素早く特定します。
実験的な遊び場プロンプトの単語やモデル構成をテストし、開発の反復を加速させる。
マルチフレームワーク対応LangChain、OpenAI SDK、LiteLLMなどに対応。
APIの統合LLMOpsのワークフローをカスタマイズするための包括的なAPIを提供します。

ヘルプの使用

インストールと展開

クラウドサービス

アカウント登録アクセスラングフューズクラウド登録するには「登録」をクリックしてください。
プロジェクトを作成するログイン後、"New Project "をクリックし、プロジェクト名を入力します。
キーを入手するプロジェクト設定で生成 PUBLIC_KEY 歌で応える SECRET_KEY.
使い始めるインストール不要で、SDKから直接クラウドサービスに接続できます。

ローカルデプロイメント（Docker Compose）

環境を整えるDockerとDocker ComposeはDockerのウェブサイトからダウンロードできます。
クローンコードターミナルで実行 git clone https://github.com/langfuse/langfuse.git次に、カタログを入力する。 cd langfuse.
サービス開始入力 docker compose upを選択し、起動が完了するのを待つ。 http://localhost:3000.
糺すブラウザアクセス http://localhost:3000ログインページが表示されれば成功です。
キーの設定登録後、SDKのUIでキーを生成します。

Kubernetesのデプロイメント（プロダクションの推奨）

クラスタの準備Minikube（ローカルテスト用）またはAWSなどのクラウドサービスを使用してKubernetesクラスタを作成します。
ヘルム追加ランニング helm repo add langfuse https://langfuse.github.io/langfuse-k8s 歌で応える helm repo update.
コンフィグ作成 values.yamlデータベースと主要な情報が入力される。公文書).
展開入力 helm install langfuse langfuse/langfuse -f values.yaml終わるまで待つ。
インタビューIngressに基づくサービスアドレスへのアクセスを設定する。

仮想マシンの展開

単一の仮想マシン上での実行 docker compose up手順はローカル展開と同じです。

主な機能

応用観察

SDKのインストールPython プロジェクト実行 pip install langfuseJS/TSプロジェクト・ラン npm install langfuse.

初期化コードでキーとホストを設定する：

from langfuse import Langfuse
langfuse = Langfuse(public_key="pk-lf-xxx", secret_key="sk-lf-xxx", host="http://localhost:3000")

レコード・コールデコレーターを使うか、手動でトレースする：

from langfuse.decorators import observe
@observe()
def chat(input):
return openai.chat.completions.create(model="gpt-3.5-turbo", messages=[{"role": "user", "content": input}])
chat("你好")

調べるUIの "Traces "ページでコールの詳細を確認してください。

キュー・マネジメント

新しいヒントUIの "プロンプト "ページで "新規プロンプト "をクリックし、名前と内容を入力する：
```
System: 你是一个助手，直接回答问题。
User: {{question}}
```
使用上の注意コードでの呼び出し langfuse.get_prompt("prompt-name").
バージョン管理プロンプトを変更した後、自動的にバージョンを保存し、ロールバックすることができます。

データセットと実験

データセットの作成UI の "Datasets "ページで "Create Dataset "をクリックし、名前を "qa-test "とする。
データ追加CSVを入力またはアップロードします：
```
Input: "1+1等于几？" Expected: "2"
```

走行実験:: コードでテストする：

dataset = langfuse.get_dataset("qa-test")
for item in dataset.items:
result = chat(item.input)
item.link(langfuse.trace({"output": result}), "test-1")

分析済み実験結果をUIで見る。

遊び場

入るUIの "Playground "をクリックし、プロンプトとモデルのパラメータを入力する。
試験Run をクリックして出力を表示し、パラメータを調整して保存します。
ジャンプトレース」エラー結果より引用遊び場修正。

注目の機能操作

デバッグ・ログ

トレース」ページでは、入出力とコンテキストを見るためにコールをクリックします。
セッション」でユーザーセッションを表示し、複数ラウンドの会話を分析。

評価アウトプット

手動式スコア」ページで出力を評価する（0～1）。
オートメーションAPI 経由で評価を追加できます：
```
langfuse.score(trace_id="xxx", name="accuracy", value=0.95)
```

APIの使用

OpenAPI仕様またはSDK（Python/JSなど）を使用して呼び出され、例えばトレースを作成する：

curl -X POST "http://localhost:3000/api/traces" -H "Authorization: Bearer sk-lf-xxx" -d '{"id": "trace-1", "name": "test"}'

アプリケーションシナリオ

RAGプロセス可視化トラッキング
- キーワード・リコール、ベクトル・リコール、リコール・フュージョン、並べ替え、回答までのプロセス全体を視覚的に追跡
インテリジェントな顧客サービスの開発
- チームはLangfuseを使用して会話を追跡し、回答の質を最適化し、カスタマーエクスペリエンスを向上させています。
モデルの性能比較
- 開発者はデータセットを作成し、クイズ・タスクに対する複数のLLMのパフォーマンスをテストする。
オンプレミス展開
- 同社は、機密データの保護と社内AIアプリケーションのデバッグのためにLangfuseをセルフホストしている。

品質保証

どのような言語やフレームワークに対応していますか？
- PythonとJS/TSをサポートし、LangChain、OpenAI、LlamaIndexなどと互換性があります。
セルフホスティングの最小構成は？
- 小規模なプロジェクトでは2コアのCPUと4GBのRAMを使用し、大規模なプロジェクトでは8コアと16GBを推奨する。
テレメトリーを無効にするには？
- で環境変数を設定する。 TELEMETRY_ENABLED=false.

最新のAIリソース # AI Java オープンソースプロジェクト

Rankify: 情報検索と並び替えをサポートするPythonツールキット

7ヶ月前

023.3K

GraphCast：拡散モデルに基づく中期的な世界気象予測の学習と予測のための効率的なツール

最新のAIリソース # AI Java オープンソースプロジェクト

10ヶ月前

022.5K

Together Open Deep Research：生成带索引的深度研究报告

共に開くディープリサーチ：インデックス付きディープリサーチレポートの作成

6ヶ月前

018.9K

FramePainter：AIを搭載した落書き風画像編集ツール

9ヶ月前

022.2K

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません

Langfuse：LLMアプリケーションのためのオープンソース観測・デバッグプラットフォーム

はじめに

機能一覧

ヘルプの使用

インストールと展開

クラウドサービス

ローカルデプロイメント（Docker Compose）

Kubernetesのデプロイメント（プロダクションの推奨）

仮想マシンの展開

主な機能

応用観察

キュー・マネジメント

データセットと実験

遊び場

注目の機能操作

デバッグ・ログ

評価アウトプット

APIの使用

アプリケーションシナリオ

品質保証

GAG：人間の行動をシミュレートする大規模モデルを用いた社会関係グラフの生成

csm-mlx: Appleデバイス用csm音声生成モデル

関連記事

Rankify: 情報検索と並び替えをサポートするPythonツールキット

GraphCast：拡散モデルに基づく中期的な世界気象予測の学習と予測のための効率的なツール

共に開くディープリサーチ：インデックス付きディープリサーチレポートの作成

FramePainter：AIを搭載した落書き風画像編集ツール

コメントなし

最新コレクション

最新記事

Langfuse：LLMアプリケーションのためのオープンソース観測・デバッグプラットフォーム

はじめに

機能一覧

ヘルプの使用

インストールと展開

クラウドサービス

ローカルデプロイメント（Docker Compose）

Kubernetesのデプロイメント（プロダクションの推奨）

仮想マシンの展開

主な機能

応用観察

キュー・マネジメント

データセットと実験

遊び場

注目の機能操作

デバッグ・ログ

評価アウトプット

APIの使用

アプリケーションシナリオ

品質保証

GAG：人間の行動をシミュレートする大規模モデルを用いた社会関係グラフの生成

csm-mlx: Appleデバイス用csm音声生成モデル

関連記事

Rankify: 情報検索と並び替えをサポートするPythonツールキット

GraphCast：拡散モデルに基づく中期的な世界気象予測の学習と予測のための効率的なツール

共に開くディープリサーチ：インデックス付きディープリサーチレポートの作成

FramePainter：AIを搭載した落書き風画像編集ツール

コメントなし

厳選されたAIツール

最新コレクション

最新記事