はじめに
オープン ノートブックLM は、あらゆるPDF文書をポッドキャストに変換するために設計されたオープンソースプロジェクトです。このツールは、オープンソースの大規模言語モデル(LLM)と音声合成(TTS)モデルを使用して、PDFコンテンツを処理し、音声ポッドキャストに適した自然なダイアログを生成し、MP3ファイルに出力します。NotebookLMツールに触発されたこのプロジェクトは、Llama 3.3 70B、Fireworks AI、MeloTTS、Bark、Jina Readerなどの技術を使用しています。ユーザーは、シンプルなインターフェースを通じてPDF文書をアップロードし、有益で興味深いポッドキャスト・ダイアログを生成することができます。
機能一覧
- PDFからポッドキャストへPDF文書をアップロードして、その内容をポッドキャストのダイアログに変換します。
- 自然な対話の生成教育的かつ娯楽的なダイアログを作成する。
- ユーザーフレンドリーなインターフェースGradioを使って、シンプルなインタラクティブ・インターフェースを提供する。
- 多言語サポートポッドキャストは13ヶ国語に対応しています。
ヘルプの使用
設置プロセス
- クローン倉庫
git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
- 仮想環境を作成し、起動する:
python -m venv .venv
ソース .venv/bin/activate
- 必要なパッケージをインストールする:
pip install -r requirements.txt
使用プロセス
- APIキーを設定します:
- Fireworks APIキーを環境変数に設定する
花火_api_key
.
- Fireworks APIキーを環境変数に設定する
- アプリケーションを実行する:
python app.py
これでGradioのインターフェイスが起動する。
- PDFをアップロードする:
- インターフェースにポッドキャストに変換したいPDFドキュメントをアップロードします。
- オーディオを生成する:
- ボタンをクリックして変換プロセスを開始し、ポッドキャストのダイアログを含むMP3ファイルが出力されます。
詳細な機能操作の流れ
- PDFアップロードGradioのインターフェイスでPDFファイルを選択し、アップロードします。
- 対話の生成このシステムは、PDFコンテンツを自動的に処理し、自然な対話を生成します。
- 音声出力生成ボタンをクリックすると、ポッドキャストファイルがMP3形式で出力されます。
- 多言語サポート設定で希望の言語を選択すると、その選択に従って適切な言語でポッドキャストが生成されます。