はじめに
Notebook LMのポッドキャスト生成機能と、最近のOpen Notebook LMのオープンソース実装に触発されました。このレシピでは、PDFからポッドキャストへのパイプラインを構築する方法を、ステップバイステップで詳しく説明します。
任意のPDFが与えられると、ホストとゲストがPDFの内容について議論し、説明するダイアログを生成します。
その過程で、私たちは次のことを学ぶだろう:
JSONパターンを使ってPDFからポッドキャストスクリプトを抽出する方法と、Llama 3 70bのようなオープンソースモデルを使った構造化生成。
TTSモデルを使って、このスクリプトをダイアログとして実現する方法。
一緒に PDF to Podcast は、PDF ファイルをポッドキャストに変換する方法を示すユーティリティの 1 つです。このツールを使うと、ユーザーはドキュメントの内容を音声形式に簡単に変換することができ、いつでもどこでも簡単に聴くことができます。
機能一覧
- PDFファイルをポッドキャストに変換する
- 多言語でのテキスト変換をサポート
- Jupyter Notebookの使いやすい例を提供
- Together AIのオープンソースモデルの統合
- カスタム・オーディオ出力フォーマットのサポート
コード例
コード:https://github.com/togethercomputer/together-cookbook/blob/main/PDF_to_Podcast.ipynb
colab: https://colab.research.google.com/github/togethercomputer/together-cookbook/blob/main/PDF_to_Podcast.ipynb