综合介绍
Open NotebookLM 是一个开源项目,旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型(LLM)和文本转语音(TTS)模型,处理PDF内容,生成适合音频播客的自然对话,并输出为MP3文件。该项目受NotebookLM工具的启发,使用了Llama 3.3 70B、Fireworks AI、MeloTTS、Bark和Jina Reader等技术。用户可以通过简单的界面上传PDF文档,生成信息丰富且有趣的播客对话。
功能列表
- PDF转播客:上传PDF文档,将其内容转换为播客对话。
- 自然对话生成:生成的信息对话设计为既有教育意义又有娱乐性。
- 用户友好界面:使用Gradio提供简单的交互界面。
- 多语言支持:支持13种语言的播客生成。
使用帮助
安装流程
- 克隆仓库:
git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
- 创建虚拟环境并激活:
python -m venv .venv
source .venv/bin/activate
- 安装所需包:
pip install -r requirements.txt
使用流程
- 设置API密钥:
- 将Fireworks API的密钥设置为环境变量
FIREWORKS_API_KEY
。
- 将Fireworks API的密钥设置为环境变量
- 运行应用程序:
python app.py
这将启动Gradio界面。
- 上传PDF:
- 在界面中上传您希望转换为播客的PDF文档。
- 生成音频:
- 点击按钮开始转换过程,输出将是包含播客对话的MP3文件。
详细功能操作流程
- PDF上传:在Gradio界面中选择并上传PDF文件。
- 对话生成:系统将自动处理PDF内容,生成自然对话。
- 音频输出:点击生成按钮,系统将输出MP3格式的播客文件。
- 多语言支持:在设置中选择所需语言,系统将根据选择生成相应语言的播客。