综合介绍
MeetingMind 是一个先进的 AI 应用程序,旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术,用于准确的语音转文字,并使用 IBM Watson 的 AI 来分析和提取转录文本中的关键点。整个过程通过 Hugging Face 的 Gradio 提供的用户友好界面进行,使其即使对非技术用户也易于使用。
功能列表
- 语音转文字:利用 OpenAI 的 Whisper 模型将口语内容转换为准确的文本。
- 会议总结:集成 IBM Watson 的 AI 处理转录文本,生成会议的关键点总结。
- 用户友好界面:通过 Hugging Face Gradio 提供直观的网页界面,便于用户交互。
- 实时输出展示:在 Gradio 界面中直接显示转录和总结的内容。
- 环境设置:配置为使用 Python 虚拟环境和必要的库无缝部署。
使用帮助
安装流程
- 克隆仓库:
git clone https://github.com/misbahsy/meetingmind.git cd meetingmind
- 设置虚拟环境:
python -m venv env source env/bin/activate # Windows 用户使用 `env\Scripts\activate`
- 安装所需库:
pip install -r requirements.txt
- 安装 FFmpeg:按照系统要求安装 FFmpeg 以处理音频文件。
- 设置环境变量:在项目根目录创建
.env
文件并添加 API 密钥:OPENAI_API_KEY=your_openai_api_key_here IBM_WATSON_API_KEY=your_ibm_watson_api_key_here
- 运行应用:
python app.py
- 访问界面:打开浏览器并导航到 Gradio 提供的本地服务器地址(通常是
http://127.0.0.1:7860
)以与 MeetingMind 应用交互。
使用流程
- 上传音频文件:使用 Gradio 界面上传会议录音。
- 转录:应用将使用 OpenAI 的 Whisper 模型将口语内容转录为文本。
- 总结:IBM Watson AI 处理转录文本,生成会议的关键点总结。
- 查看结果:在 Gradio 界面中查看转录和总结的内容。
MeetingMind 的设计使得用户可以轻松地捕捉和总结会议内容,提高工作效率,特别适用于企业和教育环境。