综合介绍
Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统。该项目特别针对工程开发场景进行优化,提供了完整的语音交互界面和命令执行框架。系统采用模块化设计,包含基础助手聊天接口和高级的Typer助手会话命令系统,支持实时语音识别和文本转语音功能。通过集成ElevenLabs的语音合成技术和RealtimeSTT的实时语音识别能力,项目为开发者提供了一个完整的AI助手开发范式,使创建智能语音助手变得更加简单和高效。
功能列表
- 实时语音识别和响应系统
- 基于Deepseek-V3的智能对话引擎
- 可定制的Typer命令执行框架
- 多模式运行支持(默认、执行、无记忆执行)
- 动态记忆管理系统(Scratchpad)
- 高度可配置的助手架构
- 本地语音识别支持
- ElevenLabs高质量语音合成集成
- 可扩展的命令模板系统
- 实时交互式会话能力
使用帮助
1. 环境配置
1.1 基础配置
- 首先克隆项目到本地
- 复制环境配置文件:执行
cp .env.sample .env
- 更新API密钥:
- 设置 DEEPSEEK_API_KEY(用于AI模型访问)
- 设置 ELEVEN_API_KEY(用于语音合成)
- 执行
uv sync
同步依赖 - 可选:安装Python 3.11(使用命令
uv python install 3.11
)
1.2 系统要求
- Python 3.11或更高版本
- 稳定的网络连接
- 麦克风设备(用于语音输入)
- 音频输出设备
2. 主要功能使用说明
2.1 基础助手聊天界面
- 启动命令:
uv run python main_base_assistant.py chat
- 这将打开一个基础的对话界面
- 可以直接进行文本或语音交互
- 使用本地TTS进行语音响应
2.2 Typer助手会话命令系统
- 启动命令:
uv run python main_typer_assistant.py awaken --typer-file commands/template.py --scratchpad scratchpad.md --mode execute
- 参数说明:
- --typer-file:指定命令模板文件位置
- --scratchpad:设置助手的动态记忆文件
- --mode:设置运行模式(default/execute/execute-no-scratch)
2.3 与助手交互
- 清晰发音"Ada"唤醒助手
- 说出指令,例如:"Ada, ping the server wait for a response"
- 助手会实时识别语音并执行相应命令
- 执行结果会记录在scratchpad.md文件中
3. 架构组件说明
3.1 Typer助手架构
- 大脑:使用Deepseek V3作为核心AI引擎
- 任务处理:通过prompts/typer-commands.xml定义
- 动态内存:使用scratchpad.txt进行状态管理
- 语音识别:采用RealtimeSTT实现实时语音转文本
- 语音合成:集成ElevenLabs提供自然语音输出
3.2 基础助手架构
- 核心引擎:使用ollama:phi4
- 简化设计:无需额外提示或动态内存
- 语音识别:同样使用RealtimeSTT
- 语音输出:采用本地TTS系统
4. 高级功能配置
- 可通过assistant_config.yml文件自定义助手配置
- 支持添加自定义Typer命令
- 可以调整语音识别和合成参数
- 支持扩展新的功能模块