AI个人学习
和实操指南

"Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统

综合介绍

Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统。该项目特别针对工程开发场景进行优化,提供了完整的语音交互界面和命令执行框架。系统采用模块化设计,包含基础助手聊天接口和高级的Typer助手会话命令系统,支持实时语音识别和文本转语音功能。通过集成ElevenLabs的语音合成技术和RealtimeSTT的实时语音识别能力,项目为开发者提供了一个完整的AI助手开发范式,使创建智能语音助手变得更加简单和高效。

\


 

功能列表

  • 实时语音识别和响应系统
  • 基于Deepseek-V3的智能对话引擎
  • 可定制的Typer命令执行框架
  • 多模式运行支持(默认、执行、无记忆执行)
  • 动态记忆管理系统(Scratchpad)
  • 高度可配置的助手架构
  • 本地语音识别支持
  • ElevenLabs高质量语音合成集成
  • 可扩展的命令模板系统
  • 实时交互式会话能力

 

使用帮助

1. 环境配置

1.1 基础配置

  • 首先克隆项目到本地
  • 复制环境配置文件:执行 cp .env.sample .env
  • 更新API密钥:
    • 设置 DEEPSEEK_API_KEY(用于AI模型访问)
    • 设置 ELEVEN_API_KEY(用于语音合成)
  • 执行 uv sync 同步依赖
  • 可选:安装Python 3.11(使用命令 uv python install 3.11

1.2 系统要求

  • Python 3.11或更高版本
  • 稳定的网络连接
  • 麦克风设备(用于语音输入)
  • 音频输出设备

2. 主要功能使用说明

2.1 基础助手聊天界面

  • 启动命令:uv run python main_base_assistant.py chat
  • 这将打开一个基础的对话界面
  • 可以直接进行文本或语音交互
  • 使用本地TTS进行语音响应

2.2 Typer助手会话命令系统

  • 启动命令:
uv run python main_typer_assistant.py awaken --typer-file commands/template.py --scratchpad scratchpad.md --mode execute
  • 参数说明:
    • --typer-file:指定命令模板文件位置
    • --scratchpad:设置助手的动态记忆文件
    • --mode:设置运行模式(default/execute/execute-no-scratch)

2.3 与助手交互

  • 清晰发音"Ada"唤醒助手
  • 说出指令,例如:"Ada, ping the server wait for a response"
  • 助手会实时识别语音并执行相应命令
  • 执行结果会记录在scratchpad.md文件中

3. 架构组件说明

3.1 Typer助手架构

  • 大脑:使用Deepseek V3作为核心AI引擎
  • 任务处理:通过prompts/typer-commands.xml定义
  • 动态内存:使用scratchpad.txt进行状态管理
  • 语音识别:采用RealtimeSTT实现实时语音转文本
  • 语音合成:集成ElevenLabs提供自然语音输出

3.2 基础助手架构

  • 核心引擎:使用ollama:phi4
  • 简化设计:无需额外提示或动态内存
  • 语音识别:同样使用RealtimeSTT
  • 语音输出:采用本地TTS系统

4. 高级功能配置

  • 可通过assistant_config.yml文件自定义助手配置
  • 支持添加自定义Typer命令
  • 可以调整语音识别和合成参数
  • 支持扩展新的功能模块
未经允许不得转载:首席AI分享圈 » "Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文