ListenHub CLI是什么
ListenHub CLI 是MarsWave AI推出的面向开发者和 AI Agent 生态的一站式内容引擎命令行工具,基于 Node.js 开发,采用 MIT 协议开源。开发者通过 npm install -g @marswave/listenhub-cli 安装后,可在 Claude Code、Cursor、Windsurf 等主流 AI Agent 中直接调用播客生成、AI 音乐、PPT 幻灯片、TTS 语音、解说视频和 AI 图像六大生成能力。

ListenHub CLI的功能特色
- 팟캐스트 생성:支持单人、双人对话及辩论模式,可基于文本主题或 URL 内容自动生成,提供 quick(精炼短内容)、deep(深度长内容)及先审后录模式。
- AI 음악:支持文本提示词生成原创曲目,可指定风格与标题;支持上传本地音频(mp3/wav/flac 等,最大 20MB)进行翻唱生成。
- PPT 幻灯片:根据给定主题自动生成带配音的完整演示文稿,支持指定模板类型、语言、尺寸、页数等参数。
- TTS 语音:多说话人、多语言的文本转语音,支持 FlowSpeech 通用智能口语模型。
- 解说视频:生成带 AI 视觉素材的旁白视频,是平台商业化的核心场景。
- AI 图像:支持文生图和本地参考图风格迁移,最多可上传多张参考图(jpg/png/webp,最大 10MB)。
- 本地文件上传:自动检测本地路径,验证格式与大小后上传至云端处理。
- 异步任务模式: 지원
--no-wait参数异步提交任务获取任务 ID,便于脚本串联。
ListenHub CLI的核心优势
- Agent 原生集成:专为 Claude Code、Cursor、Windsurf 等 AI 编程 Agent 设计,支持自然语言触发如"make a podcast"或"生成幻灯片"。
- OAuth 自动登录:浏览器授权登录,token 自动刷新存储于
~/.config/listenhub/credentials.json,无需手动管理凭证生命周期。 - 工程级可靠性:429 限流时自动读取 Retry-After 头并重试(默认 2 次),超时与最大重试次数可配置。
- MCP 프로토콜 지원:提供官方 MCP Server(@marswave/listenhub-mcp-server),支持 Stdio、HTTP SSE 和 HTTP Streamable 三种传输模式。
- JSON 输出支持:所有命令支持
--json参数,便于脚本化与程序化调用。 - 一站式内容引擎:将六类内容生成整合到统一 API 和 CLI 接口,降低多平台切换成本。
ListenHub CLI官网是什么
- GitHub 리포지토리:https://github.com/marswaveai/listenhub-cli
使用ListenHub CLI的操作步骤
- 환경 준비:确保 Node.js 版本 >= 20
- 全局安装: 실행
npm install -g @marswave/listenhub-cli - 로그인 인증: 구현
listenhub auth login,浏览器完成 OAuth 授权,token 自动存储 - 콘텐츠 생성:根据需求选择对应命令,如:
- 播客:
listenhub podcast create --query "AI 趋势" --mode deep - 音乐:
listenhub music generate --prompt "Chill lo-fi" --style "lo-fi" - PPT:
listenhub slides create --query "TypeScript 入门" - TTS:
listenhub tts create --text "你好世界" --lang zh - 사진:
listenhub image create --prompt "水彩风格" --reference ./sketch.jpg
- 비동기 처리추가
--no-wait获取任务 ID,后续通过listenhub creation get <id>查询状态 - Agent 集成(可选): 실행
npx skills add marswaveai/skills为 AI Agent 添加技能,或使用 MCP Server 接入 Claude CLI/Codex CLI
ListenHub CLI的适用人群
- AI 애플리케이션 개발자:需在 Agent 工作流中集成内容生成能力的开发者
- 콘텐츠 크리에이터:需要快速生成播客、解说视频、PPT 的自媒体运营者
- VibeCoding 实践者:通过自然语言指令驱动 AI 完成多媒体内容制作的轻量用户
- 自动化运维:需要将内容生成能力脚本化、批量化处理的工程师
- 跨境出海团队:需要多语言(中/英等)内容生成与本地化制作的团队
ListenHub CLI的常见问题 FAQ
Q:ListenHub CLI 是否完全免费?
A:CLI 和 SDK 采用 MIT 协议开源,可免费使用,但内容生成需调用 ListenHub 云端 API,需注册获取 API Key(格式为 lh_sk_ 开头),部分功能如内容解析、创作者工作流需额外申请权限。
Q:支持私有化部署吗?
A:当前开源的是接入层客户端,内容生成的推理和渲染仍在 ListenHub 服务端完成,不支持私有化部署。唯一例外是 ASR(语音转录)功能,可通过 coli 工具下载模型到本地(约 60MB)离线运行。
Q:生成内容需要多长时间?
A:正常情况下,播客需要 2-3 分钟,解说视频需要 3-5 分钟。如超过 10 分钟未完成,可能是服务端繁忙,可通过任务 ID 查询状态或重新提交。
Q:如何改善生成内容质量?
A:提供更具体的主题描述(如"AI 编程的三个核心范式转变"而非泛泛的"AI 编程");明确指定语言(中文/英文);使用 deep 模式获取深度长内容;或使用先审后录模式先审核文本稿再生成音频。
Q:可以用自己的稿子生成播客吗?
A:可以。使用先审后录播客的阶段二功能,提供自定义脚本 JSON 直接生成音频;或使用 TTS 多角色台词模式精确控制每句台词的音色分配。
Q:安装后提示"API Key 未配置"怎么办?
A:运行
export LISTENHUB_API_KEY="lh_sk_your_key_here" 临时设置,或将该命令添加到 ~/.zshrc 어쩌면 ~/.bashrc 使其永久生效。© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 게시물
댓글 없음...




