综合介绍
MiniMax Audio 是 MiniMax 公司推出的一款 AI 语音生成工具,核心特点是快速将文字转为高相似度的自然语音。它基于 Speech-02 模型,语音合成相似度高达 99%,音质达到录音室级别,支持超过 30 种语言和多种口音。用户可以输入文字、上传文件或链接,轻松生成音频,适合制作有声书、播客等内容。
国内版(hailuoai.com)和国际版(minimax.io)功能相似,国际版更注重超长文本处理(最高 20 万字符),还提供灵活的订阅计划。每日赠送4000信用点(约生成5分钟音频),付费版支持商业使用和更多功能,操作简单,深受创作者和开发者欢迎。
国内版目前限时免费,无使用限制。
-
海螺语音(国内版)
-
MiniMax Audio(国际版)
功能列表
- 文本转语音:输入文字,快速生成自然语音,支持多语言和音色。
- 语音克隆:上传 10 秒音频,复制高相似度的声音。
- 超长文本处理:国际版支持单次 20 万字符,国内版限 5000 或 10000 字符。
- 文件与链接支持:上传文件或输入 URL,提取文字生成音频。
- 情绪控制:调整语音情感,如开心、平静(付费版支持更多选项)。
- 多语言覆盖:支持 30 多种语言,免费版限 16 种。
- 历史管理:查看、删除或整理生成记录。
- API 集成:提供开发者接口,嵌入其他应用。
使用帮助
MiniMax Audio 无需安装,直接在网页操作。国内版和国际版使用方式基本一致,以下是详细指南。
如何开始使用
- 访问国内版 https://hailuoai.com/audio 或国际版 https://www.minimax.io/audio。
- 点击“登录”,用邮箱注册或登录账号。
- 登录后,进入主界面,包含文字输入框和功能选项。
生成语音的基本操作
- 输入文字:在文字框输入内容,如“欢迎使用 MiniMax Audio”。
- 选择语言和音色:选语言(如“中文”)和音色(如“男声-低沉”)。
- 生成音频:点击“生成”,几秒后试听或下载 MP3 文件。
- 查看消耗:国际版显示信用点(1 英文字符=1 点,1 中文字符=2 点),国内版一致。
使用文件或链接
- 上传文件:点击“上传文件”,支持 TXT、PDF 等,自动提取文字。
- 输入链接:粘贴网页 URL,点击“加载”获取内容。
- 生成流程:确认文字后点击“生成”,下载音频。
语音克隆功能
- 准备样本:录制 10 秒以上清晰音频,保存为 MP3 或 WAV。
- 上传并创建:在“语音克隆”选项上传,点击“创建语音”。
- 应用克隆:选择新音色,输入文字生成音频。
- 限制说明:免费版限 3 个克隆,Starter 版 10 个,Standard 版 100 个。
文本长度与信用点
- 国际版:单次支持 20 万字符,异步处理长文本。
- 国内版:HD 模式限 5000 字符,Turbo 模式 10000 字符。
- 国际版信用点:免费版每日赠 4000 点(约 5 分钟音频),Starter 版每月 10 万点(约 2 小时),Standard 版 100 万点(约 20 小时)。
订阅与充值(国际版)
- 免费版:每月约 2.5 小时音频,限 16 种语言。
- Starter 版:5 美元/月,约 4.5 小时,生成更快,支持商业使用。
- Standard 版:30 美元/月,约 22.5 小时,克隆上限更高。
- 充值:30 美元/100 万点,最低 5 美元,不含订阅功能。
API 使用方法
- 获取密钥:登录后在 https://www.minimax.io/platform/document/T2A%20V2 或国内版 API 页面申请
<API Key>
。 - 调用示例:
curl -X POST https://api.minimax.io/audio \
-H "Authorization: Bearer <API Key>" \
-H "Content-Type: application/json" \
-d '{"text": "你好,这是测试", "language": "zh", "voice": "female_gentle"}'
- 文档地址:国际版见上述链接,国内版见 https://hailuoai.com/api。
使用须知
- 国际版:需标注来源(个人使用),商用需订阅 Starter 或 Standard 版。
- 优化建议:音频不佳时调整音色或分段生成。
操作简单,几分钟就能上手,适合各种需求。
应用场景
- 有声书制作
将长篇文字转为音频,生成有声书分享或发布。 - 播客生产
输入脚本,快速生成播客,省去录音时间。 - 教育辅助
把课件转为语音,方便听讲或助视障者学习。 - 游戏配音
用语音克隆为角色生成独特声音,提升体验。
QA
- 国内版和国际版有何区别?
国际版支持 20 万字符超长文本,国内版限 5000 或 10000 字符但限时免费。 - 国际版免费版能用多久?
每日赠 4000 点,约 5 分钟音频,每月最多 2.5 小时。 - 支持哪些语言?
超过 30 种,免费版限 16 种,如中文、英语等。 - 语音克隆需要多长音频?
最少 10 秒清晰音频。 - 可以商用吗?
国际版需订阅 Starter 或 Standard 版,国内版未明确限制。