综合介绍
PlayHT 是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。用户只需输入文本,选择合适的语音风格,就能生成高质量的MP3或WAV音频文件。PlayHT还支持语音克隆功能,可以根据提供的音频样本复制特定声音,非常适合品牌定制化需求。界面简单直观,操作方便,无论是个人创作者还是企业用户,都能轻松上手,快速产出专业级音频内容。
功能列表
- 文本转语音:将输入的文字快速转化为自然流畅的语音,支持多种语速和语调调整。
- 语音克隆:上传音频样本即可复制特定声音,用于个性化语音生成。
- 多语言支持:提供60多种语言和口音选择,满足全球用户需求。
- 音频编辑:通过SSML(语音合成标记语言)调整发音、停顿、语调等细节。
- 音频导出:支持MP3和WAV格式下载,便于在不同平台使用。
- 播客托管:直接将生成的音频发布到iTunes、Spotify等主流播客平台。
- WordPress插件:将博客文章转为音频并嵌入网站,提升内容可访问性。
- 实时流式生成:通过PlayHT Turbo技术实现300毫秒内生成语音,适合实时应用。
- API集成:为开发者提供API接口,轻松嵌入语音功能到其他应用。
使用帮助
PlayHT是一个无需安装的在线工具,用户只需访问官网即可体验其功能。以下是具体使用步骤:
注册与登录
- 打开浏览器,输入网址https://play.ht/,进入PlayHT官网。
- 点击右上角的“Sign Up”按钮,可以选择使用Google账号快速注册,或输入邮箱和密码手动注册。
- 注册完成后,系统会发送一封验证邮件,点击邮件中的链接激活账号。
- 登录后,新用户可免费试用,生成5000字符的语音内容。
生成文本转语音
- 输入文本:登录后,进入主界面,找到文本输入框,直接粘贴或手动输入需要转为语音的文字。
- 选择语音:在语音选择栏中,浏览超过600种AI语音选项。可以按语言(如英语、西班牙语、中文等)、性别或风格(自然、正式、活泼)筛选。点击语音名称旁的小喇叭图标可试听。
- 调整参数:点击“Advanced Settings”(高级设置),使用SSML代码调整语速(Speed)、音高(Pitch)或添加停顿。例如,输入
<break time="1s"/>
可在句子间停顿1秒。 - 生成音频:设置完成后,点击“Generate”(生成)按钮,等待几秒即可预览音频。
- 下载文件:满意后,点击“Download”选择MP3或WAV格式导出到本地。
使用语音克隆功能
- 准备样本:录制一段清晰的音频(建议45秒以上,使用高质量麦克风),保存为MP3或WAV格式。
- 上传音频:在“Voice Cloning”(语音克隆)选项卡中,点击“Upload”(上传),选择准备好的文件。
- 命名克隆:为你的克隆语音取一个名字,例如“我的品牌音”。
- 生成与测试:提交后,系统会处理并生成克隆语音,通常需要几分钟。完成后,可在语音列表中找到并测试。
- 应用克隆:在文本转语音界面选择你的克隆语音,输入文本后生成个性化音频。
发布播客
- 创建音频:按上述步骤生成音频文件。
- 进入播客模块:在左侧导航栏选择“Podcast Hosting”(播客托管)。
- 上传与设置:上传音频,填写标题、描述和类别等信息。
- 发布:点击“Publish”(发布),选择目标平台(如Spotify、Google Podcasts),按提示完成提交。
集成WordPress插件
- 下载插件:在PlayHT官网找到“WordPress Plugin”页面,下载插件文件。
- 安装插件:登录WordPress后台,进入“插件”>“添加新插件”,上传下载的插件文件并激活。
- 配置插件:在WordPress左侧菜单找到“PlayHT”选项,输入你的PlayHT账户API密钥(在官网“Account”页面获取)。
- 转换文章:打开任意文章编辑页面,点击“Convert to Audio”(转为音频),选择语音后生成并嵌入播放器。
API使用(开发者向导)
- 获取API密钥:登录PlayHT账户,在“Developer”或“API”页面生成密钥。
- 阅读文档:访问https://docs.play.ht,查看详细的API参数和示例代码。
- 测试调用:使用工具如Postman,输入API端点(例如
https://api.play.ht/v1/convert
),设置文本和语音参数,发送请求即可获取音频流。
注意事项
- 免费计划每月限制5000字符,超出后需订阅专业版(每月39美元起)。
- 语音克隆需提供高质量样本,低质量音频可能导致效果不佳。
- 生成的长音频建议分段处理,以确保稳定性和速度。
特色功能操作详解
- 实时流式生成(Turbo模式):在“Playground”页面体验PlayHT Turbo,输入文字后,系统会在300毫秒内开始流式输出语音,适合实时聊天或互动应用。
- 多语音对话:在文本框中为不同角色分配语音,例如“[Voice1] 你好 [Voice2] 你好啊”,生成类似对话的音频。
- 情感控制:部分高级语音支持情感调节(如开心、悲伤),在生成前选择对应选项,增强表达力。
通过以上步骤,用户可以轻松掌握PlayHT的核心功能,无论是制作播客、教学音频还是营销语音,都能快速上手并获得专业效果。