Memo AI：视频转字幕、转换多语言字幕的本地客户端

综合介绍

MemoAI是一款功能强大的视频翻译工具，专门用于将视频和音频文件转换为文本、字幕和笔记。不论是YouTube视频、播客还是本地文件，MemoAI都能轻松处理。支持中、英、日等90多种语言的转录与翻译。MemoAI利用最新的AI技术，提供实时字幕、语音合成、智能摘要等功能，并通过NVIDIA和Apple Silicon GPU加速处理，确保快速、高效且安全。用户可以为AI助手定制提示，并保持所有数据处理在本地，即便离线仍能保持隐私。

MemoAI免费版可使用绝大多数功能，仅限制使用GPU或某些运行效率更高的模型。

Memo

功能列表

视频转文字
多语言支持
翻译音频
语音合成
GPU加速处理
悬浮笔记
实时字幕
本地媒体文件支持
音频片段剪辑
自定义AI提示
AI智能摘要
导出选项（字幕、Markdown、Notion格式）
跨平台（Windows, macOS）
免费Beta试用

使用帮助

下载并安装MemoAI客户端
导入视频或音频文件
选择需要的功能，例如转录、翻译或语音合成
配置GPU加速选项以提高处理速度
导出最终结果为需要的格式

语音识别服务设置

根据视频中朗读语言，下载合适的语音识别模型，模型越大，生成速度越慢。有些模型是Momo AI单独针对中文或英文优化的，可以使用小尺寸模型即可得到优秀的语音识别效果。语音识别服务是将语音转换为字幕文本。

文本翻译相关设置

大语言模型用于文本翻译，可选择云端大模型API，或Ollama本地大模型。

Ollama本地大模型配置：输入本地API地址，默认端口是11434，并选择一个已部署的本地模型。

调试翻译提示词：测试单行文本、多行文本翻译效果，不满意可以在此调试。

语音合成服务设置

将字幕从A语言翻译成B语言文本后，希望视频用B语言朗读，需要在语音合成中设置。

Edge TTS是微软免费语音合成接口，其他都是云端语音合成API接口（需付费）。

如果对上述语音合成服务不满意，也可以导出字幕后，使用其他第三方语音合成工具生成语音。

多朗读人识别设置

视频中有多个角色发言，语音识别服务都可以识别出来。

主要功能操作区

功能依赖完整的设置，请使用前进行完整设置：

转写/重新转写：语音转换为字幕
翻译：当前字幕转换为其他语言字幕
语音合成：字幕合成语音朗读

Memo定价套餐

Memo AI 绝大部分功能都是免费提供与使用，如基础模型语音转写文本不限制分钟，本地字幕不限制翻译数量，字幕合成语音不限制合成数量。

同样Memo也有一些高级功能需要 Memo Pro 才能解锁。考虑 Memo 还在持续迭代中，为此Memo针对 Memo Pro 和 Memo Believer 提供了近五折的优惠价格。

🎉 Memo Pro（年费版）	💗 Memo Believer（永久版）
内测价格	$25.99 (~~$39.99~~)	$99.99 (~~$199~~)
设备数量	2 设备	3 设备
更新时间	一年内更新	永久更新
高级功能	GPU 加速，高质量模型，批量模式，多格式导出，语音合成	与 Pro 版本相同
服务支持	邮件支持	微信一对一支持 + 股东群
额外福利	无	新产品 100% 折扣
购买链接	升级 Memo Pro	成为 Memo Believer
限时优惠	搜索微信 memohq 获取折扣价	搜索微信 memohq 获取折扣价