综合介绍
MoneyPrinterPlus 是一个开源项目,旨在通过AI技术一键生成和混剪各类短视频,并自动发布到多个视频平台,如抖音、快手、小红书和视频号。该工具支持本地和云端语音模型,包括chatTTS、fasterwhisper、GPTSoVITS,以及Azure、阿里云和腾讯云的语音服务。MoneyPrinterPlus 还集成了Stable Diffusion和comfyUI,能够直接生成AI图片。这个项目让短视频的批量生成和发布变得前所未有的简单和高效。
功能列表
- AI视频批量生成:使用AI大模型技术,一键生成各类短视频。
- 视频混剪:批量混剪短视频,生成大量不重复的视频内容。
- 自动视频发布:自动将视频发布到抖音、快手、小红书和视频号等平台。
- 支持多种语音模型:包括本地和云端的chatTTS、fasterwhisper、GPTSoVITS等。
- AI图片生成:集成Stable Diffusion和comfyUI,直接生成AI图片。
安装
前提条件
- 确保你有Python 3.10+的运行环境。如果是windows, 请确保安装了python路径已经添加到了PATH中。
- 确保你有ffmpeg 6.0+的运行环境。如果是windows, 请确保安装了ffmpeg路径已经添加到了PATH中。没有安装ffmpeg的朋友,请通过 https://ffmpeg.org/ 来安装对应的版本。
手动安装
如果python和ffmpeg环境都有了。那么就可以通过pip安装依赖包了。
pip install -r requirements.txt
自动安装
进入项目目录,windows下双击执行:
setup.bat
mac或者linux下执行:
bash setup.sh
运行
使用下面命令运行程序:
streamlit run gui.py
自动运行
如果你使用了自动安装脚本,那么可以执行下面的脚本来自动运行。
windows下,双击 start.bat
mac或者linux下执行:
bash start.sh
在日志文件中可以看到程序运行的日志信息。
里面有浏览器的地址,可以通过浏览器打开这个地址来访问程序。
打开之后,你会看到下面的界面:
左侧目前有三项配置, 分别是基本配置,AI视频和混剪视频(开发中)。
基本配置
1. 资源库
目前资源支持:
- pexels: www.pexels.com Pexels 是世界上著名的免费图片,视频素材网站。
- pixabay: pixabay.com
大家需要到对应的网站上注册一个key来实现API调用。
后续会陆续添加其他资源库。如(videvo.net,videezy.com 等)
2. 音频库
目前文字转语音和语音识别功能支持:
- Azure的cognitive-services服务。
- 阿里云的智能语音交互
- 腾讯云语音技术功能(https://console.cloud.tencent.com/asr)
- Azure:
大家需要到 https://speech.microsoft.com/portal 这里注册一个key。
Azure对新用户是1年免费的。费用也是比较便宜。
- 阿里云:
大家需要到 https://nls-portal.console.aliyun.com/overview 这里开通服务,并添加一个项目。
需要开通阿里云智能语音交互功能--必须开通语音合成和录音文件识别(极速版)这两个功能.
- 腾讯云:
腾讯云语音技术功能(https://console.cloud.tencent.com/asr) 开通语音识别和语音合成功能。
后续会添加本地语音识别大模型。但是文字转语音还是微软的服务最为优秀。
3. LLM大模型
大模型区目前支持Moonshot,openAI,Azure openAI,Baidu Qianfan, Baichuan,Tongyi Qwen, DeepSeek这些。
推荐使用Moonshot。
会陆续添加市面上其他流行的大模型。
Moonshot API获取地址: https://platform.moonshot.cn/
baidu qianfan API获取地址:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/yloieb01t
baichuan API获取地址: https://platform.baichuan-ai.com/
阿里tongyi qwen API获取地址: https://help.aliyun.com/document_detail/611472.html?spm=a2c4g.2399481.0.0
DeepSeek API获取地址: https://www.deepseek.com/
1. AI视频
基本配置设置完毕之后。就可以进入到AI视频了。
生成视频文案
首先,我们给一个关键词,然后用大模型生成视频文案:
可以选择视频的文案语言,视频时长。
如果大家对视频文案和关键词不满意的话,可以手动修改。
视频配音和背景音乐
可以选择配音的语言和配音的语音。
还支持配音语速调节。
后续会支持语音试听功能。
背景音乐放在项目的bgmusic文件夹中。
目前里面只有两个背景音乐。大家可以自行添加自己需要的背景应用。
视频配置
视频配置区,大家可以选择视频的布局,视频帧率,视频尺寸。
视频片段最小长度和最大长度。
还可以开启视频转场效果。目前支持30+转场效果。
后续会添加使用本地视频资源功能。
字幕配置
字幕文件位于项目根目录的fonts文件夹。
目前支持宋体和苹方两个字体集合。
可以选择字幕位置,字幕颜色,字幕边框颜色和字幕边框宽度。
生成视频
最后,就可以点击生成视频生成视频了。
会在页面上列出具体的步骤名称和进度。
生成视频完成后,视频会显示在最下方,大家直接可以播放观看效果。
2. 批量视频混剪
启动项目之后,左上角可以找到视频混剪区。
点击它,进入到视频批量混剪工具页面。
在视频混剪区,我们最多可以配置5个视频片段。
你可以通过点击添加片段或者删除片段来控制片段区域的多少。
什么是视频片段?
那么有朋友会问了,什么是视频片段呢?
一个长视频,里面不可能只有一个视频主题,可能你的视频前半部分讲的是衣服的版型,后半部分讲的是衣服的材质。
那么衣服的版型就是片段1,材质就是片段2。
我们要做的就是收集衣服版型的素材,可以是mp4视频,也可以是jpg,png等图片资源。分辨率尽量大一点,否则后面生成的视频质量就不太好。
然后把衣服版型的素材放到视频片段1的资源目录中。
比如上图的资源目录中:
d:\downloads\work\scen1
同样的,我们把衣服的材质的素材放到视频片段2的资源目录中。
如下所示:
什么是视频资源文案呢?
视频资源文案就是你需要给这段视频片段配的文字描述。
你可以为一个片段准备很多条文案,然后把这些文案放在一个txt文件中。一条文案放在txt文件中的一行。
系统会随机从txt文件中挑选一行最为最终视频片段的文字描述。
下面是一个文案文件的例子:
精准的剪裁,流畅的线条,这款马甲的版型设计,完美贴合身形,无论是宽松还是修身,都能展现你的优雅姿态。
我们的设计师们,将经典与现代完美融合。每一道线条,每一个剪裁,都是为了展现你的独特身形。
每一刀剪裁,都经过精心计算,只为打造最适合你身形的版型。从肩部线条到腰部剪裁,每一处都彰显着你的独特风格。
精准的剪裁,流畅的线条,这款马甲的版型设计,旨在让每一位穿着者都能感受到定制般的贴合。
精准剪裁流畅线条,马甲版型设计完美贴合身形,宽松或修身皆展现优雅姿态。
设计师将经典与现代融合,每道线条每个剪裁展现独特身形。
精心计算每一刀剪裁,打造适合身形的版型,肩部线条至腰部剪裁彰显独特风格。
剪裁精准流畅,马甲版型旨在定制般贴合,展现穿着者个性魅力。
面料精选剪裁精致,马甲版型以优雅线条展现身形,正式或休闲皆完美。
人体工学设计,马甲版型舒适透气,优雅线条展现身形,每次穿搭成焦点。
经典版型现代演绎,马甲独特剪裁设计,穿着成展现个性品味舞台。
细节精心打磨,马甲版型合体剪裁优雅设计,任何场合自信满满。
舒适型格并存,马甲版型精致剪裁舒适面料,工作休闲展现最佳状态。
时尚马甲版型多样,每款为你而生,经典剪裁现代设计,轻松驾驭各种风格。
优雅线条修身设计,马甲版型考究剪裁精致细节,任何场合成焦点,彰显个人风格。
配置好的你的视频片段跟视频文案。
视频配音区
在视频配音区可以选择配音语言和对应的配音语言,目前支持100+配音语言。
还可以选择不同的配音语速,以支持不同使用场景。
如果你对配音不太确定,可以点击试听声音试听对应的配音语音。
背景音乐
背景音乐放在项目下的bgmusic目录下面,你可以自行添加背景音乐文件到该文件夹下面。
可以选择是否开启背景音乐,和默认的背景音乐音量。
视频配置区
视频配置区可以选择视频布局:竖屏,横屏或者方形。
可以选择视频帧率,视频的尺寸。
还可以选择每个视频片段的最小长度和最大长度。
最最重要的,还可以开启视频转场特效。目前支持30+视频转场特效。
字幕配置
如果你需要字幕,那么可以点击开启字幕选项,可以设置字幕字体,字幕字体的大小和字幕颜色等。
如果你不知道怎么设置,选择默认即可。
最后的视频生成
目前系统支持一次批量生成100个视频,根据你自己的需要自行调整。
最后点击生成视频按钮即可生成视频。
页面会有相应的进度提醒。
最后生成的视频会展示在页面最下面,大家可以自行播放。
如果你生成了多个视频,可以在项目文件夹的final目录中找到你批量生成的视频。
3. 批量短视频上传
工作原理
自动发布工具的本质上是基于selenium这个自动化框架实现的。
通过模拟人工的点击操作,可以完成绝大多数需要人手工才能完成的工作。解放大家的双手。
另外这个自动化的实现方式有两种,一种是在运行程序的过程中启动一个浏览器。另外一种是依附到现有的浏览器上来操作现有浏览器的页面。
本工具选择的是依附到现有的浏览器上。
主要是因为有些视频平台需要用手机扫码二维码才能登录。所以在程序中很难模拟这种登录的过程。
前提条件
目前自动发布支持chrome和firfox两种浏览器。大家根据需要自行选择一种即可。
1. chrome配置
现在的主流浏览器肯定是chrome无疑了。所以我们首先聊一聊如何实现对chrome浏览器的支持。
- 首先你需要下载安装Chrome,记住你的版本号,你可以从chrome官网上下载chrome,也可以从这个页面去下载 ChromeDriver下载页面。
- 你需要从ChromeDriver下载页面下载与你的Chrome浏览器版本相对应的ChromeDriver。确保你下载的是与你的操作系统和Chrome版本相匹配的版本。
下载完毕之后,把chromeDriver解压到本地目录,目录的路径最好不要带中文。不能保证能正常运行。
- chrome 以debug模式启动
如果是mac电脑,那么可以先给chrome设置一个alias
alias chrome="/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome"
以debug模式启动chrome。
chrome --remote-debugging-port=9222
如果你是windows,可以在chrome的桌面快捷方式,右键目标中添加:
--remote-debugging-port=9222
然后双击即可以debug模式打开chrome。
2. firefox配置
除了chrome之外,用的最多的应该就是firefox了。
所以我们也提供了对firefox的支持。
要想使用firefox,你需要下面几步:
- 下载并安装 Firefox。
- 下载geckodriver 驱动.下载与你的Firefox浏览器版本相对应的geckodriver。确保你下载的是与你的操作系统和Firefox版本相匹配的版本。
下载完毕之后,把geckodriver解压到本地目录,目录的路径最好不要带中文。不能保证能正常运行。
- 以debug模式启动firefox:
和chrome类似,我们在firefox的启动命令之后加上:
-marionette -start-debugger-server 2828
注意,这里的端口一定要是2828,不能自定义。
这时候你如果打开firefox,就会看到导航栏变成了红色,表示你已经启动了远程调试模式。
输入about:config
可以看到marionette.port的端口就是2828。
开始使用
windows环境下,直接双击start.bat即可启动。
mac环境下,在项目根目录下面执行sh start.sh即可。
浏览器会自动打开MoneyPrinterPlus的首页。
点击左边的视频自动发布工具,可以看到视频自动发布工具的页面。
你可以选择驱动类型。chrome还是firefox。
驱动位置就是之前下载的chromedirver或者geckodriver的位置。
视频内容所在目录,就是你想要发布的视频目录。
当你修改视频目录之后,会自动列出视频目录里面的视频文件和文本文件。
其中视频文件就是你要发布的视频内容。
文本文件是什么呢?
文本文件是和视频配套的文字内容。
举个例子, 我想要发布一个关于唐诗的视频到网站上,那么对应的文本文件内容如下:
王维:酬郭给事
洞门高阁霭馀辉,桃李阴阴柳絮飞。
禁里疏钟官舍晚,省中啼鸟吏人稀。
晨摇玉佩趋金殿,夕奉天书拜琐闱。
强欲从君无那老,将因卧病解朝衣。
大家记住,第一行一定是视频的标题。
其他行的内容,大家自由决定。
然后我们看下面的页面:
视频网站配置应该很直白了,上过幼儿园的朋友应该都能懂。
标题前缀:如果你需要额外给视频标题添加一些前缀,可以在这里设置。
合集名称:有些视频网站需要选择合集。这里就是合集的名字。(程序不会帮你创建合集,你需要自己提前在网站上创建。)
视频标签:很好理解了,就是标签,用空格分割。
快手还有一个额外的领域配置。
你可以选择是否开启抖音,快手,视频号或者小红书。
环境检测
接下来就可以准备发布视频了。
但是在发布之前,你可以点一下环境检测。
如果自动打开了我的主页,那么就说明你的环境配置是没问题的。接下来就可以发布视频了。
发布视频
因为所有的视频网站都需要登录。所以在点击发布视频按钮之前,你需要打开对应的网站,登录你的账号先。
如果你的账号都登录完毕了,点击发布视频按钮吧。
开启你的自由之旅。
运行的界面大概如下: