综合介绍
AI-ClothingTryOn 是一个基于 Python 的开源桌面应用程序,由开发者 speedTD 创建,托管在 GitHub 上。它利用 Google Gemini 人工智能技术,让用户上传人物照片和衣服图片,生成虚拟试穿效果。用户可以看到衣服穿在自己身上的样子,帮助决定是否购买。程序使用 PyQt6 打造直观界面,通过 Gemini API 处理图像,生成逼真的试穿结果。这个工具适合网购爱好者,也适合想研究 AI 技术的开发者。项目提供 EXE 文件和源代码两种使用方式,方便不同用户。
功能列表
- 上传照片:支持分别上传人物照片和衣服图片。
- 生成试穿效果:一次生成 10 张不同的试穿结果图片。
- 自定义提示:用户可输入文字提示,调整 AI 生成效果。
- 保存结果:可以将喜欢的试穿图片保存到本地。
- 直观界面:提供简单易用的图形界面,操作方便。
- 批量处理:支持同时处理多张图片,提高效率。
使用帮助
AI-ClothingTryOn 是一个桌面工具,可以通过预编译的 EXE 文件直接使用,也可以通过源代码运行。下面是详细的安装和使用指南,帮助你快速上手。
安装流程
方法 1:使用 EXE 文件(适合普通用户)
- 下载程序
- 访问 GitHub 页面 https://github.com/speedTD/AI-ClothingTryOn。
- 在 Releases 部分下载最新版本的 EXE 文件。
- 如果浏览器阻止下载 EXE,可以用备用链接下载 ZIP 文件:
https://mega.nz/file/pYpkQbzJ#exFxB7T2QhQFbMUzza1xx_KeAajMreSy3MdBgZOKuQM
- 下载后解压 ZIP 文件,找到
AI-ClothingTryOn.exe
。
- 运行程序
- 双击
AI-ClothingTryOn.exe
启动。 - 首次运行时,会提示输入 Google Gemini API Key。
- 双击
- 配置 API Key
- 参考下方“获取 Google Gemini API Key”部分,获取密钥。
- 将密钥输入程序弹窗,或保存到项目根目录下的
api_key.txt
文件中。
方法 2:使用源代码(适合开发者)
- 准备环境
- 安装 Python 3.8 或更高版本,下载地址:Python 官网。
- 安装 Git 工具,下载地址:Git 官网。
- 确保有互联网连接,用于调用 Gemini API。
- 下载代码
- 打开终端,输入以下命令克隆项目:
git clone https://github.com/speedTD/AI-ClothingTryOn.git
- 进入项目目录:
cd AI-ClothingTryOn
- 打开终端,输入以下命令克隆项目:
- 安装依赖
- 运行以下命令安装所需库:
pip install -r requirements.txt
- 如果缺少
requirements.txt
,手动安装核心库:pip install pyqt6 google-generativeai pillow
- 运行以下命令安装所需库:
- 运行程序
- 输入命令启动:
python main.py
- 输入命令启动:
获取 Google Gemini API Key
- 打开浏览器,访问 Google AI Studio。
- 使用 Google 账号登录。
- 在页面中找到“API Keys”选项,点击“创建新密钥”。
- 复制生成的 API Key。
- 将密钥粘贴到程序提示框,或保存到
api_key.txt
文件中。
主要功能操作
上传照片
- 启动程序后,界面上有两个按钮:“选择人物照片”和“选择衣服照片”。
- 点击“选择人物照片”,上传一张清晰的全身照(建议 JPG 或 PNG 格式)。
- 点击“选择衣服照片”,上传衣服图片(最好是正面展示,无遮挡)。
- 照片会自动保存到
uploads/
文件夹。
生成试穿效果
- 上传照片后,点击“生成 10 张试穿图片”按钮。
- 程序会调用 Google Gemini API,生成 10 张不同的试穿效果图。
- 生成过程需要几秒到几分钟,取决于网络速度和图片大小。
- 结果会显示在界面上,同时保存到
results/
文件夹。
自定义提示
- 在界面上的文本框中,可以输入提示词(prompt),比如“穿在户外场景”或“调整为紧身效果”。
- 输入后再次点击生成按钮,AI 会根据提示调整结果。
保存结果
- 生成的 10 张图片下方有“保存”按钮。
- 点击“保存”,选择保存路径,图片会存储为 JPG 格式。
注意事项
- 图片要求:人物照片需全身可见,衣服图片需清晰且无背景干扰。
- 网络需求:程序需要联网调用 Gemini API。
- 费用提醒:Google Gemini API 可能产生费用,具体取决于使用量,建议查看 Google 官方定价。
- 错误处理:如果程序崩溃,检查 API Key 是否正确,或确认网络连接是否正常。
进阶使用
- 调整代码:开发者可以修改
main.py
,比如增加生成图片数量或优化界面。 - 多线程优化:程序使用多线程处理图片,懂编程的用户可调整线程参数,提升速度。
- 贡献项目:发现问题或有改进建议,可以 Fork 项目,提交 Pull Request。
通过以上步骤,你可以用 AI-ClothingGENERATE试穿衣服,体验 AI 带来的便利。
应用场景
- 网购决策
用户在电商平台看中一件衣服,用这个工具上传自己照片和衣服图片,生成试穿效果,判断是否适合购买。 - 服装搭配测试
想尝试不同衣服组合的用户,可以上传多件衣服图片,生成多种试穿效果,找到最佳搭配。 - AI 技术学习
学生或开发者可以研究项目代码,学习如何用 Google Gemini API 和 PyQt6 开发桌面应用。
QA
- 这个工具免费吗?
项目本身免费,但使用 Google Gemini API 可能产生费用,具体看 Google 的收费标准。 - 需要联网吗?
是的,程序依赖 Google Gemini API,必须联网才能生成图片。 - 生成效果真实吗?
效果取决于照片质量和提示词。大部分情况下很逼真,但复杂背景可能影响结果。 - 可以一次试穿多件衣服吗?
当前版本一次处理一件衣服,多件需多次运行。