はじめに
AI-ClothingTryOnは、開発者のspeedTDによって作成され、GitHubでホストされているオープンソースのPythonベースのデスクトップアプリケーションです。Googleの ジェミニ ユーザーが人物の写真と洋服の写真をアップロードすることで、バーチャルな試着結果を生成する人工知能技術。ユーザーは服の着心地を確認し、購入するかどうかの判断に役立てることができる。このアプリケーションはPyQt6を使用しており、以下のような直感的なインターフェイスを実現している。 ジェミニAPI 画像を加工してリアルなフィッティング結果を生成します。このツールは、オンラインショッピングの愛好家だけでなく、AI技術を研究したい開発者にも適しています。このプロジェクトは、EXEファイルとソースコードの2つの使用方法を提供し、異なるユーザーに便利です。
機能一覧
- 写真のアップロードキャラクター写真と服の写真を別々にアップロードできます。
- フィッティング結果の生成一度に10種類のフィッティング結果画像を生成します。
- カスタムヒントテキストプロンプトを入力し、AI生成効果を調整することができます。
- 結果を保存お気に入りのフィッティング画像をローカルに保存できます。
- 直感的なインターフェース操作しやすいグラフィカル・インターフェースを提供。
- バッチファイル複数画像の同時処理に対応し、処理効率を向上。
ヘルプの使用
AI-ClothingTryOnは、コンパイル済みのEXEファイルから直接使用することも、ソースコードから実行することもできるデスクトップツールです。以下は、すぐに使い始められるよう、インストールと使い方の詳しいガイドです。
設置プロセス
方法1:EXEファイルを使用する(一般ユーザー向け)
- ダウンロードプログラム
- GitHubのページhttps://github.com/speedTD/AI-ClothingTryOn。
- リリースセクションから最新版のEXEファイルをダウンロードしてください。
- ブラウザがEXEのダウンロードをブロックしている場合は、別のリンクからZIPファイルをダウンロードしてください:
https://mega.nz/file/pYpkQbzJ#exFxB7T2QhQFbMUzza1xx_KeAajMreSy3MdBgZOKuQM
- ZIPファイルをダウンロードして解凍したら
AI-ClothingTryOn.exe
.
- ランニングプログラム
- ダブルクリック
AI-ClothingTryOn.exe
打ち上げだ。 - 初めて実行する際には、Google Gemini API Keyの入力を求められます。
- ダブルクリック
- APIキーの設定
- キーを取得するには、以下の「Google Gemini APIキーを取得する」のセクションを参照してください。
- プログラムのポップアップ・ウィンドウにキーを入力するか、プロジェクトのルート・ディレクトリの
api_key.txt
ドキュメンテーション
方法2:ソースコードの使用(開発者向け)
- 環境を整える
- Python公式サイトからPython 3.8以上をインストールする。
- Gitツールをインストールし、Gitのウェブサイトからダウンロードする。
- Gemini APIを呼び出すためのインターネット接続があることを確認してください。
- ダウンロードコード
- ターミナルを開き、以下のコマンドを入力してプロジェクトをクローンする:
git clone https://github.com/speedTD/AI-ClothingTryOn.git
- プロジェクト・カタログにアクセスする:
cd AI-ClothingTryOn
- ターミナルを開き、以下のコマンドを入力してプロジェクトをクローンする:
- 依存関係のインストール
- 以下のコマンドを実行して、必要なライブラリをインストールする:
pip install -r requirements.txt
- 不足している場合
requirements.txt
コア・ライブラリを手動でインストールする:pip install pyqt6 google-generativeai pillow
- 以下のコマンドを実行して、必要なライブラリをインストールする:
- ランニングプログラム
- 開始するコマンドを入力する:
python main.py
- 開始するコマンドを入力する:
Google Gemini APIキーを取得する
- ブラウザを開き、Google AI Studioにアクセスする。
- Googleアカウントでログインします。
- ページで "API Keys "オプションを見つけ、"Create new key "をクリックする。
- 生成されたAPI Keyをコピーします。
- そのキーをプログラムのプロンプト・ボックスに貼り付けるか、または
api_key.txt
ドキュメンテーション
主な機能
写真のアップロード
- プログラムを起動すると、インターフェイスに2つのボタンがあります:"人物の写真を選択 "と "服の写真を選択"。
- 写真を選択」をクリックし、鮮明な全身写真(JPGまたはPNG形式を推奨)をアップロードしてください。
- Select Clothes Photo "をクリックし、あなたの洋服の写真をアップロードしてください。
- 写真は自動的に
uploads/
フォルダー
フィッティング結果の生成
- 写真をアップロードしたら、「試着写真を10枚作成」ボタンをクリックしてください。
- このプログラムはGoogle Gemini APIを呼び出し、フィッティングの10種類の画像を生成する。
- 生成プロセスには、ネットワークの速度や画像サイズにもよりますが、数秒から数分かかります。
- 結果はインターフェイスに表示され、また
results/
フォルダー
カスタムヒント
- インターフェイスのテキストボックスには、「アウトドアシーンでの着用」や「タイトフィットの調整」などのプロンプトを入力できる。
- AIはプロンプトに従って結果を調整する。
結果を保存
- 生成された10枚の画像の下に「保存」ボタンがある。
- 保存」をクリックし、保存パスを選択すると、画像がJPG形式で保存されます。
ほら
- 映像条件人物の写真は全体が見えるように、衣服の写真はクリアで背景が邪魔にならないように。
- ネットワーク要件Gemini APIを呼び出すには、アプリケーションがネットワークに接続されている必要があります。
- 料金のお知らせGoogle Gemini APIは、利用状況により料金が発生する場合がありますので、Googleの公式価格をご確認ください。
- エラー処理プログラムがクラッシュする場合は、API Keyが正しいか、ネットワーク接続が機能しているかを確認してください。
高度な使用
- 調整コード開発者は
main.py
例えば、生成される画像の数を増やしたり、インターフェースを最適化したり。 - マルチスレッド最適化プログラムは複数のスレッドを使って画像を処理し、プログラミングに詳しいユーザーはスレッドのパラメーターを調整して速度を上げることができます。
- 貢献プロジェクトもし問題を見つけたり、改善の提案があれば、プロジェクトをフォークしてPull Requestを提出することができます。
以上の手順で、AI-ClothingGENERATEを使った試着が可能になり、AIの便利さを体験できる。
アプリケーションシナリオ
- オンラインショッピングの決断
ユーザーはeコマース・プラットフォームで洋服を見て、このツールを使って自分の写真と洋服の写真をアップロードすることで、試着効果を生み出し、購入に適しているかどうかを判断する。 - 衣服マッチングテスト
さまざまな服の組み合わせを試したいユーザーは、複数の服の写真をアップロードすることで、複数の試着結果を生成し、ベストマッチを見つけることができる。 - AI技術学習
学生や開発者はプロジェクトのコードを学び、Google Gemini APIとPyQt6を使ってデスクトップアプリケーションを開発する方法を学ぶことができます。
品質保証
- このツールは無料ですか?
プロジェクト自体は無料であるが、Google Gemini APIを使用する場合、Googleのレートによっては料金が発生する場合がある。 - ネットワークは必要か?
はい、このプログラムはGoogle Gemini APIに依存しており、画像を生成するにはネットワークに接続する必要があります。 - 世代効果は本当なのか?
結果は写真とキュー・ワードの質に左右される。ほとんどが現実的だが、複雑な背景が結果に影響することもある。 - 一度に複数のドレスを試着できますか?
現在のバージョンは一度に1着を処理するため、複数着を処理するには複数回の実行が必要です。