はじめに
BEN2(Background Erase Network 2)は、Prama LLCが開発したディープラーニングモデルで、特に画像から背景を自動的に除去し、前景画像を生成するように設計されています。このモデルは、革新的なCGM(Confidence Guided Matting)パイプラインを採用し、洗練ネットワークを通じてベースモデルの信頼度が低いピクセルを処理することで、より精度の高い前景セグメンテーションを実現する。BEN2は、DIS5kとPrama LLC独自の22Kセグメンテーションデータセットで学習され、特にヘアキーイング、4K処理、オブジェクトセグメンテーション、エッジ精密化において非常に優れた性能を発揮します。インストールパッケージはわずか1.13GBで、公式に導入されたインスタンスは、1080p画像のキーイングを6秒未満で行うことができ、4K画像の処理には約20秒かかります。
関連推薦removebg:ワンクリックで画像の背景を削除、removebgオンライン無料中国語版
機能一覧
- バックグラウンド除去画像から背景を自動的に除去し、バイナリマスクと前景画像を生成します。
- フォアグラウンドセグメンテーション様々な複雑なシーンのための高精度前景セグメンテーション。
- CUDAサポートGPUアクセラレーションに対応し、処理速度を向上。
- シンプルなAPI: 様々なアプリケーションに簡単に統合できるクリーンなAPIを提供します。
- 高解像度処理高解像度が要求される4K画像処理に対応。
- エッジ・リファインメントきめ細かなネットワークでエッジを処理することで、セグメンテーションの精度を高める。
- 迅速な処理公式の配備例では、1080p画像のキーイングは6秒、4K画像は約20秒で処理できる。
ヘルプの使用
設置プロセス
- クローン倉庫
git clone https://huggingface.co/PramaLLC/BEN2
cd BEN2
- 依存関係をインストールします:
pip install -r requirements.txt
使用プロセス
- 必要なライブラリとモデルをインポートする:
from PIL import Image
トーチをインポートする
from model import BEN_Base
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = BEN_Base().to(device).eval()
model.load_state_dict(torch.load('BEN_Base.pth'))
- 画像を読み込み、推論を行う:
image = Image.open('path_to_image.png')
mask, foreground = model.inference(画像)
mask.save('mask.png')
前景.save('前景.png')
主な機能
- バックグラウンド除去::
- 画像を読み込むと、モデルは自動的に背景マスクと前景画像を生成する。
- マスク画像は
マスク.png
前景画像は前景.png
.
- フォアグラウンドセグメンテーション::
- モデルはCGM(Confidence Guided Matting)パイプラインを通過し、前景を正確にセグメント化する。
- 複雑な背景や、髪、エッジなどのディテールが豊富な画像に最適です。
- 高解像度処理::
- 4K画像処理に対応し、高解像度画像のセグメンテーション効果を確保。
- 高精度で高品質な画像処理を必要とするアプリケーションシナリオに適しています。
- エッジ・リファインメント::
- 細かなネットワークでエッジを処理することで、セグメンテーションの精度を向上させる。
- 商品写真やポートレートなど、繊細なエッジ処理が必要な画像に特に適しています。
- 迅速な処理::
- 公式配備例では、1080p画像のキーイングは6秒、4K画像は約20秒で処理できる。
- 多数の画像を迅速に処理する必要があるアプリケーションシナリオに最適。