Qwen-Image-Edit - Ali Tongyi オープンソース画像編集モデル

44.7K 00

Qwen-Image-Editとは何ですか？

Qwen-Image-Editは、Ali Tongyiによって導入されたオールインワンの画像編集モデルです。クウェン・イメージアーキテクチャの構築。このモデルはセマンティック編集と外観編集の両方の機能を統合しており、画像に対して低レベルの視覚的外観編集（要素の追加、削除、修正など）と高レベルの視覚的セマンティック編集（IPの作成、オブジェクトの回転、スタイルの移行など）を行うことができます。このモデルは、中国語と英語のテキストの正確な編集をサポートし、元のフォント、フォントサイズ、スタイルを保持したまま、画像内のテキストを変更することができます。Qwen-Image-Editは、多くの公開ベンチマークでSOTA性能を実証しており、現在、以下のベンチマークに合格しています。 Qwenチャット経験。

Qwen-Image-Editの特徴

セマンティックエディタ元の画像の視覚的な意味を変えることなく、画像の内容を柔軟に変更することができます。
アピアランス・エディター画像の局所的な領域を正確に操作する能力。例えば、画像の要素を追加、削除、修正する一方で、他の領域は変更しないようにする。
精密なテキスト編集中国語と英語の二ヶ国語をサポートし、元のフォント、フォントサイズとスタイルを保持する前提の下で、多様なテキスト修正ニーズを満たすために、画像のテキストを追加、削除、変更することができます。

Qwen-Image-Editの主な利点

バイリンガル精密編集英語と中国語の二ヶ国語による優れた編集スキルを有し、画像本来のテキストスタイルを保ちながら、テキスト内容に的確な変更を加えることができる。
統合された編集能力このモデルは、セマンティック編集とアピアランス編集の長所を組み合わせたもので、画像全体のセマンティックの調整と、局所的なディテールの正確な処理を可能にします。
高性能Qwen-Image-Editは、SOTAの性能を持つ多くのベンチマークで良好な結果を出しています。
チェーン編集機能ステップ・バイ・ステップの補正に基づくチェーン編集をサポートし、複雑な画像コンテンツを希望の効果が得られるまで微調整できます。

Qwen-Image-Editの公式ウェブサイトは？

プロジェクトのウェブサイト:: https://qwenlm.github.io/blog/qwen-image-edit/
GitHubリポジトリ:: https://github.com/QwenLM/Qwen-Image
HuggingFaceモデルライブラリ:: https://huggingface.co/Qwen/Qwen-Image-Edit
オンライン体験デモ:: https://huggingface.co/spaces/Qwen/Qwen-Image-Edit

Qwen-Image-Editの対象者。

クリエイティブ・デザイナーをコンセプトに、バーチャルキャラクターの外見や衣装、背景などを素早く生成・修正し、オリジナルIPの多様な創造を完成させ、デザイン効率を高めている。
広告・ポスターデザイナーポスター内で直接テキスト内容を変更したり、フォント、フォントサイズ、色を調整することで、時間と労力を節約できます。
映画・ビデオプロデューサー映画やテレビのポストプロダクションで、シーンの要素やキャラクターの外観をすばやく調整したり、ビデオ画面のスタイルを現実からアニメスタイルに変換して、制作効率を高めることができます。
教育者歴史上の人物の肖像画や科学実験の模式図など、教育や学習のために必要な画像や図を素早く生成し、修正することができます。
個人ユーザー背景の変更、装飾要素の追加、衣服の修正など、個人的な写真をすばやく調整し、簡単にパーソナライズされた写真を作成できます。