Qwen-Image - Tongyi Qianqian lance le modèle de base Open Source de Qwen-Image

Qu'est-ce que Qwen-Image ?

Qwen-Image est un modèle de base de génération d'images open source publié par l'équipe d'Alibaba Tongyi Qianqian. Avec 20 milliards de paramètres, il adopte l'architecture MMDiT (Multimodal Diffusion Transformer Architecture), qui intègre les trois modules de compréhension multimodale, de codage haute résolution et de modélisation de la diffusion.L'avantage principal de Qwen-Image réside dans le rendu puissant de textes complexes et les fonctions d'édition d'images précises, qui peuvent générer des images textuelles chinoises et anglaises contenant des mises en page multilignes et des détails fins, et prendre en charge diverses opérations, telles que la migration de style, les ajouts, les suppressions et les modifications. Il prend également en charge diverses opérations telles que la migration de style, les ajouts, les suppressions et les modifications. Qwen-Image est adapté à la conception d'affiches, à la production de PPT, au marketing de marque et à d'autres scénarios, et prend en charge l'expérience en ligne et le déploiement local, qui est disponible pour les utilisateurs via des plateformes telles que Hugging Face, ModelScope, etc.

Qwen-Image - 通义千问推出开源的文生图基础模型

Principales caractéristiques de Qwen-Image

  • Génération d'images
    • Génération multi-stylesLe logiciel permet de générer des dizaines de types d'images : réalistes, animées, cyberpunk, de science-fiction, minimalistes, rétro, surréalistes, à l'encre, etc.
    • rendu de texteLe système de gestion de l'information (SGI) : il peut gérer des mises en page multi-lignes, la sémantique au niveau du paragraphe et les détails fins, prendre en charge le bilinguisme et permettre des mises en page graphiques complexes à plusieurs endroits.
  • édition d'images
    • migration des styles: Convertit les images en un style artistique spécifique.
    • manipulation d'objetsInsérer et retirer des éléments de la scène avec précision.
    • Amélioration des détailsOptimiser la qualité locale de l'image : Optimiser la qualité locale de l'image.
    • rédacteur en chefModifier le texte incorporé dans l'image.
    • contrôle d'attitude: Ajustement des schémas de mouvement des personnages.
  • compréhension graphique
    • Détection d'objets et segmentation sémantique: Reconnaissance et segmentation d'objets dans une image.
    • Estimation de la profondeur/des contours étrangesLes données de base sont les suivantes : Estimation de la profondeur et détection des contours.
    • Synthèse des nouvelles perspectivesLes images : Générer des images à partir de différents points de vue.
    • Reconstruction à super-résolutionAmélioration de la résolution de l'image.

Adresse du projet Qwen-Image

  • Dépôt GitHub: : https://github.com/QwenLM/Qwen-Image
  • Bibliothèque de modèles HuggingFace: : https://huggingface.co/Qwen/Qwen-Image
  • Documents techniques: : https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-Image/Qwen_Image.pdf
  • Démonstration de l'expérience en ligne: : https://huggingface.co/spaces/Qwen/Qwen-Image

Comment utiliser Qwen-Image

  • Visiter QwenChat: Accès Chat Qwen Site officiel.
  • Sélectionner la fonction de génération d'imagesDans l'interface de QwenChat, recherchez et sélectionnez la fonction "Génération d'images".
  • Saisir l'invite de texte: Saisissez une description de l'image que vous souhaitez générer dans la zone de saisie de texte.
  • Générer des imagesCliquez sur le bouton "Générer" et Qwen-Image génère l'image en fonction du texte demandé.
  • Visualiser et télécharger les images généréesL'image générée est affichée sur l'interface et l'utilisateur peut visualiser l'effet généré et choisir de le télécharger et de l'enregistrer localement.

Les points forts de Qwen-Image

  • Rendu de texte complexeLe système de génération d'images par IA de l'entreprise est conçu pour restituer avec précision les textes chinois et anglais avec des mises en page sur plusieurs lignes, une sémantique au niveau du paragraphe et des détails fins, comblant ainsi une lacune dans le domaine de la génération d'images par IA en Chine.
  • Retouche d'image de précisionIl permet d'effectuer un large éventail d'opérations telles que la migration de style, les ajouts, les suppressions, l'amélioration des détails, l'édition de texte, l'ajustement des gestes des personnages, etc. Il peut maintenir la cohérence sémantique globale et les détails visuels d'une image tout en suivant les commandes de l'utilisateur.
  • Puissantes capacités de génération d'images à usage généralLes images de haute qualité sont générées dans différents styles et thèmes artistiques, y compris le photoréalisme, l'animation, la peinture, etc.

Qwen-Image Performance

  • Troisième place au classement général et première place pour les modèles à source ouverte dans les examens publics de l'AI Arena.
  • Dans les tests de référence tels que CVTG-2K, le rendu du texte chinois est nettement plus performant que les modèles à source fermée tels que GPT Image 1 et Seedream 3.0.
  • Dans des tests tels que LongText-Bench, ChineseWord et TextCraft, sa capacité de rendu de texte, en particulier la génération de texte chinois, est nettement supérieure à celle des modèles existants.
Qwen-Image - 通义千问推出开源的文生图基础模型

Scénarios d'application de Qwen-Image

Les scénarios d'application de Qwen-Image comprennent : la conception d'affiches, qui peut être utilisée pour les affiches de films, les promotions de produits, les promotions d'événements, etc. Il peut automatiquement mettre en page des messages textuels multicouches, prendre en charge le rendu précis des logos de marque et générer une variété de styles artistiques. Scénarios de commerce électronique : génération de diagrammes de présentation de produits, d'affiches promotionnelles, etc., pour améliorer l'attrait visuel et promouvoir les ventes. Contenu des médias sociaux : générer rapidement des images adaptées à la taille de diverses plateformes de médias sociaux, pour des graphiques de microblogging, le partage de cercles d'amis, etc. avec des effets visuels accrocheurs.

© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...