InfiniteYou : un outil de génération et d'édition de photos qui préserve les traits du visage
Introduction générale
InfiniteYou est un projet open source développé par l'équipe de création intelligente ByteDance. Il est basé sur la technologie des transformateurs de diffusion (DiTs), qui utilise la technologie FLUXLa fonction principale du modèle .1-dev est de permettre aux utilisateurs de télécharger une photo et de saisir une description textuelle pour générer une nouvelle image tout en préservant l'identité de la personne. Le projet utilise la technologie InfuseNet pour améliorer la similarité des identités, combinée à une formation en plusieurs étapes pour optimiser la qualité de l'image et l'alignement du texte.InfiniteYou a été publié en mars 2025 avec du code, des modèles et une démo en ligne, et a reçu l'attention de la communauté technique. InfiniteYou a été publié en mars 2025 avec du code, des modèles et une démo en ligne, et a reçu l'attention de la communauté technique.

Liste des fonctions
- Remodelage du maintien de l'identitéLa photo : Téléchargez une photo et une description textuelle pour générer une nouvelle image et conserver les traits du visage de la personne.
- Génération d'images de haute qualitéLa fonction d'affichage : produit des images claires et réduit le flou, la distorsion de la main et d'autres problèmes.
- Optimisation de l'alignement du texteLes résultats sont très cohérents avec le contenu de la description afin d'éviter les distorsions.
- Sélection du modèle: Fourni
aes_stage2
(préférence pour l'esthétique) etsim_stage1
(Identité première) deux modes. - Extensions du plug-inLa technologie de l'interface homme-machine est compatible avec ControlNet, LoRA, IP-Adapter, etc. pour une plus grande souplesse de production.
Utiliser l'aide
Processus d'installation
InfiniteYou nécessite une installation locale pour fonctionner. Voici les étapes détaillées :
- Préparation de l'environnement
- Assurez-vous que Python 3.8 ou une version ultérieure est installé sur votre système.
- Installer Git pour télécharger le code.
- Les GPU NVIDIA et CUDA sont recommandés pour améliorer la vitesse de génération.
- Clonage du code
Saisissez-le dans le terminal :
git clone https://github.com/bytedance/InfiniteYou.git
Accéder au catalogue :
cd InfiniteYou
- Installation des dépendances
Exécutez la commande suivante pour installer les bibliothèques requises :
pip install -r requirements.txt
Si vous utilisez un GPU, vous devez installer la version correspondante de PyTorch, par exemple :
pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
- Télécharger les modèles
Visitez le site https://huggingface.co/ByteDance/InfiniteYou pour téléchargerinfu_flux_v1.0
dans le dossieraes_stage2
peut-êtresim_stage1
dans l'emplacement correspondant du répertoire du projet. - Démonstration en cours
Installer Gradio :
pip install gradio
Lancer l'interface locale :
python app.py
Le navigateur s'ouvre http://127.0.0.1:7860
Voici une liste des produits les plus courants et les plus populaires disponibles sur le marché.
Principales fonctions
Préservation de l'identité Reconstruction photographique
- Télécharger des photos
Dans l'interface de Gradio, cliquez sur "Télécharger une image d'identité" et sélectionnez une photo claire de votre visage. - Description de l'entrée
Saisissez une description spécifique dans la case "Texte de l'invite", par exemple "Une femme en robe rouge dans la forêt". - Paramètres de réglage
- Sélection du modèle :
aes_stage2
Mettre l'accent sur l'esthétique.sim_stage1
L'accent est mis sur la similitude des identités. - Réglage des paramètres : par défaut
infusenet_conditioning_scale
en raison de1.0
(math.) genreinfusenet_guidance_start
en raison de0.0
. Si les identités ne sont pas suffisamment similaires, essayez d'accorder cette dernière avec la valeur de0.1
. - Valeur de semence (Seed) : conserver la valeur par défaut ou la définir manuellement.
- Générer des images
Cliquez sur "Générer" et attendez environ 120 secondes pour que le résultat s'affiche à l'écran.
Raisonnement rapide par script
S'exécute dans le terminal :
python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results
Les résultats générés sont enregistrés dans le fichier results
Dossier.
Démonstration en ligne
Visitez https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX pour l'essayer sans l'installer.
Utilisation du plug-in
- ControlNetTélécharger une image de référence de la pose pour contrôler l'action qui génère le résultat.
- LoRALes plug-ins Realism et Anti-blur sont pris en charge et les chemins d'accès doivent être spécifiés manuellement, par exemple
<path_to_lora>
. - Adaptateur IPLes services d'aide à l'enfance : ajoutez un tableau de référence de style pour une mise en forme personnalisée.
Exemple de fonctionnement
Vous souhaitez générer une image d'un "homme en costume dans une salle de conférence" :
- Téléchargez une photo de l'homme.
- Entrez une description : "Un homme en costume dans une salle de réunion".
- option
aes_stage2
Cliquez sur "Générer". - Vérifiez les résultats et ajoutez les mots "un homme" si vous avez besoin d'ajuster le genre.
mise en garde
- Les photographies doivent être claires et orientées vers l'avant pour éviter tout blocage.
- Soyez précis dans vos descriptions et évitez les mots vagues tels que "beau".
- Le temps de génération varie selon le matériel et peut être aussi court que 30 à 60 secondes pour les GPU.
scénario d'application
- Contenu des médias sociaux
Les utilisateurs téléchargent un selfie et tapent "porter des vêtements de sport à la salle de sport" pour générer une photo sur le thème du fitness à partager. - l'art
L'artiste télécharge un portrait représentant un "chevalier en costume médiéval" pour générer un dessin conceptuel. - test de recherche
Les chercheurs ont utilisé InfiniteYou pour comparer les effets de la rétention d'identité et valider la performance des modèles générés.
QA
- Est-il gratuit ?
Oui. Le code et le modèle sont en libre accès et peuvent être utilisés gratuitement pour la recherche universitaire. - Combien de temps cela prend-il pour produire ?
120 secondes en moyenne, plus rapide avec le GPU. - Prend-il en charge les photos multijoueurs ?
Actuellement optimisé pour un seul joueur, le support multijoueur doit encore être développé.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...