InfiniteYou : un outil de génération et d'édition de photos qui préserve les traits du visage

Dernières ressources sur l'IAPosté il y a 5 mois Cercle de partage de l'IA

10.7K 00

Introduction générale

InfiniteYou est un projet open source développé par l'équipe de création intelligente ByteDance. Il est basé sur la technologie des transformateurs de diffusion (DiTs), qui utilise la technologie FLUXLa fonction principale du modèle .1-dev est de permettre aux utilisateurs de télécharger une photo et de saisir une description textuelle pour générer une nouvelle image tout en préservant l'identité de la personne. Le projet utilise la technologie InfuseNet pour améliorer la similarité des identités, combinée à une formation en plusieurs étapes pour optimiser la qualité de l'image et l'alignement du texte.InfiniteYou a été publié en mars 2025 avec du code, des modèles et une démo en ligne, et a reçu l'attention de la communauté technique. InfiniteYou a été publié en mars 2025 avec du code, des modèles et une démo en ligne, et a reçu l'attention de la communauté technique.

Liste des fonctions

Remodelage du maintien de l'identitéLa photo : Téléchargez une photo et une description textuelle pour générer une nouvelle image et conserver les traits du visage de la personne.
Génération d'images de haute qualitéLa fonction d'affichage : produit des images claires et réduit le flou, la distorsion de la main et d'autres problèmes.
Optimisation de l'alignement du texteLes résultats sont très cohérents avec le contenu de la description afin d'éviter les distorsions.
Sélection du modèle: Fourni aes_stage2(préférence pour l'esthétique) et sim_stage1(Identité première) deux modes.
Extensions du plug-inLa technologie de l'interface homme-machine est compatible avec ControlNet, LoRA, IP-Adapter, etc. pour une plus grande souplesse de production.

Utiliser l'aide

Processus d'installation

InfiniteYou nécessite une installation locale pour fonctionner. Voici les étapes détaillées :

Préparation de l'environnement
- Assurez-vous que Python 3.8 ou une version ultérieure est installé sur votre système.
- Installer Git pour télécharger le code.
- Les GPU NVIDIA et CUDA sont recommandés pour améliorer la vitesse de génération.
Clonage du code
Saisissez-le dans le terminal :

git clone https://github.com/bytedance/InfiniteYou.git

Accéder au catalogue :

cd InfiniteYou

Installation des dépendances
Exécutez la commande suivante pour installer les bibliothèques requises :

pip install -r requirements.txt

Si vous utilisez un GPU, vous devez installer la version correspondante de PyTorch, par exemple :

pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124

Télécharger les modèles
Visitez le site https://huggingface.co/ByteDance/InfiniteYou pour télécharger infu_flux_v1.0 dans le dossier aes_stage2 peut-être sim_stage1 dans l'emplacement correspondant du répertoire du projet.
Démonstration en cours
Installer Gradio :

pip install gradio

Lancer l'interface locale :

python app.py

Le navigateur s'ouvre http://127.0.0.1:7860Voici une liste des produits les plus courants et les plus populaires disponibles sur le marché.

Principales fonctions

Préservation de l'identité Reconstruction photographique

Télécharger des photos
Dans l'interface de Gradio, cliquez sur "Télécharger une image d'identité" et sélectionnez une photo claire de votre visage.
Description de l'entrée
Saisissez une description spécifique dans la case "Texte de l'invite", par exemple "Une femme en robe rouge dans la forêt".
Paramètres de réglage

Sélection du modèle :aes_stage2 Mettre l'accent sur l'esthétique.sim_stage1 L'accent est mis sur la similitude des identités.
Réglage des paramètres : par défaut infusenet_conditioning_scale en raison de 1.0(math.) genreinfusenet_guidance_start en raison de 0.0. Si les identités ne sont pas suffisamment similaires, essayez d'accorder cette dernière avec la valeur de 0.1.
Valeur de semence (Seed) : conserver la valeur par défaut ou la définir manuellement.

Générer des images
Cliquez sur "Générer" et attendez environ 120 secondes pour que le résultat s'affiche à l'écran.

Raisonnement rapide par script

S'exécute dans le terminal :

python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人，肖像，电影风格" --out_results_dir ./results

Les résultats générés sont enregistrés dans le fichier results Dossier.

Démonstration en ligne

Visitez https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX pour l'essayer sans l'installer.

Utilisation du plug-in

ControlNetTélécharger une image de référence de la pose pour contrôler l'action qui génère le résultat.
LoRALes plug-ins Realism et Anti-blur sont pris en charge et les chemins d'accès doivent être spécifiés manuellement, par exemple <path_to_lora>.
Adaptateur IPLes services d'aide à l'enfance : ajoutez un tableau de référence de style pour une mise en forme personnalisée.

Exemple de fonctionnement

Vous souhaitez générer une image d'un "homme en costume dans une salle de conférence" :

Téléchargez une photo de l'homme.
Entrez une description : "Un homme en costume dans une salle de réunion".
option aes_stage2Cliquez sur "Générer".
Vérifiez les résultats et ajoutez les mots "un homme" si vous avez besoin d'ajuster le genre.

mise en garde

Les photographies doivent être claires et orientées vers l'avant pour éviter tout blocage.
Soyez précis dans vos descriptions et évitez les mots vagues tels que "beau".
Le temps de génération varie selon le matériel et peut être aussi court que 30 à 60 secondes pour les GPU.

scénario d'application

Contenu des médias sociaux
Les utilisateurs téléchargent un selfie et tapent "porter des vêtements de sport à la salle de sport" pour générer une photo sur le thème du fitness à partager.
l'art
L'artiste télécharge un portrait représentant un "chevalier en costume médiéval" pour générer un dessin conceptuel.
test de recherche
Les chercheurs ont utilisé InfiniteYou pour comparer les effets de la rétention d'identité et valider la performance des modèles générés.

QA

Est-il gratuit ?
Oui. Le code et le modèle sont en libre accès et peuvent être utilisés gratuitement pour la recherche universitaire.
Combien de temps cela prend-il pour produire ?
120 secondes en moyenne, plus rapide avec le GPU.
Prend-il en charge les photos multijoueurs ?
Actuellement optimisé pour un seul joueur, le support multijoueur doit encore être développé.

Dernières ressources sur l'IA # AI Image Style Control # AI Java Open Source Projecct

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Insanely Fast Whisper : projet open source de transcription rapide et efficace de la parole en texte

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 7 mois

012.2K

Xunfei drawing mirror : input copy AI automatically generate short video, AI short video creation platform

Dernières ressources sur l'IA # AI Video Generation Tool

Il y a 7 mois

012.3K

ForgeCAD : Générer des modèles 3D à partir de textes ou d'images, outil de modélisation 3D AI professionnel

Dernières ressources sur l'IA # AI Text and Image to 3D (Texte et image en 3D)

Il y a 8 mois

011.1K

ReechoAI : Plateforme de synthèse vocale et de clonage instantané ultra-fausse IA

Dernières ressources sur l'IA # Clonage vocal AI

Il y a 11 mois

013.8K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

InfiniteYou : un outil de génération et d'édition de photos qui préserve les traits du visage

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Principales fonctions

Préservation de l'identité Reconstruction photographique

Raisonnement rapide par script

Démonstration en ligne

Utilisation du plug-in

Exemple de fonctionnement

mise en garde

scénario d'application

QA

Strella : un outil pour les entretiens professionnels et les analyses approfondies grâce à l'IA

PDF Craft : outils open source de conversion de documents PDF numérisés en Markdown

Articles connexes

Insanely Fast Whisper : projet open source de transcription rapide et efficace de la parole en texte

Xunfei drawing mirror : input copy AI automatically generate short video, AI short video creation platform

ForgeCAD : Générer des modèles 3D à partir de textes ou d'images, outil de modélisation 3D AI professionnel

ReechoAI : Plateforme de synthèse vocale et de clonage instantané ultra-fausse IA

Pas de commentaires

Dernières collections

Derniers articles

InfiniteYou : un outil de génération et d'édition de photos qui préserve les traits du visage

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Principales fonctions

Préservation de l'identité Reconstruction photographique

Raisonnement rapide par script

Démonstration en ligne

Utilisation du plug-in

Exemple de fonctionnement

mise en garde

scénario d'application

QA

Strella : un outil pour les entretiens professionnels et les analyses approfondies grâce à l'IA

PDF Craft : outils open source de conversion de documents PDF numérisés en Markdown

Articles connexes

Insanely Fast Whisper : projet open source de transcription rapide et efficace de la parole en texte

Xunfei drawing mirror : input copy AI automatically generate short video, AI short video creation platform

ForgeCAD : Générer des modèles 3D à partir de textes ou d'images, outil de modélisation 3D AI professionnel

ReechoAI : Plateforme de synthèse vocale et de clonage instantané ultra-fausse IA

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles