InfiniteYou: инструмент для создания и редактирования фотографий, сохраняющий черты лица

Общее введение

InfiniteYou - это проект с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation Team. Он основан на технологии диффузионных трансформаторов (DiTs), использующих FLUXОсновная функция модели .1-dev - позволить пользователям загружать фотографию и вводить текстовое описание для создания нового изображения, сохраняя при этом личность человека. Проект использует технологию InfuseNet для улучшения сходства идентичности, в сочетании с многоступенчатым обучением для оптимизации качества изображения и выравнивания текста.InfiniteYou был выпущен в марте 2025 года с кодом, моделями и онлайн-демонстрацией и привлек внимание технического сообщества. Он поддерживает множество плагинов и прост в использовании для разработчиков, исследователей и обычных пользователей.

InfiniteYou:保留人脸特征的照片生成与编辑工具

 

Список функций

  • Реконструкция удержания идентичности: Загрузите фотографию и текстовое описание, чтобы создать новое изображение и сохранить черты лица человека.
  • Создание высококачественных изображений: Вывод четких изображений и уменьшение размытости, искажений от рук и других проблем.
  • Оптимизация выравнивания текста: Генерируйте результаты, которые в значительной степени соответствуют содержанию описания, чтобы избежать предвзятости.
  • Выбор модели: Предоставлено aes_stage2(предпочтительнее эстетика) и sim_stage1(Идентификация первая) два режима.
  • Расширения для плагиновДля повышения гибкости генерации поддерживаются: ControlNet, LoRA, IP-Adapter и т.д.

 

Использование помощи

Процесс установки

Для работы InfiniteYou требуется локальная установка. Ниже приведены подробные шаги:

  1. Подготовка к защите окружающей среды
    • Убедитесь, что в вашей системе установлен Python 3.8 или более поздней версии.
    • Установите Git для загрузки кода.
    • Для повышения скорости генерации рекомендуется использовать графические процессоры NVIDIA и CUDA.
  2. Клонирование кода
    Введите его в терминал:
git clone https://github.com/bytedance/InfiniteYou.git

Перейдите в каталог:

cd InfiniteYou
  1. Установка зависимостей
    Выполните следующую команду для установки необходимых библиотек:
pip install -r requirements.txt

Если вы используете GPU, вам нужно установить соответствующую версию PyTorch, например:

pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
  1. Скачать модели
    Посетите сайт https://huggingface.co/ByteDance/InfiniteYou, чтобы загрузить infu_flux_v1.0 папка в aes_stage2 возможно sim_stage1 модель в соответствующее место в каталоге проекта.
  2. Бегущая демонстрация
    Установите Gradio:
pip install gradio

Запустите локальный интерфейс:

python app.py

Откроется браузер http://127.0.0.1:7860Ниже приведен список наиболее популярных и востребованных продуктов, представленных на рынке.

Основные функции

Сохранение личности фотореконструкция

  1. Загрузить фотографии
    В интерфейсе Gradio нажмите "Upload Identity Image" и выберите четкую фотографию своего лица.
  2. Описание ввода
    Введите конкретное описание в поле "Текст запроса", например, "Женщина в красном платье в лесу".
  3. Параметры настройки
  • Выбор модели:aes_stage2 Сосредоточьтесь на эстетике.sim_stage1 Акцент на сходстве личности.
  • Настройка параметров: по умолчанию infusenet_conditioning_scale из-за 1.0(математика) родinfusenet_guidance_start из-за 0.0. Если идентичности недостаточно похожи, попробуйте настроить последнюю на 0.1.
  • Начальное значение (Seed): сохраните значение по умолчанию или установите вручную.
  1. Создание изображений
    Нажмите кнопку "Generate" и подождите около 120 секунд, пока результат не появится на экране.

Быстрое осмысление сценария

Запускается в терминале:

python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results

Сгенерированные результаты сохраняются в results Папка.

Онлайн-демонстрация

Посетите сайт https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX, чтобы попробовать его без установки.

Использование плагина

  • ControlNet: Загрузите эталонное изображение для управления действием, которое генерирует результат.
  • LoRA: Поддерживаются плагины Realism и Anti-blur, путь к которым нужно указать вручную, например. <path_to_lora>.
  • IP-адаптер: Добавьте справочник стилей для индивидуальной стилизации.

Пример работы

Вы хотите сгенерировать изображение "мужчины в костюме в конференц-зале":

  1. Загрузите фотографию мужчины.
  2. Введите описание: "Мужчина в костюме в комнате для переговоров".
  3. опция aes_stage2Нажмите на кнопку "Сгенерировать".
  4. Проверьте результаты и добавьте слова "мужчина", если вам нужно скорректировать пол.

предостережение

  • Фотографии должны быть четкими и обращенными вперед, чтобы избежать заслонения.
  • Будьте конкретны в своих описаниях и избегайте расплывчатых слов, таких как "красивый".
  • Время генерации зависит от аппаратного обеспечения и может составлять 30-60 секунд для графических процессоров.

 

сценарий применения

  1. Контент для социальных сетей
    Пользователи загружают селфи и вводят фразу "в спортивной одежде в спортзале", чтобы создать фото на фитнес-тематику для публикации.
  2. искусство
    Художник загружает портрет, изображающий "рыцаря в средневековом костюме", чтобы создать концептуальный дизайн.
  3. исследовательский тест
    Исследователи использовали InfiniteYou для сравнения эффектов сохранения идентичности и проверки эффективности созданных моделей.

 

QA

  1. Это бесплатно?
    Да. Код и модель имеют открытый исходный код и бесплатны для использования в академических исследованиях.
  2. Сколько времени требуется для генерации?
    В среднем 120 секунд, с GPU быстрее.
  3. Поддерживает ли она многопользовательские фотографии?
    В настоящее время игра оптимизирована для одиночной игры, поддержка мультиплеера нуждается в дальнейшей разработке.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...