InfiniteYou: инструмент для создания и редактирования фотографий, сохраняющий черты лица
Общее введение
InfiniteYou - это проект с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation Team. Он основан на технологии диффузионных трансформаторов (DiTs), использующих FLUXОсновная функция модели .1-dev - позволить пользователям загружать фотографию и вводить текстовое описание для создания нового изображения, сохраняя при этом личность человека. Проект использует технологию InfuseNet для улучшения сходства идентичности, в сочетании с многоступенчатым обучением для оптимизации качества изображения и выравнивания текста.InfiniteYou был выпущен в марте 2025 года с кодом, моделями и онлайн-демонстрацией и привлек внимание технического сообщества. Он поддерживает множество плагинов и прост в использовании для разработчиков, исследователей и обычных пользователей.

Список функций
- Реконструкция удержания идентичности: Загрузите фотографию и текстовое описание, чтобы создать новое изображение и сохранить черты лица человека.
- Создание высококачественных изображений: Вывод четких изображений и уменьшение размытости, искажений от рук и других проблем.
- Оптимизация выравнивания текста: Генерируйте результаты, которые в значительной степени соответствуют содержанию описания, чтобы избежать предвзятости.
- Выбор модели: Предоставлено
aes_stage2
(предпочтительнее эстетика) иsim_stage1
(Идентификация первая) два режима. - Расширения для плагиновДля повышения гибкости генерации поддерживаются: ControlNet, LoRA, IP-Adapter и т.д.
Использование помощи
Процесс установки
Для работы InfiniteYou требуется локальная установка. Ниже приведены подробные шаги:
- Подготовка к защите окружающей среды
- Убедитесь, что в вашей системе установлен Python 3.8 или более поздней версии.
- Установите Git для загрузки кода.
- Для повышения скорости генерации рекомендуется использовать графические процессоры NVIDIA и CUDA.
- Клонирование кода
Введите его в терминал:
git clone https://github.com/bytedance/InfiniteYou.git
Перейдите в каталог:
cd InfiniteYou
- Установка зависимостей
Выполните следующую команду для установки необходимых библиотек:
pip install -r requirements.txt
Если вы используете GPU, вам нужно установить соответствующую версию PyTorch, например:
pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
- Скачать модели
Посетите сайт https://huggingface.co/ByteDance/InfiniteYou, чтобы загрузитьinfu_flux_v1.0
папка вaes_stage2
возможноsim_stage1
модель в соответствующее место в каталоге проекта. - Бегущая демонстрация
Установите Gradio:
pip install gradio
Запустите локальный интерфейс:
python app.py
Откроется браузер http://127.0.0.1:7860
Ниже приведен список наиболее популярных и востребованных продуктов, представленных на рынке.
Основные функции
Сохранение личности фотореконструкция
- Загрузить фотографии
В интерфейсе Gradio нажмите "Upload Identity Image" и выберите четкую фотографию своего лица. - Описание ввода
Введите конкретное описание в поле "Текст запроса", например, "Женщина в красном платье в лесу". - Параметры настройки
- Выбор модели:
aes_stage2
Сосредоточьтесь на эстетике.sim_stage1
Акцент на сходстве личности. - Настройка параметров: по умолчанию
infusenet_conditioning_scale
из-за1.0
(математика) родinfusenet_guidance_start
из-за0.0
. Если идентичности недостаточно похожи, попробуйте настроить последнюю на0.1
. - Начальное значение (Seed): сохраните значение по умолчанию или установите вручную.
- Создание изображений
Нажмите кнопку "Generate" и подождите около 120 секунд, пока результат не появится на экране.
Быстрое осмысление сценария
Запускается в терминале:
python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results
Сгенерированные результаты сохраняются в results
Папка.
Онлайн-демонстрация
Посетите сайт https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX, чтобы попробовать его без установки.
Использование плагина
- ControlNet: Загрузите эталонное изображение для управления действием, которое генерирует результат.
- LoRA: Поддерживаются плагины Realism и Anti-blur, путь к которым нужно указать вручную, например.
<path_to_lora>
. - IP-адаптер: Добавьте справочник стилей для индивидуальной стилизации.
Пример работы
Вы хотите сгенерировать изображение "мужчины в костюме в конференц-зале":
- Загрузите фотографию мужчины.
- Введите описание: "Мужчина в костюме в комнате для переговоров".
- опция
aes_stage2
Нажмите на кнопку "Сгенерировать". - Проверьте результаты и добавьте слова "мужчина", если вам нужно скорректировать пол.
предостережение
- Фотографии должны быть четкими и обращенными вперед, чтобы избежать заслонения.
- Будьте конкретны в своих описаниях и избегайте расплывчатых слов, таких как "красивый".
- Время генерации зависит от аппаратного обеспечения и может составлять 30-60 секунд для графических процессоров.
сценарий применения
- Контент для социальных сетей
Пользователи загружают селфи и вводят фразу "в спортивной одежде в спортзале", чтобы создать фото на фитнес-тематику для публикации. - искусство
Художник загружает портрет, изображающий "рыцаря в средневековом костюме", чтобы создать концептуальный дизайн. - исследовательский тест
Исследователи использовали InfiniteYou для сравнения эффектов сохранения идентичности и проверки эффективности созданных моделей.
QA
- Это бесплатно?
Да. Код и модель имеют открытый исходный код и бесплатны для использования в академических исследованиях. - Сколько времени требуется для генерации?
В среднем 120 секунд, с GPU быстрее. - Поддерживает ли она многопользовательские фотографии?
В настоящее время игра оптимизирована для одиночной игры, поддержка мультиплеера нуждается в дальнейшей разработке.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...