CatVTON-FLUX: объединение моделей CATVTON и Flux Fill Repair для виртуальных схем подгонки

Последние ресурсы по искусственному интеллектуОпубликовано 1 год назад Круг обмена ИИ

49.3K 00

Общее введение

CatVTON-FLUX - это передовое решение для виртуальной примерки, которое сочетает в себе CATVTON (Concatenation Is All You Need for Virtual Try-On with Diffusion Models) и Флюс Населенные модели ремонта для реалистичного и точного переноса одежды. Проект, разработанный компанией nftblackmagic и вдохновленный технологией In-Context LoRA for prompt engineering, направлен на обеспечение высококачественной виртуальной примерки с помощью диффузионного моделирования и технологии LoRA (In-Context LoRA for prompt engineering). Платформа позволяет пользователям виртуально примерить Hugging Face и ознакомиться с последними весами модели и улучшениями характеристик.

Опыт работы в Интернете: https://huggingface.co/spaces/xiaozaa/catvton-flux-try-on

Список функций

Виртуальная примерка: реалистичный перенос одежды с помощью моделей CATVTON и Flux.
Поддержка весов LoRA: для улучшения работы модели предусмотрены весовые коэффициенты LoRA.
Gradio Demo: демонстрация виртуальной примерки с помощью платформы Gradio.
Поддержка обнимающегося лица: выполните CATVTON-FLUX-TRY-ON на обнимающемся лице.
Обновление весов модели: регулярно обновляйте весовые коэффициенты модели для повышения производительности и детализации.

Использование помощи

Процесс установки

Убедитесь, что среда выполнения имеет >= 40 ГБ VRAM (рекомендуется 80 ГБ GPU).
Создание и активация виртуальной среды Python:

   conda create -n flux python=3.10
conda activate flux

Установите необходимые зависимости:

   pip install -r requirements.txt
huggingface-cli login

Процесс использования

Запустите версию фитинга LoRA

Подготовьте исходные изображения, маски и изображения одежды.
Выполните следующую команду, чтобы примерить его:

   python tryon_inference_lora.py \
--image ./example/person/00008_00.jpg \
--mask ./example/person/00008_00_mask.png \
--garment ./example/garment/00034_00.jpg \
--seed 4096 \
--output_tryon test_lora.png \
--steps 30

Запустите пробную версию без версии LoRA

Подготовьте исходные изображения, маски и изображения одежды.
Выполните следующую команду, чтобы примерить его:

   python tryon_inference.py \
--image ./example/person/00008_00.jpg \
--mask ./example/person/00008_00_mask.png \
--garment ./example/garment/00034_00.jpg \
--seed 42 \
--output_tryon test.png \
--steps 30

Запуск демонстрационной версии Gradio

Выполните следующую команду, чтобы запустить демо-версию Gradio с весами LoRA:

   python app.py

Выполните следующую команду, чтобы запустить демо-версию Gradio без весов LoRA:

   python app_no_lora.py

Подробная процедура работы

Подготовка входного изображения: Убедитесь, что входное изображение, маска и изображение одежды имеют одинаковый размер, рекомендуемый размер - 576x768.
Выполнение команды test-penetration: Выберите версию LoRA или версию без LoRA для команды Try On, настроив такие параметры, как посев и шаги, для достижения оптимальных результатов.
Посмотреть результаты: Результаты подгонки будут сохранены в указанном пути вывода, и пользователь сможет просмотреть и оценить результаты подгонки.
Взаимодействие с интерфейсом Gradio: Через интерфейс Gradio пользователи могут загружать собственные изображения и одежду для виртуальной примерки в режиме реального времени.

Последние ресурсы по искусственному интеллекту # AI Обмен лицами и переодевание

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

ChatTutor - учебное пособие с искусственным интеллектом с открытым исходным кодом для визуализации интерактивного обучения

Последние ресурсы по искусственному интеллекту

3 месяца назад

019.7K

Тысяча вопросов Тонги: большая мультимодальная модель, запущенная Али, с возможностями ответа на текст, понимания изображений и разбора видео.

Последние ресурсы по искусственному интеллекту # AI Big Model Native Dialogue Tool

1 год назад

060.9K

Mapify - генератор карт разума с искусственным интеллектом от XMind

Последние ресурсы по искусственному интеллекту

8 месяцев назад

042.8K

EzyGraph: генератор визуальной графики, использующий искусственный интеллект для преобразования записей в блоге в красивую инфографику

Последние ресурсы по искусственному интеллекту # Инструмент для обобщения текстов и аудио/видео с использованием искусственного интеллекта

1 год назад

050.5K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

CatVTON-FLUX: объединение моделей CATVTON и Flux Fill Repair для виртуальных схем подгонки

Общее введение

Список функций

Использование помощи

Процесс установки

Процесс использования

Запустите версию фитинга LoRA

Запустите пробную версию без версии LoRA

Запуск демонстрационной версии Gradio

Подробная процедура работы

Facetune: фото- и видеоредактор, ориентированный на улучшение портретов, с множеством фильтров для деталей портрета (платно)

DH live: ИИ цифровых людей с плавным взаимодействием в реальном времени на видеокартах серии 30/40

Похожие статьи

ChatTutor - учебное пособие с искусственным интеллектом с открытым исходным кодом для визуализации интерактивного обучения

Тысяча вопросов Тонги: большая мультимодальная модель, запущенная Али, с возможностями ответа на текст, понимания изображений и разбора видео.

Mapify - генератор карт разума с искусственным интеллектом от XMind

EzyGraph: генератор визуальной графики, использующий искусственный интеллект для преобразования записей в блоге в красивую инфографику

Нет комментариев

Последние коллекции

Последние статьи

CatVTON-FLUX: объединение моделей CATVTON и Flux Fill Repair для виртуальных схем подгонки

Общее введение

Список функций

Использование помощи

Процесс установки

Процесс использования

Запустите версию фитинга LoRA

Запустите пробную версию без версии LoRA

Запуск демонстрационной версии Gradio

Подробная процедура работы

Facetune: фото- и видеоредактор, ориентированный на улучшение портретов, с множеством фильтров для деталей портрета (платно)

DH live: ИИ цифровых людей с плавным взаимодействием в реальном времени на видеокартах серии 30/40

Похожие статьи

ChatTutor - учебное пособие с искусственным интеллектом с открытым исходным кодом для визуализации интерактивного обучения

Тысяча вопросов Тонги: большая мультимодальная модель, запущенная Али, с возможностями ответа на текст, понимания изображений и разбора видео.

Mapify - генератор карт разума с искусственным интеллектом от XMind

EzyGraph: генератор визуальной графики, использующий искусственный интеллект для преобразования записей в блоге в красивую инфографику

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи