WithAnyone - Фудань совместный шаг прыжок звезда открытым исходным кодом AI модель генерации фотографий
Что с кем?
WithAnyone - это модель искусственного интеллекта для генерации фотографий, разработанная совместно Фуданьским университетом и компанией StepStar, которая решает общую проблему "копирования и вставки" в традиционной системе искусственного интеллекта для генерации изображений и обеспечивает более естественную и контролируемую генерацию изображений нескольких людей. WithAnyone основана на архитектуре диффузионной модели, которая эффективно уменьшает артефакты в генерируемых изображениях и улучшает схожесть и разнообразие генерируемых образов. Модель была создана на основе открытых ресурсов, а сама модель, набор данных и демонстрация доступны на сайте Hugging Face. Пользователи могут легко загрузить свои личные фотографии для создания групповых фотографий с любыми людьми в различных сценариях и испытать естественные и реалистичные эффекты генерации изображений искусственного интеллекта.

Основные возможности WithAnyone
- Генерация нескольких фотографий: Возможность естественным образом объединить несколько человек в одну групповую фотографию, создавая ненавязчивое изображение.
- Поддержание последовательности идентификации: Идентичность символа может быть сохранена при генерации изображения, что гарантирует высокую степень схожести генерируемого изображения с вводимым символом.
- Гибкая настройка деталей: Пользователи могут гибко настраивать детали выражения лица, позы и прически персонажа для создания индивидуального образа.
- Уменьшение артефактов "копирования и вставки"Процесс создания изображений AI основан на передовых технологиях, что позволяет эффективно уменьшить распространенное явление "копирования и вставки" при традиционном создании изображений AI и улучшить качество изображения.
- Открытый исходный код и простота использования: Модель имеет открытый исходный код, и пользователи могут найти ресурсы на Hugging Face, чтобы легко использовать и испытать технологию.
С техническими принципамиAnyone
- Поддержка масштабных наборов данных: Используется набор данных MultiID-2M, который содержит 500 000 групповых фотографий нескольких человек и большое количество эталонных изображений, охватывающих широкий спектр выражений, причесок и ракурсов, что обеспечивает богатую базу данных для обучения модели.
- Контрастный тренинг потери идентичности: Баланс между точностью идентификации и разнообразием генерации с помощью контрастной потери идентичности (CIL) и парного обучения данных для обеспечения того, чтобы генерируемые изображения сохраняли идентичные характеристики персонажей и при этом имели естественный визуальный эффект.
- Архитектура модели диффузииАрхитектура, основанная на диффузионной модели, эффективно уменьшает артефакты "копирования и вставки", сохраняя при этом высокую идентичность и улучшая общее качество генерируемых изображений.
- идентификационный код: Кодирование идентификационных признаков персонажа гарантирует, что уникальные атрибуты персонажа будут точно восстановлены в процессе генерации, чтобы избежать путаницы в идентификации.
- Оптимизация многозадачности: Одновременная оптимизация нескольких задач, таких как поддержание идентичности, корректировка позы и слияние фона, во время обучения для улучшения комплексной производительности и адаптивности модели.
Адрес проекта WithAnyone
- Веб-сайт проекта:: https://doby-xu.github.io/WithAnyone/
- Репозиторий Github:: https://github.com/Doby-Xu/WithAnyone
- Библиотека моделей HuggingFace:: https://huggingface.co/WithAnyone/WithAnyone
- Технический документ arXiv:: https://arxiv.org/pdf/2510.14975
- Демонстрация опыта работы в режиме онлайн:: https://huggingface.co/spaces/WithAnyone/WithAnyone_demo
Для кого "С кем угодно
- пользователь социальных сетей: Предполагается, что технология искусственного интеллекта будет использоваться для создания креативных групповых фотографий с кумирами, друзьями или семьей, которыми можно будет поделиться на социальных платформах.
- создатель контента: Необходимо быстро создавать высококачественные групповые фотографии нескольких человек для создания видеороликов, статей или рекламных объявлений.
- Дизайнер и фотограф: для креативного дизайна или виртуальных съемок, исследуя новые формы визуального выражения.
- постоянный пользователь: Оцените преимущества технологии искусственного интеллекта и создавайте персонализированные фотографии для развлечения и на память.
- Энтузиасты технологий и разработчики: Исследование методов генерации изображений с помощью искусственного интеллекта, обучение и вторичная разработка с использованием моделей с открытым исходным кодом.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...




