WithAnyone - Фудань совместный шаг прыжок звезда открытым исходным кодом AI модель генерации фотографий

堆友AI

Что с кем?

WithAnyone - это модель искусственного интеллекта для генерации фотографий, разработанная совместно Фуданьским университетом и компанией StepStar, которая решает общую проблему "копирования и вставки" в традиционной системе искусственного интеллекта для генерации изображений и обеспечивает более естественную и контролируемую генерацию изображений нескольких людей. WithAnyone основана на архитектуре диффузионной модели, которая эффективно уменьшает артефакты в генерируемых изображениях и улучшает схожесть и разнообразие генерируемых образов. Модель была создана на основе открытых ресурсов, а сама модель, набор данных и демонстрация доступны на сайте Hugging Face. Пользователи могут легко загрузить свои личные фотографии для создания групповых фотографий с любыми людьми в различных сценариях и испытать естественные и реалистичные эффекты генерации изображений искусственного интеллекта.

WithAnyone - 复旦联合阶跃星辰开源的AI合照生成模型

Основные возможности WithAnyone

  • Генерация нескольких фотографий: Возможность естественным образом объединить несколько человек в одну групповую фотографию, создавая ненавязчивое изображение.
  • Поддержание последовательности идентификации: Идентичность символа может быть сохранена при генерации изображения, что гарантирует высокую степень схожести генерируемого изображения с вводимым символом.
  • Гибкая настройка деталей: Пользователи могут гибко настраивать детали выражения лица, позы и прически персонажа для создания индивидуального образа.
  • Уменьшение артефактов "копирования и вставки"Процесс создания изображений AI основан на передовых технологиях, что позволяет эффективно уменьшить распространенное явление "копирования и вставки" при традиционном создании изображений AI и улучшить качество изображения.
  • Открытый исходный код и простота использования: Модель имеет открытый исходный код, и пользователи могут найти ресурсы на Hugging Face, чтобы легко использовать и испытать технологию.

С техническими принципамиAnyone

  • Поддержка масштабных наборов данных: Используется набор данных MultiID-2M, который содержит 500 000 групповых фотографий нескольких человек и большое количество эталонных изображений, охватывающих широкий спектр выражений, причесок и ракурсов, что обеспечивает богатую базу данных для обучения модели.
  • Контрастный тренинг потери идентичности: Баланс между точностью идентификации и разнообразием генерации с помощью контрастной потери идентичности (CIL) и парного обучения данных для обеспечения того, чтобы генерируемые изображения сохраняли идентичные характеристики персонажей и при этом имели естественный визуальный эффект.
  • Архитектура модели диффузииАрхитектура, основанная на диффузионной модели, эффективно уменьшает артефакты "копирования и вставки", сохраняя при этом высокую идентичность и улучшая общее качество генерируемых изображений.
  • идентификационный код: Кодирование идентификационных признаков персонажа гарантирует, что уникальные атрибуты персонажа будут точно восстановлены в процессе генерации, чтобы избежать путаницы в идентификации.
  • Оптимизация многозадачности: Одновременная оптимизация нескольких задач, таких как поддержание идентичности, корректировка позы и слияние фона, во время обучения для улучшения комплексной производительности и адаптивности модели.

Адрес проекта WithAnyone

  • Веб-сайт проекта:: https://doby-xu.github.io/WithAnyone/
  • Репозиторий Github:: https://github.com/Doby-Xu/WithAnyone
  • Библиотека моделей HuggingFace:: https://huggingface.co/WithAnyone/WithAnyone
  • Технический документ arXiv:: https://arxiv.org/pdf/2510.14975
  • Демонстрация опыта работы в режиме онлайн:: https://huggingface.co/spaces/WithAnyone/WithAnyone_demo

Для кого "С кем угодно

  • пользователь социальных сетей: Предполагается, что технология искусственного интеллекта будет использоваться для создания креативных групповых фотографий с кумирами, друзьями или семьей, которыми можно будет поделиться на социальных платформах.
  • создатель контента: Необходимо быстро создавать высококачественные групповые фотографии нескольких человек для создания видеороликов, статей или рекламных объявлений.
  • Дизайнер и фотограф: для креативного дизайна или виртуальных съемок, исследуя новые формы визуального выражения.
  • постоянный пользователь: Оцените преимущества технологии искусственного интеллекта и создавайте персонализированные фотографии для развлечения и на память.
  • Энтузиасты технологий и разработчики: Исследование методов генерации изображений с помощью искусственного интеллекта, обучение и вторичная разработка с использованием моделей с открытым исходным кодом.
© заявление об авторских правах

Похожие статьи

Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...