OmniGen: унифицированная модель генерации изображений с мультимодальными входами для создания изображений, соответствующих персонажам

Последние ресурсы по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

64.4K 00

Общее введение

OmniGen - это "универсальная" модель генерации изображений, разработанная компанией VectorSpaceLab, которая позволяет пользователям создавать разнообразные и контекстуально насыщенные визуальные образы с помощью простых текстовых подсказок или мультимодального ввода. Она особенно хорошо подходит для сцен, требующих идентификации персонажей и их последовательной визуализации. Пользователи могут загружать до трех изображений и генерировать высококачественные изображения с подробными подсказками. Кроме того, OmniGen поддерживает редактирование ранее сгенерированных изображений, обеспечивая гибкие возможности по загрузке, подходящие для доработки изображений и экспериментов.

OmniGen не требует дополнительных плагинов или операций для автоматического распознавания особенностей входного изображения и генерации требуемого изображения. Существующие модели генерации изображений обычно требуют загрузки нескольких дополнительных сетевых модулей (например, ControlNet, IP-Adapter, Reference-Net и т. д.) и выполнения дополнительных шагов предварительной обработки (например, обнаружения лиц, оценки позы, обрезки и т. д.) для создания удовлетворительных изображений. Однако мы считаем, что будущие парадигмы генерации изображений должны быть более простыми и гибкими, т. е. генерировать различные изображения непосредственно из произвольных мультимодальных инструкций без дополнительных плагинов и операций, подобно тому, как GPT работает в генерации языков.

Список функций

Генерация изображений: Генерируйте различные изображения с помощью текстовых подсказок или мультимодального ввода.
Создание персонализированных изображений: Загрузите до трех изображений, чтобы создать индивидуальное изображение.
рендеринг символов (вычислительная техника): Сохраняет последовательность и узнаваемость персонажей и подходит для сценариев, где требуется идентификация персонажей.
редактирование изображений: Редактирование ранее созданных изображений обеспечивает гибкие возможности посева.
Формирование условий изображения: Генерирование нового изображения на основе конкретных условий входного изображения.
Высокое качество продукции: Подробные советы по созданию более четких и качественных изображений.

Использование помощи

Загрузить фотографию: Загрузите до трех изображений в интерфейс OmniGen, которые могут быть картами персонажей, предметов или условий.
Опишите изображение: Подробно опишите изображение, которое вы хотите сгенерировать, в поле запроса. Для разделов, включающих элементы изображения, используйте формат <img><|image_i|></img> Представьте их друг другу.
Параметры настройки: Настройте параметры генерации OmniGen, например масштаб изображения, в настройках. Остальные параметры рекомендуется оставить по умолчанию.
Создание изображений: Нажмите кнопку Generate, чтобы перейти в очередь и дождаться, пока изображение будет сгенерировано.
Редактировать изображениеРедактирование и доработка полученного изображения с помощью функции посева OmniGen.

Совет:

Для задач редактирования изображений и задач сети управления рекомендуется устанавливать высоту и ширину выходного изображения такими же, как у входного. Например, если вы хотите отредактировать изображение размером 512x512, вам следует установить высоту и ширину выходного изображения равными 512x512. Вы также можете установить значение use_input_image_size_as_output чтобы автоматически выровнять высоту и ширину выходного изображения с входным.
Если вы испытываете недостаток памяти или нехватку времени, вы можете установить параметр offload_model=Trueили ссылка . /docs/inference.md#requiremented-resources Выберите соответствующие настройки.
При вводе нескольких изображений, если время вывода слишком велико, попробуйте уменьшить max_input_image_size. Для получения подробной информации, пожалуйста, обратитесь к . /docs/inference.md#requiremented-resources.
Перенасыщенность: если изображение выглядит перенасыщенным, уменьшите значение guidance_scale.
Низкое качество: более подробные слова подсказки дали бы лучшие результаты.
Стиль аниме: Если сгенерированное изображение представляет собой стиль аниме, вы можете попробовать добавить в подсказку слово photo.
Редактирование сгенерированных изображений: Если вы сгенерировали изображение с помощью omnigen, а затем хотите его отредактировать, вы не сможете сделать это с тем же seed. Например, если изображение было сгенерировано с seed=0, редактировать его следует с seed=1.
Для задач редактирования изображений рекомендуется помещать изображение перед командой редактирования. Например, при использовании команды <img><|image_1|></img> remove suitВместо remove suit <img><|image_1|></img>.

Онлайн-доступ к OmniGen и пакет для установки одним щелчком мыши

Официальный сайт для онлайн использования: aiomnigen.comComfyui

Node: github.com/AIFSH/OmniGen-ComfyUIOmniGen

Пакет установки одним щелчком: pan.quark.cn/s/a1fd7d5298f9

Сценарии применения OmniGen More

редактирование изображений

OmniGen обладает хорошими возможностями редактирования изображений, а также может создавать текст на изображениях.

Генерация заданных символов

OmniGen схож с такими моделями, как InstandID, Pulid и т. д., в своей способности генерировать изображения, соответствующие роли и т. д., т. е. вводить изображение с одним объектом, понимать и выполнять инструкции, и выводить новое изображение на основе этого объекта.

В отличие от InstandID и Pulid, OmniGen может задавать генерацию из нескольких символов.

Отпечатки пальцев создаются от имени

Это самая уникальная особенность OmniGen: возможность определить объект, на который ссылается команда, и сгенерировать новое изображение из изображения, содержащего несколько объектов.

OmniGen просто находит целевой объект на нескольких изображениях (можно выбрать до 3 изображений) на основе команд с подсказками и генерирует новое изображение, соответствующее командам, без каких-либо дополнительных модулей или операций.

Генерация общих условий изображения

Это способность OmniGen поддерживать ControlNet-подобную генерацию изображений на основе определенных условий. В настоящее время она в основном основана на скелете эталонного персонажаOpenposeгенерация, а другая возможность генерировать из эталонного персонажа карту глубины.

В отличие от основных моделей диаграмм Венна, которые требуют Controlnet для контроля условий, OmniGen завершает весь процесс ControlNet с помощью одной модели: OmniGen напрямую извлекает визуальные условия из исходной диаграммы и генерирует изображение на основе извлеченных условий без необходимости использования дополнительного процессора. Более того, OmniGen генерирует изображение на основе опорного изображения и подсказок одним щелчком мыши, в отличие от ControlNet, где сначала нужно сгенерировать скелет или карту глубины.

Другие функции компонентов управления

В дополнение к вышеупомянутой функции OmniGen 1.0, официальный представитель также сообщил, что OmniGen имеет больше возможностей, таких как больше функций Controlnet, линии, генерация мягкого края и так далее.

Классические задачи компьютерного зрения

Обесцвечивание изображений, определение краев, оценка положения и т.д.

Даже как LLM имеет определенную способность к контекстному обучению (In-context Learning), в зависимости от понимания операции.

Последние ресурсы по искусственному интеллекту # AI онлайн генерация изображений # AI Java Open Source Projecct

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

VTP - технология визуального генеративного моделирования с открытым исходным кодом MiniMax Conch Video Team

Последние ресурсы по искусственному интеллекту

4 месяца назад

031.8K

Interlify: инструмент интеграции для быстрого подключения API к большим моделям

Последние ресурсы по искусственному интеллекту # AI Open Services

1 год назад

053.3K

DeepClaude：融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude: Чат-интерфейс, объединяющий рассуждения по цепочке R1 DeepSeek с креативностью Claude

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct Локализованное чат-приложение # AI

1 год назад

062.7K

AI Video Starter Kit: полнопоточное создание и редактирование AI-видео в браузере

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI аудио/видеоредактор

1 год назад

055.9K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

OmniGen: унифицированная модель генерации изображений с мультимодальными входами для создания изображений, соответствующих персонажам

Общее введение

Список функций

Использование помощи

Онлайн-доступ к OmniGen и пакет для установки одним щелчком мыши

Сценарии применения OmniGen More

XAnswer: интеллектуальная поисковая система с искусственным интеллектом, мгновенными ответами и картами мыслей

NovelAI: ИИ-помощник для создания романов, эссе, рассказов

Похожие статьи

VTP - технология визуального генеративного моделирования с открытым исходным кодом MiniMax Conch Video Team

Interlify: инструмент интеграции для быстрого подключения API к большим моделям

DeepClaude: Чат-интерфейс, объединяющий рассуждения по цепочке R1 DeepSeek с креативностью Claude

AI Video Starter Kit: полнопоточное создание и редактирование AI-видео в браузере

Нет комментариев

Последние коллекции

Последние статьи

OmniGen: унифицированная модель генерации изображений с мультимодальными входами для создания изображений, соответствующих персонажам

Общее введение

Список функций

Использование помощи

Онлайн-доступ к OmniGen и пакет для установки одним щелчком мыши

Сценарии применения OmniGen More

XAnswer: интеллектуальная поисковая система с искусственным интеллектом, мгновенными ответами и картами мыслей

NovelAI: ИИ-помощник для создания романов, эссе, рассказов

Похожие статьи

VTP - технология визуального генеративного моделирования с открытым исходным кодом MiniMax Conch Video Team

Interlify: инструмент интеграции для быстрого подключения API к большим моделям

DeepClaude: Чат-интерфейс, объединяющий рассуждения по цепочке R1 DeepSeek с креативностью Claude

AI Video Starter Kit: полнопоточное создание и редактирование AI-видео в браузере

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи