OpenAI открывает новейший API генерации изображений, модель gpt-image-1 полностью открыта

Новости ИИОбновлено 11 месяцев назад Круг обмена ИИ

69.2K 00

Недавно компания OpenAI объявила о создании своей новейшей модели генерации изображений. gpt-image-1 официально доступна для разработчиков и предприятий через API. Ранее модель уже была доступна в ChatGPT Она была использована в ChatGPT и была хорошо принята пользователями благодаря своим мощным возможностям по созданию изображений. По данным OpenAI, в первую неделю после интеграции этой функции в ChatGPT пользователи по всему миру создали более 700 миллионов изображений. Теперь, открыв ее в виде API, сторонние разработчики могут интегрировать эту возможность создания изображений непосредственно в свои приложения и сервисы.

gpt-image-1 описывается как собственная мультимодальная модель, способная принимать на вход как текст, так и изображения и генерировать изображения на выходе. Эта особенность позволяет не только создавать изображения на основе текстовых описаний (Text-to-Image), но и редактировать или генерировать новые изображения на основе загруженных пользователем изображений и текстовых подсказок (Image-to-Image), и даже поддерживает такие функции, как локальная модификация (Inpainting) и редактирование преобразования текста. По сравнению со своей предшественницей, серией моделей DALL-E, модельgpt-image-1 Улучшение понимания и выполнения более детальных и сложных команд, особенно возможность точного отображения текста на изображениях, что очень важно для сценариев применения, требующих сочетания графики и текста (например, учебные материалы, иллюстрации к сказкам).

Модель поддерживает различные разрешения, включая 1024x1024, 1024x1536 и 1536x1024 пикселей при минимальном требовании в 1024 пикселя по ширине и высоте. Разработчики могут использовать v1/images/generations Вызовы конечных точек API для функции генерации изображений.v1/images/edits Конечные точки затем используются для редактирования изображений.

Механизмы ценообразования и доступа

gpt-image-1 Вызовы API основаны на Токен биллинговой модели и различает разные типы Токенов:

Ввод текста Токен (слово подсказки): Плата составляет 5,00 долларов США за миллион токенов.
Входной маркер изображения (входное изображение): Плата составляет 10,00 долларов США за миллион токенов.
Токен вывода изображения (генерирует изображение): Плата составляет 40,00 долларов США за миллион токенов.

Стоимость создания одного изображения варьируется в зависимости от качества и размера изображения. Например, стоимость создания изображения размером 1024x1024 пикселя составляет примерно 0,011, 0,042 и 0,167 доллара для низкого, среднего и высокого качества, соответственно. Стоимость изображений с более высоким разрешением соответственно возрастает.

Качество изображения	разрешение (фотографии)	Цена за изображение
Низкий	1024x1024	$0.011
Низкий	1024x1536	$0.016
Низкий	1536x1024	$0.016
Средний	1024x1024	$0.042
Средний	1024x1536	$0.063
Средний	1536x1024	$0.063
Высокий	1024x1024	$0.167
Высокий	1024x1536	$0.25
Высокий	1536x1024	$0.25

Кроме того, для обеспечения стабильности и справедливости сервиса OpenAI установила лимиты тарифов, которые делятся на разные уровни (от Tier 1 до Tier 5), с разными лимитами обработки токенов в минуту (TPM) и изображений в минуту (IPM) для разных уровней пользователей. Лимиты автоматически снижаются по мере роста использования API пользователями и увеличения платы.

Уровень	TPM (Token Per Minute)	IPM (изображений в минуту)
Бесплатно	неподдерживаемый	-
Уровень 1	40,000	5
Уровень 2	100,000	20
Уровень 3	400,000	50
Уровень 4	2,000,000	150
Уровень 5	6,000,000	250

gpt-image-1 В настоящее время модель доступна во всем мире через API Images, а в будущем будет поддерживать API Responses. Некоторым разработчикам может потребоваться пройти организационную проверку, прежде чем они смогут использовать модель.

Модель также доступна на платформе Azure AI Foundry от Microsoft для клиентов Azure, что еще больше расширяет ее охват и сценарии применения.

Экологическая интеграция и перспективы применения

главнокомандующий (военный) gpt-image-1 Одним из заметных признаков открытия API является их быстрая интеграция с широким спектром существующих инструментов и платформ. Это свидетельствует об ускоряющейся тенденции внедрения передовых возможностей ИИ в повседневные рабочие процессы пользователей.

Ряд известных компаний уже приступили или планируют приступить к работе. gpt-image-1 интегрированы в их продукцию:

Adobe. будет содержать следующую информацию Светлячок Возможности генерации изображений OpenAI доступны в таких творческих инструментах, как OpenAI и Express, что позволяет авторам экспериментировать с различными стилями генерации в привычных инструментах.
Воздушный стол. Расширьте возможности управления рабочими процессами с помощью этой модели, чтобы помочь корпоративным маркетинговым и креативным командам управлять материалами в масштабе, например, генерировать концепции кампаний, локализованный медиаконтент и многое другое.
Фигма. интегрирована в дизайнерскую платформу Figma Design. gpt-image-1Он позволяет создавать и редактировать изображения с помощью простых текстовых подсказок, настраивать стили, добавлять/удалять объекты, расширять фоны и многое другое.
Гамма. ИИ ежедневно используется для создания большого количества изображений, помогающих пользователям в создании презентаций и веб-сайтов. gpt-image-1 Создавайте диаграммы, редактируйте содержимое изображений и стандартизируйте стили.
HeyGen. Интегрируйте модель, чтобы улучшить возможности создания и редактирования аватаров, предоставляя более гибкие возможности настройки.
OpusClip. Инструмент для создания миниатюр с искусственным интеллектом OpusClip Thumbnail использует gpt-image-1 Генерируйте для создателей YouTube персональные миниатюры, соответствующие содержанию и названию видео.
Quora. главнокомандующий (военный) gpt-image-1 установлен в качестве модели изображения по умолчанию, что повышает качество создания изображений для миллионов пользователей платформы.
Wix. В платформу Wixel для дизайна с искусственным интеллектом интегрирована функция создания изображений, которая помогает пользователям превращать идеи в дизайн с возможностью редактирования.
Фоторубка. на основании gpt-image-1 Запущены такие инструменты искусственного интеллекта, как Product Beautifier, Product Staging и Virtual Model, помогающие онлайн-продавцам быстро создавать высококачественные визуальные образы товаров.
Игровая площадка. Используйте модель, чтобы предоставить пользователям более мощные возможности редактирования дизайна, такие как изменение стилей, цветов и применение моделей.

Кроме того, она включает в себя Canva, GoDaddy, HubSpot, Instacart, invideo Все большее число платформ, в том числе и платформы, также изучают или тестируют интеграцию gpt-image-1 Сценарии применения охватывают широкий спектр областей, таких как помощь в дизайне, создание логотипов, производство маркетинговых материалов, создание изображений для рецептов, редактирование видео и так далее. Такое широкое сотрудничество и исследования свидетельствуют о дальнейшем проникновении технологии генерации изображений с помощью искусственного интеллекта в инструменты повышения производительности в самых разных отраслях.

Соображения безопасности

OpenAI подчеркивает, чтоgpt-image-1 В API используются те же средства защиты, что и при создании изображений по модели 4o в ChatGPT, призванные ограничить создание опасных изображений. В то же время создаваемые изображения будут содержать метаданные C2PA - технический стандарт для отслеживания происхождения и подлинности контента, помогающий повысить прозрачность и бороться с дезинформацией. Разработчики также могут использовать moderation Параметр настраивает чувствительность фильтрации содержимого (по умолчанию autoДополнительно low).

OpenAI подтвердил, что по умолчанию не использует данные API клиентов для обучения, и что на все входные и выходные данные изображений, предоставляемые через API, распространяется политика использования. На платформе Azure применяются дополнительные меры безопасности контента Azure AI и мониторинга злоупотреблений.

gpt-image-1 Выпуск API знаменует собой переход высококачественных возможностей создания изображений с помощью искусственного интеллекта из закрытых приложений в более широкую экосистему разработчиков. Его мультимодальная природа, улучшенная производительность и интеграция со многими основными платформами могут значительно снизить порог создания изображений профессионального уровня и привести к появлению новых моделей приложений. Однако сложная модель ценообразования на основе токенов и ограничение тарифов также ставят перед разработчиками новые задачи по контролю затрат и масштабированию приложений. В дальнейшем наблюдение за тем, как эта технология приживется в реальных приложениях, как она будет оптимизирована и как будут устранены потенциальные риски злоупотреблений, будет иметь ключевое значение для оценки ее истинной ценности.

Новости ИИ

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Модель Маска Grok (xAI) находится в стадии публичного бета-тестирования и раздает бесплатные API на сумму $25 в месяц

Новости ИИ # Бесплатная большая модель API

1 год назад

065.8K

Действительно ли отечественный ИИ первого уровня лучше, чем ChatGPT? Три функции DeepSeek проверены в реальной жизни

Новости ИИ

1 год назад

054.3K

Google выпускает Gemini 2.5: значительные улучшения в возможностях "мышления"

Новости ИИ

1 год назад

054.4K

Полное объяснение функции "Блокноты": бесшовное совместное использование контекста между редактором курсора и чатом

Новости ИИ

1 год назад

049.3K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

OpenAI открывает новейший API генерации изображений, модель gpt-image-1 полностью открыта

Механизмы ценообразования и доступа

Экологическая интеграция и перспективы применения

Соображения безопасности

$150 Стоимость подписки на супер инструменты $1800 AI? Годовой пакет Lenny's Newsletter уже здесь!

Выпущен Qwen3: новое поколение больших языковых моделей для глубокого мышления и быстрого реагирования

Похожие статьи

Модель Маска Grok (xAI) находится в стадии публичного бета-тестирования и раздает бесплатные API на сумму $25 в месяц

Действительно ли отечественный ИИ первого уровня лучше, чем ChatGPT? Три функции DeepSeek проверены в реальной жизни

Google выпускает Gemini 2.5: значительные улучшения в возможностях "мышления"

Полное объяснение функции "Блокноты": бесшовное совместное использование контекста между редактором курсора и чатом

Нет комментариев

Последние коллекции

Последние статьи

OpenAI открывает новейший API генерации изображений, модель gpt-image-1 полностью открыта

Механизмы ценообразования и доступа

Экологическая интеграция и перспективы применения

Соображения безопасности

$150 Стоимость подписки на супер инструменты $1800 AI? Годовой пакет Lenny's Newsletter уже здесь!

Выпущен Qwen3: новое поколение больших языковых моделей для глубокого мышления и быстрого реагирования

Похожие статьи

Модель Маска Grok (xAI) находится в стадии публичного бета-тестирования и раздает бесплатные API на сумму $25 в месяц

Действительно ли отечественный ИИ первого уровня лучше, чем ChatGPT? Три функции DeepSeek проверены в реальной жизни

Google выпускает Gemini 2.5: значительные улучшения в возможностях "мышления"

Полное объяснение функции "Блокноты": бесшовное совместное использование контекста между редактором курсора и чатом

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи