OpenAI открывает новейший API генерации изображений, модель gpt-image-1 полностью открыта

Новости ИИОбновлено 4 месяца назад Круг обмена ИИ
10.1K 00

Недавно компания OpenAI объявила о создании своей новейшей модели генерации изображений. gpt-image-1 официально доступна для разработчиков и предприятий через API. Ранее модель уже была доступна в ChatGPT Она была использована в ChatGPT и была хорошо принята пользователями благодаря своим мощным возможностям по созданию изображений. По данным OpenAI, в первую неделю после интеграции этой функции в ChatGPT пользователи по всему миру создали более 700 миллионов изображений. Теперь, открыв ее в виде API, сторонние разработчики могут интегрировать эту возможность создания изображений непосредственно в свои приложения и сервисы.

gpt-image-1 описывается как собственная мультимодальная модель, способная принимать на вход как текст, так и изображения и генерировать изображения на выходе. Эта особенность позволяет не только создавать изображения на основе текстовых описаний (Text-to-Image), но и редактировать или генерировать новые изображения на основе загруженных пользователем изображений и текстовых подсказок (Image-to-Image), и даже поддерживает такие функции, как локальная модификация (Inpainting) и редактирование преобразования текста. По сравнению со своей предшественницей, серией моделей DALL-E, модельgpt-image-1 Улучшение понимания и выполнения более детальных и сложных команд, особенно возможность точного отображения текста на изображениях, что очень важно для сценариев применения, требующих сочетания графики и текста (например, учебные материалы, иллюстрации к сказкам).

Модель поддерживает различные разрешения, включая 1024x1024, 1024x1536 и 1536x1024 пикселей при минимальном требовании в 1024 пикселя по ширине и высоте. Разработчики могут использовать v1/images/generations Вызовы конечных точек API для функции генерации изображений.v1/images/edits Конечные точки затем используются для редактирования изображений.

Механизмы ценообразования и доступа

gpt-image-1 Вызовы API основаны на Токен биллинговой модели и различает разные типы Токенов:

  • Ввод текста Токен (слово подсказки): Плата составляет 5,00 долларов США за миллион токенов.
  • Входной маркер изображения (входное изображение): Плата составляет 10,00 долларов США за миллион токенов.
  • Токен вывода изображения (генерирует изображение): Плата составляет 40,00 долларов США за миллион токенов.

Стоимость создания одного изображения варьируется в зависимости от качества и размера изображения. Например, стоимость создания изображения размером 1024x1024 пикселя составляет примерно 0,011, 0,042 и 0,167 доллара для низкого, среднего и высокого качества, соответственно. Стоимость изображений с более высоким разрешением соответственно возрастает.

Качество изображенияразрешение (фотографии)Цена за изображение
Низкий1024x1024$0.011
Низкий1024x1536$0.016
Низкий1536x1024$0.016
Средний1024x1024$0.042
Средний1024x1536$0.063
Средний1536x1024$0.063
Высокий1024x1024$0.167
Высокий1024x1536$0.25
Высокий1536x1024$0.25

Кроме того, для обеспечения стабильности и справедливости сервиса OpenAI установила лимиты тарифов, которые делятся на разные уровни (от Tier 1 до Tier 5), с разными лимитами обработки токенов в минуту (TPM) и изображений в минуту (IPM) для разных уровней пользователей. Лимиты автоматически снижаются по мере роста использования API пользователями и увеличения платы.

УровеньTPM (Token Per Minute)IPM (изображений в минуту)
Бесплатнонеподдерживаемый-
Уровень 140,0005
Уровень 2100,00020
Уровень 3400,00050
Уровень 42,000,000150
Уровень 56,000,000250

gpt-image-1 В настоящее время модель доступна во всем мире через API Images, а в будущем будет поддерживать API Responses. Некоторым разработчикам может потребоваться пройти организационную проверку, прежде чем они смогут использовать модель.

Модель также доступна на платформе Azure AI Foundry от Microsoft для клиентов Azure, что еще больше расширяет ее охват и сценарии применения.

Экологическая интеграция и перспективы применения

главнокомандующий (военный) gpt-image-1 Одним из заметных признаков открытия API является их быстрая интеграция с широким спектром существующих инструментов и платформ. Это свидетельствует об ускоряющейся тенденции внедрения передовых возможностей ИИ в повседневные рабочие процессы пользователей.

Ряд известных компаний уже приступили или планируют приступить к работе. gpt-image-1 интегрированы в их продукцию:

  • Adobe. будет содержать следующую информацию Светлячок Возможности генерации изображений OpenAI доступны в таких творческих инструментах, как OpenAI и Express, что позволяет авторам экспериментировать с различными стилями генерации в привычных инструментах.
  • Воздушный стол. Расширьте возможности управления рабочими процессами с помощью этой модели, чтобы помочь корпоративным маркетинговым и креативным командам управлять материалами в масштабе, например, генерировать концепции кампаний, локализованный медиаконтент и многое другое.
  • Фигма. интегрирована в дизайнерскую платформу Figma Design. gpt-image-1Он позволяет создавать и редактировать изображения с помощью простых текстовых подсказок, настраивать стили, добавлять/удалять объекты, расширять фоны и многое другое.
  • Гамма. ИИ ежедневно используется для создания большого количества изображений, помогающих пользователям в создании презентаций и веб-сайтов. gpt-image-1 Создавайте диаграммы, редактируйте содержимое изображений и стандартизируйте стили.
    OpenAI 开放最新图像生成 API,gpt-image-1 模型全面开放
  • HeyGen. Интегрируйте модель, чтобы улучшить возможности создания и редактирования аватаров, предоставляя более гибкие возможности настройки.
    OpenAI 开放最新图像生成 API,gpt-image-1 模型全面开放
  • OpusClip. Инструмент для создания миниатюр с искусственным интеллектом OpusClip Thumbnail использует gpt-image-1 Генерируйте для создателей YouTube персональные миниатюры, соответствующие содержанию и названию видео.
  • Quora. главнокомандующий (военный) gpt-image-1 установлен в качестве модели изображения по умолчанию, что повышает качество создания изображений для миллионов пользователей платформы.
  • Wix. В платформу Wixel для дизайна с искусственным интеллектом интегрирована функция создания изображений, которая помогает пользователям превращать идеи в дизайн с возможностью редактирования.
  • Фоторубка. на основании gpt-image-1 Запущены такие инструменты искусственного интеллекта, как Product Beautifier, Product Staging и Virtual Model, помогающие онлайн-продавцам быстро создавать высококачественные визуальные образы товаров.
  • Игровая площадка. Используйте модель, чтобы предоставить пользователям более мощные возможности редактирования дизайна, такие как изменение стилей, цветов и применение моделей.

Кроме того, она включает в себя CanvaGoDaddyHubSpotInstacartinvideo Все большее число платформ, в том числе и платформы, также изучают или тестируют интеграцию gpt-image-1 Сценарии применения охватывают широкий спектр областей, таких как помощь в дизайне, создание логотипов, производство маркетинговых материалов, создание изображений для рецептов, редактирование видео и так далее. Такое широкое сотрудничество и исследования свидетельствуют о дальнейшем проникновении технологии генерации изображений с помощью искусственного интеллекта в инструменты повышения производительности в самых разных отраслях.

Соображения безопасности

OpenAI подчеркивает, чтоgpt-image-1 В API используются те же средства защиты, что и при создании изображений по модели 4o в ChatGPT, призванные ограничить создание опасных изображений. В то же время создаваемые изображения будут содержать метаданные C2PA - технический стандарт для отслеживания происхождения и подлинности контента, помогающий повысить прозрачность и бороться с дезинформацией. Разработчики также могут использовать moderation Параметр настраивает чувствительность фильтрации содержимого (по умолчанию autoДополнительно low).

OpenAI подтвердил, что по умолчанию не использует данные API клиентов для обучения, и что на все входные и выходные данные изображений, предоставляемые через API, распространяется политика использования. На платформе Azure применяются дополнительные меры безопасности контента Azure AI и мониторинга злоупотреблений.

gpt-image-1 Выпуск API знаменует собой переход высококачественных возможностей создания изображений с помощью искусственного интеллекта из закрытых приложений в более широкую экосистему разработчиков. Его мультимодальная природа, улучшенная производительность и интеграция со многими основными платформами могут значительно снизить порог создания изображений профессионального уровня и привести к появлению новых моделей приложений. Однако сложная модель ценообразования на основе токенов и ограничение тарифов также ставят перед разработчиками новые задачи по контролю затрат и масштабированию приложений. В дальнейшем наблюдение за тем, как эта технология приживется в реальных приложениях, как она будет оптимизирована и как будут устранены потенциальные риски злоупотреблений, будет иметь ключевое значение для оценки ее истинной ценности.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...