ChatGPT Images 2.0 улучшила генерацию изображений и текста на картинках

27 апреля

OpenAI представила ChatGPT Images 2.0 — новую модель генерации изображений внутри ChatGPT. Компания описывает релиз как «новую эру генерации изображений» и подчёркивает три ключевых улучшения: более качественный рендеринг текста, поддержку нескольких языков и более сильное визуальное reasoning. В release notes OpenAI также указано, что ChatGPT Images 2.0 доступна на всех тарифных планах ChatGPT.

Главное отличие обновления в том, что модель лучше справляется не только с красивыми иллюстрациями, но и с более практичными задачами. OpenAI прямо выделяет улучшенную работу с текстом на изображениях, а в системной карточке пишет о заметном прогрессе в instruction following, world knowledge и генерации сложных деталей, включая плотный текст. Это особенно важно для постеров, инфографики, карточек, макетов интерфейсов, меню, баннеров и других изображений, где раньше нейросети часто ошибались в надписях или ломали структуру макета.

Отдельный акцент сделан на мультиязычности. OpenAI показывает, что модель лучше работает с разными письменностями и языками, а не только с английским текстом. Для пользователей это означает более уверенную генерацию изображений с подписями, афишами и рекламными материалами на разных языках, где раньше качество текста часто было слабым даже при хорошем визуальном стиле.

Ещё одно нововведение — images with thinking. В release notes OpenAI объясняет, что в этом режиме модель получает больше времени на обдумывание запроса и может планировать и дорабатывать будущий результат до самой генерации. Эта функция доступна на всех платных планах ChatGPT и работает при выборе Thinking и Pro models. По сути, OpenAI переносит в генерацию изображений ту же идею, которая уже используется в более «думающих» текстовых моделях: не просто быстро выдать картинку, а сначала лучше понять задачу.

На практике обновление выглядит как шаг от «картинок ради эффекта» к более рабочему инструменту. В примерах OpenAI показывает постеры, многоязычные макеты, редакционные развороты, комиксы, рекламные материалы и насыщенные визуальные сцены с большим количеством текстовых и графических элементов. Это важный сигнал для рынка: генерация изображений всё сильнее движется в сторону утилитарных задач, где важны не только стиль и креативность, но и читаемость, точность надписей и контроль над композицией.

Чтобы было проще понять суть релиза, основные изменения можно свести в короткую таблицу.

Что обновили	Что это даёт пользователю
Рендеринг текста	Более читаемые надписи на постерах, карточках, баннерах и макетах
Поддержка нескольких языков	Лучшая генерация текстов и визуалов не только на английском
Визуальное reasoning	Более точное выполнение сложных запросов и лучшее понимание композиции
Images with thinking	Дополнительное планирование результата перед генерацией
Доступность в ChatGPT	Использование ChatGPT Images 2.0 на всех тарифных планах

Эти изменения важны ещё и потому, что они расширяют круг сценариев использования ChatGPT. Если раньше генерация изображений часто ассоциировалась с артами, стилизациями и развлекательными картинками, то теперь OpenAI явно подталкивает продукт к более прикладным задачам: маркетинговым материалам, визуальным документам, простым дизайнам, учебным изображениям и контенту, где текст внутри картинки является частью результата, а не случайным дополнением.

Для пользователей ChatGPT это один из самых заметных визуальных релизов OpenAI за последнее время. ChatGPT Images 2.0 не просто улучшает качество изображения в общем смысле, а закрывает слабое место, которое долго мешало практическому применению генераторов: неточный текст внутри картинки. Если новая модель действительно будет стабильно держать качество надписей, языков и сложных макетов, это сделает ChatGPT заметно полезнее не только для творчества, но и для повседневной работы.