ChatGPT Images 2.0 улучшила генерацию изображений и текста на картинках
OpenAI представила ChatGPT Images 2.0 — новую модель генерации изображений внутри ChatGPT. Компания описывает релиз как «новую эру генерации изображений» и подчёркивает три ключевых улучшения: более качественный рендеринг текста, поддержку нескольких языков и более сильное визуальное reasoning. В release notes OpenAI также указано, что ChatGPT Images 2.0 доступна на всех тарифных планах ChatGPT.
Главное отличие обновления в том, что модель лучше справляется не только с красивыми иллюстрациями, но и с более практичными задачами. OpenAI прямо выделяет улучшенную работу с текстом на изображениях, а в системной карточке пишет о заметном прогрессе в instruction following, world knowledge и генерации сложных деталей, включая плотный текст. Это особенно важно для постеров, инфографики, карточек, макетов интерфейсов, меню, баннеров и других изображений, где раньше нейросети часто ошибались в надписях или ломали структуру макета.
Отдельный акцент сделан на мультиязычности. OpenAI показывает, что модель лучше работает с разными письменностями и языками, а не только с английским текстом. Для пользователей это означает более уверенную генерацию изображений с подписями, афишами и рекламными материалами на разных языках, где раньше качество текста часто было слабым даже при хорошем визуальном стиле.
Ещё одно нововведение — images with thinking. В release notes OpenAI объясняет, что в этом режиме модель получает больше времени на обдумывание запроса и может планировать и дорабатывать будущий результат до самой генерации. Эта функция доступна на всех платных планах ChatGPT и работает при выборе Thinking и Pro models. По сути, OpenAI переносит в генерацию изображений ту же идею, которая уже используется в более «думающих» текстовых моделях: не просто быстро выдать картинку, а сначала лучше понять задачу.
На практике обновление выглядит как шаг от «картинок ради эффекта» к более рабочему инструменту. В примерах OpenAI показывает постеры, многоязычные макеты, редакционные развороты, комиксы, рекламные материалы и насыщенные визуальные сцены с большим количеством текстовых и графических элементов. Это важный сигнал для рынка: генерация изображений всё сильнее движется в сторону утилитарных задач, где важны не только стиль и креативность, но и читаемость, точность надписей и контроль над композицией.
Чтобы было проще понять суть релиза, основные изменения можно свести в короткую таблицу.
| Что обновили | Что это даёт пользователю |
|---|---|
| Рендеринг текста | Более читаемые надписи на постерах, карточках, баннерах и макетах |
| Поддержка нескольких языков | Лучшая генерация текстов и визуалов не только на английском |
| Визуальное reasoning | Более точное выполнение сложных запросов и лучшее понимание композиции |
| Images with thinking | Дополнительное планирование результата перед генерацией |
| Доступность в ChatGPT | Использование ChatGPT Images 2.0 на всех тарифных планах |
Эти изменения важны ещё и потому, что они расширяют круг сценариев использования ChatGPT. Если раньше генерация изображений часто ассоциировалась с артами, стилизациями и развлекательными картинками, то теперь OpenAI явно подталкивает продукт к более прикладным задачам: маркетинговым материалам, визуальным документам, простым дизайнам, учебным изображениям и контенту, где текст внутри картинки является частью результата, а не случайным дополнением.
Для пользователей ChatGPT это один из самых заметных визуальных релизов OpenAI за последнее время. ChatGPT Images 2.0 не просто улучшает качество изображения в общем смысле, а закрывает слабое место, которое долго мешало практическому применению генераторов: неточный текст внутри картинки. Если новая модель действительно будет стабильно держать качество надписей, языков и сложных макетов, это сделает ChatGPT заметно полезнее не только для творчества, но и для повседневной работы.




