Как настроить ChatGPT для генерации креативов: заставляем ChatGPT и Gemini рисовать именно арбитражные баннеры

Ниже разбираем две самые доступные модели — ChatGPT и Gemini, — потому что они уже стоят у тебя в браузере, дешевые и умеют то, чего не умеет Midjourney: писать текст на картинке и редактировать твой готовый баннер словами. Вертикаль по умолчанию — FB gambling, гео-акцент Latam и Tier-2.

Какие нейросети рисуют рекламные креативы в 2026

Сначала сверим часы по моделям, потому что половина гайдов в выдаче безнадежно устарела и до сих пор советует "DALL-E 3". Забудь: DALL-E 2 и 3 OpenAI отключила 12 мая 2026. Когда сегодня нейросеть рисует рекламные креативы в ChatGPT или Gemini, под капотом работают совсем другие движки. Вот актуальный расклад на середину 2026-го.

ChatGPT Images 2.0 (модель gpt-image-2, релиз 21 апреля 2026) — текущий генератор картинок в ChatGPT и первая модель OpenAI с нативным режимом "рассуждения". Главный козырь под крео — лучший в классе рендер текста прямо в картинке: пишет CTA и бонусы вроде GANHE R$5000 без кракозябр — но каждый символ перед заливом все равно проверяй глазами, идеала пока нет.
Nano Banana 2 (Google, модель gemini-3.1-flash-image, релиз конца февраля 2026) — это и есть генератор картинок Gemini. Быстрый дефолт под объем и тесты: в 2-3 раза шустрее старшей модели, до 4K, на старте занял первое место по text-to-image на Artificial Analysis.
Nano Banana Pro (Google, модель gemini-3-pro-image, релиз 20 ноября 2025) — потолок качества на базе ризонинга Gemini 3 Pro. Лучшая консистентность персонажа и самый читаемый текст. Сюда гонишь 3-5 hero-крео, на которые делаешь ставку.

"Nano Banana" без цифры (модель gemini-2.5-flash-image) — это уже легаси, дешевый запасной движок, на который Gemini падает, когда у тебя кончилась бесплатная квота. Не путай его с актуальным Nano Banana 2.

Пользуйся ChatGPT, когда на креативе много текста (баннеры с бонусом, ценники, надписи на гео). Gemini — когда нужен один и тот же персонаж на десяти креативах и когда надо вставить реальный скрин приложения в сцену. На практике медиабаеры держат обе открытыми и перекидывают задачу между ними. Сводка для закладок:

Как настроить ChatGPT для креативов

Теперь главное — как настроить ChatGPT для креативов, чтобы он перестал выдавать "вообще красивую картинку" и начал штамповать заготовки под твой оффер. Секрет в том, что ChatGPT — это не Midjourney с одним полем для промпта. У него есть слой настройки, который большинство новичков игнорит, а зря: именно он превращает чат в персонального арт-директора. Пять рычагов:

Custom Instructions — задают постоянный контекст на все чаты. Сюда выноси то, что не меняется от крео к крео: "ты арт-директор перформанс-рекламы, я лью мобильные офферы, формат всегда вертикальный 9:16, стиль — UGC 'снято на телефон', без глянца и студийного света, текст на креативе пиши без ошибок и проверяй".
Projects — папка-кабинет под один оффер или гео. Кидаешь туда бриф, гайд по бренду, примеры заходящих крео из спая — и вся история генераций живет в одном месте, модель держит контекст кампании.
Custom GPT — это уже свой "крео-бот". Зашиваешь системный промпт, файлы с палитрой и форматами, правила — и получаешь переиспользуемого ассистента под гемблинг-крео, которого можно даже расшарить команде.
Референс-картинки — загружаешь свой стиль-фрейм, фото персонажа или готовый баннер и просишь редактировать по нему. gpt-image-2 принимает до ~16 референсов на один вызов правки.
Memory — опциональная память (ее видно и можно чистить), запоминает твои предпочтения между сессиями. Удобно, но если меняешь вертикаль — почисти, чтобы не тянула старый стиль.

Текстовый рендер у ChatGPT — главная причина держать его в стеке. Там, где Midjourney ломает буквы, gpt-image-2 спокойно пишет BONUS 200% или Saque via PIX на самом баннере.

Пользоваться CHatGPT удобно, ведь в одном и том же окне ты кормишь ему промпт: “ты арт-директор и создаешь визуал под мои требования, собери для меня промпты”

И уже следующим сообщением кормишь ему те же промпты чтобы получить свои креативы.

Один нюанс, на котором горят: у ChatGPT хронический желтый/сепия-оттенок ("piss filter") — картинки уводит в теплый тон, и чем больше генеришь, тем сильнее. Лечится прямо в промпте: добавь neutral white balance, accurate skin tones, bright midday light, no yellow cast — или поправь цвет на постобработке.

Gemini для креативов: Nano Banana 2 и Pro

Теперь Gemini для креативов. Если ChatGPT — это копирайтер, который умеет рисовать, то Gemini — режиссер, который помнит лица.

Доступ для обычного юзера: приложение Gemini → Tools → Create Images, дальше выбираешь режим Fast / Thinking / Pro (Pro = Nano Banana Pro, доступен на платных тарифах, у бесплатных — ограниченная квота, потом падает на легаси-модель). Разработчикам — Google AI Studio, Gemini API и Vertex AI.

Зачем он арбитражнику, если ChatGPT и так рисует? Три вещи, которые Gemini делает лучше:

Консистентность персонажа. Это киллер-фича под арбитраж. Nano Banana Pro держит лицо до пяти человек, Nano Banana 2 — до четырех персонажей в батче. То есть один и тот же "удачливый Диего" едет через все десять твоих крео, не превращаясь то в азиата, то в блондина (а голый ChatGPT этим грешит).
Multi-image fusion. Загружаешь скрин своего приложения (Plinko, Chicken Road, слот) плюс фото персонажа — и Gemini вклеивает реальный UI прямо в сцену, сохраняя персонажа с разных ракурсов. Это решает главную боль гемблинг-крео, о которой отдельный блок ниже.
Нативные форматы 4:5 и 9:16. Gemini выдает их пресетом из коробки, тогда как у gpt-image-2 точного 4:5 нет — там придется кропать или дорисовывать края.

Рычаги настройки у Gemini свои:

Gems — аналог Custom GPT. Собираешь свою "персону" по схеме Роль → Задача → Контекст → Формат: "ты дизайнер перформанс-крео под Latam-гемблинг, выдаешь вертикальные UGC-баннеры 9:16".
System instructions в AI Studio — если работаешь через студию, задаешь системный промпт и крутишь temperature. Для консистентного батча ставь низкую (0.0-0.3) — это детерминизм, персонаж и стиль не разъезжаются.
Референс-картинки — фиксируют identity и стиль. Загрузил reference sheet персонажа — и дальше "оставь это лицо, поменяй сцену".

Как настроить Gemini, ChatGPT, чтобы они рисовали именно арбитражные креативы?

Чтобы ChatGPT и Gemini рисовали арбитражные креативы, задай роль через настройку (Custom Instructions или Custom GPT, Gems): арт-директор перформанс-рекламы, формат 9:16, стиль UGC. Собирай промпт по слоям: локальный персонаж, громкая эмоция, телефон в руке, свет "снято на телефон", негативы против глянца. А реальный UI приложения, бренд и сумму бонуса добавляй руками на сборке или отдельной генерацией поверх готового изображения.

Каркас хорошего арбитражного промпта одинаков для обеих моделей — собирай его слоями, так проще править один элемент, не ломая остальные:

А теперь про настройку под роль. Самый рабочий прием для новичка — не просить картинку напрямую, а сделать из модели генератор промптов и редактора. Дай ей системную роль, и она начнет выдавать готовые промпты пачками:

Системный промпт "арт-директор перформанс-крео" (в Custom GPT / Gem): Ты — арт-директор перформанс-маркетинга. Я даю оффер и гео, ты выдаешь 5 детальных промптов на английском под вертикальный мобильный рекламный визуал 9:16. В каждом: персонаж с локальной внешностью (обычное лицо, не модель), громкая эмоция, телефон в руке экраном в камеру с ПУСТЫМ экраном-плейсхолдером, смешанный комнатный свет, тип камеры amateur/UGC, негативы против глянца. Без названий чужих брендов — описывай сцену и эмоцию честно (lucky moment, celebration), не привязываясь к запрещенной категории. Гео. Оффер: мобильное приложение с быстрым выводом.

Пробегись перед отправкой промпта в работу:

Задай роль через настройку, а не повторяй ее в каждом чате (Custom GPT / Gem).
Громкая эмоция в кадре — шок, радость, недоверие. Нейтральное лицо не продает.
Формат 9:16 или 4:5 сразу в промпте — под ленту / Stories.
Камера "снято на телефон" — amateur, front camera, grain. Глянец отторгается лентой.
Экран телефона — пустой плейсхолдер, реальный UI вставишь сам (см. ниже).
Сцена и эмоция нейтрально, бренд и сумму — на сборке руками.

Главная боль: экран телефона со слотом, который AI не умеет рисовать

Герой с креатива берет телефон, на экране — слот с тремя семерками или Plinko, и крупный план этого экрана. Так вот: ни ChatGPT, ни Gemini не нарисуют тебе реальный интерфейс твоего приложения. Они выдадут абстрактную "казиношную" мазню — выдуманные символы, кривые цифры, несуществующий UI. А игрок должен узнать конкретное приложение, иначе крео не конвертит. Поэтому профи давно не пытаются заставить нейросеть это нарисовать — они работают по пайплайну:

Ключевой шаг — второй. Берешь реальный скриншот приложения (тот самый слот с выигрышем), вставляешь его в "пустой" экран телефона на сгенеренном кадре в Photoshop или Canva, добавляешь блик и легкий наклон — чтобы выглядело снято, а не вклеено. У Gemini это можно сделать и через multi-image fusion: загрузить скрин приложения референсом, и модель сама впишет его в сцену. Если нужен видеоформат — этот же композит идет первым кадром в Veo 3, Kling 3 или Sora 2, а модели задаешь только движение (монеты падают, персонаж улыбнулся), а не генерацию с нуля.

Самая частая ошибка новичка — пытаться получить готовое крео одним промптом "нарисуй парня с выигрышем в казино". Так не работает. По наблюдениям практиков, голый text-to-image без ручной доводки дает мизерный выхлоп — на тестах ROI болтается в районе 0-20%, потому что экран нечитаемый, эмоция вялая, а вайб "реклама". Сильное крео — это всегда гибрид: нейросеть дает человека и сцену, твои руки дают реальный UI, текст и уникализацию. Цифры приводим как ориентир, а не обещание — у тебя будет свой расклад.

Консистентность персонажа на весь батч

Под арбитраж тебе нужен не один шедевр, а десять однотипных крео с одним персонажем — чтобы тестировать эмоции, бонусы и заходы, а не знакомить аудиторию каждый раз с новым лицом. Тут Gemini обходит голый ChatGPT :) у последнего лицо дрейфует от кадра к кадру, иногда меняя возраст и даже этничность. Рабочая схема:

Частый миф: "поставлю один сид и получу одного персонажа". В чат-потоке ChatGPT и Gemini сиды так не работают — это рычаг для Stable Diffusion и ControlNet. В чате персонажа держат референс-картинкой плюс прямой инструкцией "не меняй лицо". Nano Banana Pro вдобавок умеет частичную перерисовку: меняет комнату и фон, оставляя лицо нетронутым.

Проблема "слишком красиво": делаем вайб "снято на телефон"

Парадокс, который в обсуждении технических особенностей нейросетей мы уже отмечали и который тут обостряется вдвойне: и ChatGPT, и Gemini по умолчанию делают слишком красиво. Вылизанный глянцевый рендер на холодную аудиторию в ленте читается как "реклама" — и нативный фид его пролистывает или флагает.

На тестах обычная сток-фотка или картинка из Canva нередко выглядит естественнее любого AI-кадра и собирает меньше отказов. Поэтому крео надо осознанно пачкать под UGC:

В промпте: shot on an old phone, amateur photo, slightly out of focus, mixed cheap lighting, slight overexposure, off-center framing, no retouching.
На постобработке: урони разрешение, добавь легкое зерно и JPEG-артефакты, чуть пересвети, накинь блик от экрана. UGC — это "человек снял себя сам и делится", а не "бренд показывает продукт".
Против желтизны ChatGPT — neutral white balance в промпте или цветокор после.

Звучит контринтуитивно, но запомни: под FB-ленту цель не "красивая картинка", а "картинка, которая не выглядит рекламой". Идеальный AI-рендер с боке и студийным светом — это минус к CTR на холодную. Поэтому хороший медиабаер тратит половину усилий на то, чтобы сделать крео хуже по продакшену, но живее по вайбу. ChatGPT и Gemini это умеют — нужно только перестать просить у них "шедевр" и начать просить "фоточку с телефона".

Локализация под Latam и Tier-2 без потери конверта

Локализация крео — это культурная адаптация, а не машинный перевод, и нейросеть нельзя оставлять наедине с финальным резултатом. Главные правила:

Бразильский португальский, не европейский. pt-BR (cassino, неформальное "voce") звучит иначе, чем pt-PT (casino, формальное обращение). Бразилец отторгает европейскую речь мгновенно.
Испанский Latam ≠ один язык. es-MX, es-AR, es-CO — разная лексика и акцент. В Аргентине voseo: не "juega/gana", а "juga/gana", "registrate y llevate tu bono".
Фатальная ловушка "coger". В Испании глагол нейтральный ("брать"), в Latam — грубый сленг. Никогда не пиши "coge tu bono" — только "llevate tu bono". Одна такая ошибка убивает доверие к крео.
Локальные платежки крупным планом. Для Бразилии PIX — главный аргумент ("Saque na hora via PIX"), для Африки Tier-2 — M-Pesa и аналоги. Выноси логотип платежки на баннер.
Персонаж — гео-нативный. Лицо "не из региона" режет CTR на Tier-2 особенно жестко.

Нейросеть отлично пишет черновой текст на гео и переводит, но финальный вариант проверяй носителем или хотя бы вторым инструментом — машинный перевод в лоб роняет конверт. Примеры CTA по гео (это идиоматика медиабаеров, перед спендом подтверди у носителя):

Инструменты, проверки локализации под Latam. Да и вобще лови подборку сервисов, где проверять переводы носителями языков на экзотические ГЕО: Мексика, Аргентина, Колумбия, Чили, Тайланд, Вьетнам, Кения и пр.

DeepL Pro — лучший автоматический перевод для испанского/португальского, есть настройка формальности (tú/usted, vos), но не знает регионального сленга.
Grammarly с настройкой испанского — ловит грамматику, не сленг
Smartcat, Lokalise, Phrase, Crowdin — корпоративные платформы локализации, можно заказать review у носителей под конкретную страну.
Gengo, Stepes — быстрый перевод/ревью у нативов, дешевле агентств.
Upwork / Fiverr — ищите «native + country» (например «native Mexican Spanish copywriter»), для коротких креативов вообще копейки.
UserTesting.com, PlaybookUX, Userlytics — есть LATAM-панели, можно показать креатив 5–10 людям из нужной страны и собрать видеореакцию.
Pollfish, Prolific — опросники с гео-фильтром, дешевле и быстрее.
Reddit: r/Spanish, r/asklatinamerica, r/mexico, r/argentina, r/brasil — постите креатив, спрашиваете «звучит ли естественно». Реально отвечают. Бесплатный способ проверить тексты.
Discord-серверы по странам и языкам.

Что нельзя и почему: контент-политика и водяные знаки

Честный раздел, без которого гайд был бы хайпожорством. Подаю по состоянию на середину 2026-го — политики меняются, перед запуском сверяйся с актуальными страницами OpenAI и Google.

Что режут на входе. У OpenAI реал-мани гемблинг — запрещенная категория использования, а рекламные политики прямо не разрешают гемблинг-рекламу (узкое исключение — travel/lodging и игры без реальных ставок). У Gemini гемблинг не вынесен отдельной категорией отказа для генерации картинок, но Prohibited Use Policy запрещает обман, мошенничество и незаконную деятельность, плюс работает региональное регулирование.

Обе модели откажутся рисовать чужие логотипы и бренды, копирайт-персонажей, а Gemini с февраля 2026-го формально режет четыре категории: реальных узнаваемых людей и знаменитостей, face-swap, правку лица/одежды реальных людей и манипуляции с финансовыми документами. Поэтому прямой запрос "реклама казино с логотипом X" летит в отказ — это факт, а не бага.

Как побороть модерацию ChatGPT или Gemini? — обычно описывают сцену и эмоцию нейтрально ("lucky moment", "celebrating", "big win on phone"), а бренд, реальный UI и сумму бонуса добавляют на сборке руками.

Для API-юзеров OpenAI есть документированный параметр moderation: low (менее строгая фильтрация — это штатная настройка, а не "взлом", и она не отменяет запрещенные категории), у Vertex — personGeneration и safetySetting. Это настройка в рамках политики, а не обход.

Пошаговых методов обойти отказы, подделать чужие логотипы или снять водяные знаки мы не даем — это против правил и против тебя же.

Про водяные знаки — важно для арбитражника. Каждая картинка из ChatGPT и Gemini помечена, и это надо знать заранее:

С мая 2026-го OpenAI вшивает в картинки и метаданные C2PA, и невидимый SynthID от Google, и держит публичный verify-инструмент. У Gemini SynthID стоит давно — невидимый есть на всех тарифах всегда, а на бесплатном и Pro в приложении добавляется еще и видимая "искра"-логотип (ее нет только у API и подписки Ultra).

Практический смысл: AI-крео обычно детектируется как синтетика даже после правок и скриншота — не гарантированно, но как правило. Вывод для тебя — не "как обмануть детект", а "там, где раскрытие AI требуется, декларируй честно", иначе это policy strike на твой же аккаунт.

Не строй стратегию на "проскочу как не-AI". SynthID спроектирован переживать кроп, сжатие и скриншот, и Google с OpenAI прямо говорят: стопроцентного способа снять его нет. Гонка щита и меча тут есть, но ставка на обход водяных знаков и клоакинг — это растущие риски, а не волшебная таблетка, и вся ответственность на твоем аккаунте. Куда надежнее играть в открытую там, где можно, и вкладываться в качество крео, а не в его маскировку.

Хочешь больше связок и разборов? Подписывайся на "Где Трафик" в Телеграм — держим тебя в курсе того, как ИИ меняет медиабаинг.

FAQ: ChatGPT и Gemini под арбитражные креативы

Как настроить ChatGPT для креативов под арбитраж? Задай постоянную роль через Custom Instructions или собери Custom GPT с системным промптом "арт-директор перформанс-рекламы, формат 9:16, стиль UGC, текст без ошибок". Под каждый оффер заводи отдельный Project с брифом и референсами. Дальше проси не "картинку казино", а сцену с локальным персонажем, эмоцией и пустым экраном телефона — UI вставишь сам.

Можно ли просто попросить ChatGPT или Gemini нарисовать рекламу казино? В лоб — нет: реал-мани гемблинг и чужие бренды режет встроенная политика. Описывай нейтральную сцену и эмоцию ("lucky moment", "celebrating"), а бренд, реальный UI приложения и сумму бонуса добавляй вручную на сборке. Это вопрос формулировки, а не обхода цензуры.

Какая нейросеть рисует рекламные креативы лучше — ChatGPT или Gemini? Зависит от задачи. ChatGPT (gpt-image-2) — топ по тексту на картинке, бери под баннеры с бонусом и CTA. Gemini (Nano Banana 2 и Pro) — топ по консистентности персонажа и multi-image fusion, бери под линейку крео с одним лицом и под вклейку скрина приложения. На практике держат обе.

Почему персонаж меняет лицо от кадра к кадру? Голый ChatGPT дрейфует лицо, иногда меняя возраст и этничность. Решение — Gemini Nano Banana Pro: генеришь одну hero-персону, сохраняешь reference sheet и на каждом крео грузишь его с инструкцией "оставь это лицо, поменяй сцену", держа temperature 0.0-0.3. Сиды тут не помогают — это рычаг Stable Diffusion, а не чата.

Можно ли выдать AI-креатив за обычное фото? Рассчитывать на это не стоит. Картинки ChatGPT и Gemini несут невидимый водяной знак SynthID, спроектированный переживать кроп, сжатие и скриншот, — поэтому крео обычно детектируется как AI даже после правок. Метаданные C2PA снимаются легко, SynthID — нет. Там, где раскрытие AI требуется, декларируй честно.

Сколько картинок в день дают бесплатные тарифы? Немного и цифры плавают (это сообщения сообщества, неофициальные лимиты, сверяйся перед запуском): у ChatGPT на бесплатном — порядка 2-3 в день, на Plus — около 50 за 3 часа. У Gemini бесплатная квота на новых моделях ограничена, потом падает на легаси Nano Banana. Под объем выгоднее API или платный тариф.