Обход проверки соответствия при генерации изображений в ChatGPT 4o: пример со стилем японской анимации Ghibli

Автор: MakerNeo
ПОСЛЕДНЕЕ ОБНОВЛЕНИЕ: 2026-04-05 15:52:09
ТЕГ: AI

Index

Недавний релиз ChatGPT 4o от OpenAI включает функцию генерации изображений, способную создавать точные и реалистичные результаты. Дизайнерам, похоже, стоит приготовиться к возможной потере работы. Twitter недавно заполонили изображения, сгенерированные этой функцией, особенно в стиле аниме студии Ghibli. Даже Сэм Альтман сменил аватар на изображение в этом стиле.

Название "Ghibli" происходит от итальянского слова "ghibli", означающего "горячий ветер в Сахаре". Во время Второй мировой войны итальянские летчики-разведчики также называли свои самолеты "ghibli". Хаяо Миядзаки, будучи страстным поклонником авиации, узнав об этом названии, решил использовать его для своей студии, надеясь, что она поднимет вихрь в японской анимационной индустрии. Однако Миядзаки неправильно произносил "ghibli" при названии, произнося его как "ジブリ (ji bu ri)", а не как оригинальное итальянское "ギブリ (gi bu ri)", что и сформировало уникальное название "吉卜力".

Однако многие сталкиваются с неудачей при попытке сгенерировать изображение, используя вprompt слова ghibli или 吉卜力. Это связано с тем, что функция генерации изображений ChatGPT 4o должна обеспечивать соответствие создаваемых изображений правилам платформы, таким как избежание насилия или контента, нарушающего авторские права. Эти правила определяются политикой контента OpenAI и включают обнаружение чувствительного контента.

Ниже представлены два способа обхода этой проблемы, которые также подходят для других случаев, когда генерация изображений отклоняется.

Способ 1

Зная название стиля, можно попросить большую языковую модель описать особенности этого стиля, а затем попросить модель перерисовать изображение, основываясь на этих особенностях. Например, описание стиля Ghibli выглядит следующим образом: Японский аниме-стиль студии Ghibli - это уникальная, теплая и исцеляющая визуальная и повествовательная эстетика, сочетающая в себе тонкий реализм и волшебную фантазию, с ярко выраженным собственным стилем. Вот его основные характеристики:

  • Использование цвета:
    • На основе гуаши, с использованием акварельных характеристик: Большинство работ студии Ghibli создаются с использованием гуаши, которая обладает такими характеристиками, как высокая степень покрытия, высокая яркость, ровные цветовые блоки и обобщенность, что облегчает общее управление изображением. В то же время, создатели Ghibli используют эффект размытия акварели, чтобы привнести насыщенность цвета и ощущение мечты.
    • Близость к природе, умелое использование сложных серых и высоких степеней насыщенности: Хотя цвета в анимации Ghibli яркие, в них обычно добавляют немного сложных серых тонов, чтобы цвета выглядели легкими, нежными, комфортными и спокойными, сохраняя при этом высокую степень насыщенности, чтобы сделать изображение более четким и выделить детали.
    • Умелое использование цветовых фильтров для передачи эмоций: Анимация Ghibli использует аналогичные цветовые фильтры для передачи эмоций на изображении. Например, в "Ходячем замке Хаула" используются оранжевые и желтые фильтры для создания теплой и восторженной атмосферы, а сине-фиолетовые фильтры - для выражения мрачной и угрюмой атмосферы.
    • Сильная цветовая иерархия: Даже на изображениях с большой долей аналогичных цветов, анимация Ghibli может создавать богатую иерархию благодаря мазкам, источникам света и небольшим различиям в цветовой гамме.
  • Качество изображения:
    • Ощущение ручной работы: Анимация Ghibli сохраняет сильный стиль ручной работы, каждый кадр выглядит как тщательно нарисованное произведение искусства, с плавными и естественными линиями и богатыми деталями.
    • Сочетание реализма и фантазии: Изображение сочетает в себе реализм и большое количество фантастических элементов, включая как реалистичные изображения природных ландшафтов, так и полные воображения вымышленные сцены, такие как плавучие острова в "Небесном замке Лапута".
  • Особенности персонажей:
    • Атмосфера книжки с картинками: Персонажи просты и скромны, одежда и цветовые схемы не перегружены дизайном, а подчеркивают особенности персонажей.
    • Соотношение головы и тела и физические особенности: У персонажей небольшое соотношение головы и тела, обычно создается ощущение большой головы, у детей узкие плечи и короткая нижняя часть тела, а у взрослых подчеркивается сильное телосложение.
    • Скругление: Внешние контуры и лица персонажей подчеркивают ощущение округлости, даже у злодеев.
    • Особенности лица: Глаза нормального размера, без намеренно увеличенных ресниц или теней для век, а рот часто преувеличен, нос расположен выше, что создает уникальное ощущение "лягушачьего" лица.

Удалите ключевые слова Ghibli и скопируйте описание в ChatGPT, чтобы сгенерировать изображение напрямую.

Способ 2

Используйте изображение для генерации изображения. Загрузите два изображения: первое - изображение в стиле Ghibli, второе - изображение, которое вы хотите изменить, и просто предоставьте их ChatGPT. Этот метод также подходит для случаев, когда вы видите чужое изображение и не знаете prompt. Например, вот изображение, которое я увидел сгенерированным кем-то другим, и которое я попросил ChatGPT сгенерировать аналогичное:

image

Вот результат: image

Второй способ лучше. Пока не было неудачных случаев, и вам не нужно писать подсказки самостоятельно, так как подсказка содержит мало информации. Лучше один раз увидеть, чем сто раз услышать.