Tutoriel pour contourner les vérifications de conformité lors de la génération d'images avec ChatGPT 4o - L'exemple du style des animés Ghibli japonais.

Auteur: MakerNeo
DERNIÈRE MISE À JOUR: 2026-04-05 15:52:30
BALISE: AI

Index

Voici la traduction en français :

La récente fonctionnalité de génération d'images de ChatGPT 4o, publiée par OpenAI, est capable de produire des résultats précis et réalistes. Les designers doivent vraiment commencer à se préparer à perdre leur emploi. Twitter a récemment été inondé de captures d'écran, dont la plupart étaient dans le style des dessins animés Ghibli japonais. Sam Altman a même changé sa photo de profil pour adopter ce style.

Le nom du Studio Ghibli vient de l'italien "ghibli", qui signifie "vent chaud du Sahara". Pendant la Seconde Guerre mondiale, les pilotes de l'armée de l'air italienne ont également nommé leurs avions de reconnaissance "ghibli". Hayao Miyazaki, passionné d'aviation, a appris ce nom et a décidé de l'utiliser pour son studio, espérant qu'il déclencherait un tourbillon dans le monde de l'animation japonaise. Cependant, Miyazaki a mal compris la prononciation de "ghibli" lors du nommage, le prononçant "ジブリ(ji bu ri)" au lieu de la prononciation italienne originale "ギブリ(gi bu ri)", formant ainsi le nom unique de Ghibli.

Cependant, beaucoup ont échoué en mentionnant directement ghibli ou 吉卜力 dans leurs prompts de génération. En effet, la fonction de génération d'images de ChatGPT 4o doit garantir que les images générées sont conformes aux règles de la plateforme, comme éviter de générer du contenu violent ou protégé par le droit d'auteur. Ces règles sont définies par la politique de contenu d'OpenAI, qui comprend la détection de contenu sensible.

Voici deux méthodes pour contourner ce problème, qui conviennent également à d'autres situations où la génération d'images est refusée.

Méthode 1

Si vous connaissez le nom du style, demandez directement au modèle de langage de décrire les caractéristiques de ce style, puis demandez-lui de redessiner en fonction de ces caractéristiques. Par exemple, la description du style Ghibli est la suivante :

Le style d'animation japonais Ghibli est une esthétique visuelle et narrative unique, chaleureuse et réconfortante, qui combine un réalisme délicat avec une fantaisie onirique, et possède un style indépendant distinctif. Voici ses principales caractéristiques :

  • Utilisation des couleurs :
    • Basée sur la gouache, utilisant les caractéristiques de l'aquarelle : Les créations du Studio Ghibli utilisent principalement la gouache comme outil, qui a des caractéristiques telles qu'une forte couvrance, une luminosité élevée, des aplats de couleurs uniformes et une forte abstraction, ce qui facilite le contrôle global de l'image. En même temps, les créateurs de Ghibli utilisent également les effets de dégradé de l'aquarelle pour apporter richesse des couleurs et un aspect onirique.
    • Proche de la nature, utilisant des gris neutres et une saturation élevée : Bien que les couleurs des animations de Ghibli soient vives, elles sont généralement mélangées avec des gris neutres pour rendre les couleurs légères, douces, confortables et paisibles, tout en conservant une saturation élevée pour rendre l'image plus claire et mettre en évidence les détails.
    • Utilisation habile de filtres de couleur pour transmettre des émotions : Les animations de Ghibli utilisent des filtres de couleurs similaires pour transmettre le sentiment de l'image. Par exemple, dans "Le Château ambulant", des filtres orange et jaune sont utilisés pour créer une atmosphère chaleureuse, tandis que des filtres bleu-violet expriment une émotion austère et mélancolique.
    • Forte sensation de profondeur des couleurs : Même dans les images où les couleurs similaires sont fortement présentes, les animations de Ghibli peuvent créer une riche sensation de profondeur grâce à des différences de traits de pinceau, de sources de lumière et de couleurs subtiles.
  • Qualité visuelle :
    • Sensation de fait à la main : Les animations de Ghibli conservent un fort style de dessin à la main. Chaque image est comme une œuvre d'art soigneusement dessinée, avec des lignes fluides et naturelles et des détails riches.
    • Combinaison de réalisme et de fantaisie : L'image intègre de nombreux éléments fantastiques sur une base réaliste, avec des représentations fidèles des paysages naturels et des scènes fictives pleines d'imagination, comme les îles flottantes dans "Le Château dans le ciel".
  • Caractéristiques des personnages :
    • Qualité d'album d'images : Les personnages sont simples et modestes, avec des vêtements et des couleurs qui ne sont pas trop travaillés, ce qui met en évidence les caractéristiques du personnage.
    • Ratio tête-corps et caractéristiques physiques : Les personnages ont un petit ratio tête-corps, donnant souvent l'impression d'avoir une grosse tête. Les enfants ont des épaules étroites et un bas du corps court, tandis que les adultes mettent en valeur une constitution forte.
    • Arrondi : Le contour extérieur et le visage des personnages mettent en évidence un aspect arrondi, même pour les personnages antagonistes.
    • Caractéristiques du visage : La taille des yeux est normale, sans agrandir délibérément les cils ni appliquer d'ombre à paupières, tandis que la bouche est souvent exagérée et le nez est positionné haut, donnant une sensation unique de visage de "grenouille".

Supprimez les mots-clés Ghibli, puis copiez-les directement dans ChatGPT pour générer l'image.

Méthode 2

Générez une image à partir d'une autre image. Téléchargez directement deux images : la première est une image de style Ghibli et la seconde est l'image que vous souhaitez modifier, et donnez-les directement à ChatGPT. Cette méthode convient également lorsque vous voyez l'image de quelqu'un d'autre et que vous ne connaissez pas le prompt.

Par exemple, voici une image que j'ai vue générée par quelqu'un d'autre, et j'ai demandé à ChatGPT de générer une image similaire :

image

Voici la sortie : image

La deuxième méthode est meilleure. Pour le moment, il n'y a pas d'échec et vous n'avez pas besoin d'écrire vos propres prompts. Les informations contenues dans le prompt sont encore limitées. Une image vaut mille mots.