Tutorial sobre como contornar as verificações de conformidade ao gerar imagens com o ChatGPT 4o - usando o estilo de anime Ghibli japonês como exemplo.
Index
A recente funcionalidade de geração de imagens do ChatGPT 4o, da OpenAI, é capaz de produzir resultados precisos e realistas. Parece que os designers terão que se preparar para perder seus empregos. O Twitter recentemente foi inundado com imagens geradas, muitas no estilo dos animes do Studio Ghibli, incluindo o próprio Sam Altman que mudou sua foto de perfil para esse estilo.
O nome Studio Ghibli vem do italiano "ghibli", que significa "vento quente do Saara". Durante a Segunda Guerra Mundial, pilotos da Força Aérea Italiana também chamavam seus aviões de reconhecimento de "ghibli". Hayao Miyazaki, um entusiasta de aeronaves, ao saber desse nome, decidiu usá-lo para seu estúdio, esperando que ele causasse um turbilhão na indústria de animação japonesa. No entanto, Miyazaki teve um mal-entendido na pronúncia de "ghibli" ao nomear o estúdio, pronunciando-o como "ジブリ (ji bu ri)" em vez do original italiano "ギブリ (gi bu ri)", formando assim o nome único Ghibli.
No entanto, alguns usuários têm enfrentado falhas ao tentar gerar imagens diretamente com prompts que mencionam ghibli ou 吉卜力. Isso ocorre porque a funcionalidade de geração de imagens do ChatGPT 4o precisa garantir que as imagens geradas estejam em conformidade com as regras da plataforma, evitando a geração de conteúdo violento ou com direitos autorais. Essas regras são definidas pelas políticas de conteúdo da OpenAI e envolvem a detecção de conteúdo sensível.
A seguir, apresento duas maneiras de contornar essa restrição, que também podem ser aplicadas em outras situações semelhantes em que a geração de imagens é rejeitada.
Método 1
Conhecendo o nome do estilo, instrua o modelo a descrever as características desse estilo e, em seguida, peça para o modelo redesenhar com base nessas características. Por exemplo, a descrição do estilo Ghibli é a seguinte:
O estilo de anime do Studio Ghibli é único, encantador e reconfortante, combinando realismo sutil com fantasia, com um estilo distintivo e independente. Aqui estão as suas principais características:
- Uso de cores:
- Base em têmpera, utilizando características de aquarela: As criações do Studio Ghibli geralmente usam têmpera como ferramenta, que possui alta cobertura, brilho, blocos de cor uniformes e forte generalização, facilitando o controle geral da imagem. Além disso, os criadores da Ghibli também utilizam o efeito de esfumado da aquarela, trazendo riqueza de cores e uma sensação de sonho.
- Próximo da natureza, utilizando tons de cinza sofisticados e alta saturação: Embora as cores nas animações da Ghibli sejam vibrantes, geralmente são misturadas com alguns tons de cinza sofisticados, fazendo com que as cores pareçam leves, suaves, confortáveis e silenciosas, ao mesmo tempo em que mantêm uma alta saturação, tornando a imagem mais nítida e os detalhes mais proeminentes.
- Uso inteligente de filtros de cor para transmitir emoções: As animações da Ghibli usam filtros de cores semelhantes para transmitir a emoção da imagem, como em "O Castelo Animado", onde filtros laranja e amarelo são usados para criar uma atmosfera calorosa e entusiasmada, e filtros azul-púrpura expressam emoções sombrias e melancólicas.
- Forte senso de camadas de cores: Mesmo em imagens com uma grande proporção de cores semelhantes, as animações da Ghibli conseguem criar uma rica sensação de camadas por meio de pinceladas, fontes de luz e pequenas diferenças de cores.
- Qualidade da imagem:
- Sensação de pintura à mão: As animações da Ghibli mantêm um forte estilo de pintura à mão, cada quadro parece ser uma obra de arte cuidadosamente desenhada, com linhas suaves e naturais e detalhes ricos.
- Combinação de realismo e fantasia: A imagem incorpora muitos elementos fantásticos com base no realismo, com representações verdadeiras de paisagens naturais e cenas fictícias cheias de imaginação, como as ilhas flutuantes em "O Castelo no Céu".
- Características do design de personagens:
- Qualidade de livro ilustrado: As figuras dos personagens são simples e rústicas, e as roupas e esquemas de cores não são excessivamente projetados, destacando as características dos personagens.
- Proporção cabeça-corpo e características corporais: Os personagens têm uma proporção cabeça-corpo pequena, geralmente com uma sensação de cabeça grande, as crianças têm ombros estreitos e parte inferior do corpo curta, enquanto os adultos destacam uma constituição forte.
- Arredondamento: As linhas do contorno externo e os rostos dos personagens enfatizam a sensação de arredondamento, mesmo os personagens vilões não são exceção.
- Características faciais: O tamanho dos olhos é normal, sem exagerar nos cílios ou desenhar sombra nos olhos, enquanto a boca é frequentemente exagerada e a posição do nariz é mais alta, dando uma sensação única de rosto de "sapo".
Remova as palavras-chave Ghibli e copie a descrição diretamente para o ChatGPT para geração.
Método 2
Gere uma imagem a partir de uma imagem, carregando diretamente duas imagens: a primeira é uma imagem no estilo Ghibli e a segunda é a imagem que você deseja alterar. Forneça-as diretamente ao ChatGPT. Este método também é adequado para situações em que você vê uma imagem de outra pessoa e não sabe o prompt usado para criá-la.
Por exemplo, aqui está uma imagem que vi gerada por outra pessoa e pedi ao ChatGPT para gerar uma semelhante:

Aqui está a saída:

O segundo método é melhor. Atualmente não há falhas e não é necessário escrever seu próprio prompt, pois as informações contidas no prompt são limitadas. Uma imagem vale mais que mil palavras.