このブログのタイトル画像を作るため、AI画像生成で遊んでみた

 このブログのタイトル画像(イラスト)をAI画像生成で作ってみました。


 AI画像生成に用いたサービスは「Seaart」です。

 プロンプトの作成にはChatGPTを活用しました。


 画像を作る流れをざっくり書きます。

1.描きたい絵を決める

 お遊びなのでなんでもよかったのですが、とりあえずこのブログのタイトル画像になるようなものを描くことにしました。

 最初はブログの主旨であるスピッツ、徳永英明、音楽関連のイラストを描かせよう!と考えました。しかしどうも良いイメージが湧きません。

 魔法の世界ではイメージできないものは実現できない……ということで断念。


 もうちょっと具体的にイメージできるもの……、このブログのサブテーマでもあるアウトドア・キャンプ関連ならどうでしょう。

 父母、3兄弟の5人家族がキャンプでBBQを楽しんでいるワンシーン。これならイメージできそうです。


2.プロンプトの作成

 イメージできても呪文を詠唱できるかはまた別です。呪文(プロンプト)をChatGPTに教えてもらうことにします。


 ChatGPTに、次のような感じで相談します。

 ブログのタイトル画像に使いたいです。
「初夏、森の中のキャンプ場、家族5人がキャンプを楽しんでいる。45歳の父はメガネをして髭を生やしている。彼はBBQで肉を焼いている。40歳の母は丸顔で細い。彼女はテーブルにお皿やコップを並べている。15歳の中学生の長男は椅子に座って携帯ゲーム機で遊んでいる。小学生の次男と三男はテントの周りを駆け回っている。楽しいムード。」
をプロンプトにしてください。


 すると、ChatGPTが

 素敵なブログ用のビジュアルですね!
「家族5人の初夏キャンプ」というテーマは季節感・ストーリー性・多様なキャラクター描写がそろっていて、見ている人に温かさと親しみを感じさせる画像になります。

 と返事をくれます。

 そして、

  • 英語プロンプト(FLUX / SeaArt / A1111対応、自然な家族シーン向け)
  • キー表現とその意図
  • 画像の比率(ブログタイトル用)
  • 雰囲気をもっと明るくしたい場合(任意)

 を教えてくれます。

 上記の「英語プロンプト」が解答そのものです。

 それ以外は詳しい解説やアドバイスです。かなり親切で丁寧です。


 ChatGPTが提案してくれた英語のプロンプトは下記です。

In an early summer forest campsite, a family of five is enjoying a lively camping day. The 45-year-old father wears glasses and has a beard; he is grilling meat at a barbecue with a content expression. The 40-year-old mother has a round face and a slender build; she is happily arranging plates and cups on a picnic table. Their 15-year-old son, a junior high school student, is sitting on a camping chair, playing on a handheld game console with a relaxed attitude. Two younger boys, both elementary school age, are joyfully running around the tent nearby. The atmosphere is fun, warm, and full of family bonding. Sunlight filters through the green trees, and camping gear like coolers, chairs, and lanterns are scattered naturally. High quality, realistic anime style, cheerful and heartwarming mood, vibrant color tones.

 ん-、読めん(^_^;)

 これをとりあえずSeaArtのプロンプト入力部にコピペします。


3.ベースモデルを決める

 このプロンプトで画像をいくつか生成します。


 しかしなかなか思った通りのものができません。

 例えば、この画像。


 登場人物5人中4人が携帯ゲームで遊んでいます。(本来はゲームしているのは長男のみ)

 また3人兄弟のはずが2人は姉妹になっています。挙句の果てには母親はどこへ行った?


 AI画像生成では役割分担した5人家族を出すのはかなり難しいようで、ベースモデルをとっかえひっかえして何度も生成しましたがなかなかうまくいきません。

 他にはこんな失敗作とか。


 テントの形が変ですし、一人だけぽつんとしている子供はいったい何があった!?



 試行錯誤した結果、「SeaArt Film」というSeaArt公式のものと思われるベースモデルが一番再現度が高いことがわかりました。

 下の絵のように、ほぼ指示通りのものが一発で出てきました。


 しかし、上の絵でもおかしなところが2つあります。

 ① 長男の携帯ゲーム機(スイッチっぽい)が裏表逆

  ⇒何回生成しても100%逆になります。

 ② 母親の近くに小さい子供が出現する

  ⇒母親の近くか、バックの兄弟2人のそばに90%くらいの確率で子供が出現します。うちはいつから6人家族になったんだ!?


 そこでこの2つを修正したプロンプトを作成することにしました。


3.プロンプトを修正する

 具体的には

 ① 携帯ゲーム機⇒スマホに変更

 ②人数を明示する

 という修正を加えます。


 ②についてはChatGPTに尋ねらたら「There are only five people in the scene — no extra children.」というプロンプトを提案されました。


 修正したプロンプトで何度か生成を試して、これだ!というのができました

 それがこちら。


 5人家族。3人兄弟。スマホゲーム。キャンプ。BBQ。全部クリアです。

 絵柄がちょっと淡白ですが、細かい指定が正しいのでそこは目をつぶります。


 さらに、ブログタイトルを入れるスペースを空けるようにお願いしてできたのがこちらです。↓


 追加のプロンプトは「Leave extra space on the upper part of the image for text placement (like a blog title). Make the composition slightly panoramic with room for title overlay. 」です。


 父親(僕)がすごいもさもさの髭で老け込んでますが、まあ楽しそうな雰囲気は出てるので良しとしましょう。


 遊ぶぶんにはAI画像生成は楽しいですね。

 今回作った画像を実際にブログで使うことはないですが、次は音楽関係を主題にして一枚作ってみようかな。

 エレキギターがじゃーーんっと鳴ってるかっこいいやつ。


コメント