遠きAI使いへの道~あさりの変~

こんにちは。販売企画部のYです。
さて、前回に引き続きAIの画像生成についてお届けです。
最初にネタバレをいたしますが、今回は成功しました!!
鼻歌で仕事の片手間に作成しましたよ!
と、言いたいところですが、表題の通りでございます。
今回は些細な修正の難しさについてお伝えするべき、やや長めにお送りいたします。

1.例示のイラストをつくろう!

今回生成したいのはお客様向けにやり方を示すための例示イラストです。前回のイラスト生成で、ChatGPT自身からコツは聞いています。それに則りつつ、重箱の隅をつつくような生成条件を作成します!

下記の条件に合致する画像の生成の条件を伝えます。 条件を送付ののち、写真を数点、別添します。 
「写真の送付を完了しました。画像生成を開始してください。」 のメッセージののち、画像の生成を開始してください。 それまでは待機してください。
<条件>
1.画像のサイズと比率 A4用紙の比率で350doi
2.画面の構成 例示するイラストとして使用するため 文字は含まず、「〇」と「×」で示す
画面左に〇、画面右に×の例を表示する
3.イラストを例示するゲームの内容
あさり(貝類)のつかみ取りをする体験。
半透明のビニール手袋を着用した手であさりを掴む。
あさりは発泡スチロールに入っている。
発泡スチロールのなかには6~7個程度のあさりが入っている。
あさりの大きさは、掴んでいる手の大きさに対し、4分の1である。
<絶対条件>
あさりを掴む手は必ずビニール手袋を着用する あさりを掴む手は必ず片手である
4.〇の例 指示の次に数点の写真を送付します。 〇の例、として送付した写真をもとに作成します。
・〇になる条件
あさりを上から掴んでいること
5.×の例 指示の次に数点の写真を送付します。×の例、として送付した写真をもとに作成します。
・×になる条件
あさりを下から掴んでいる 手を下から差しいれ、手を器かわりにして乗せている
6.イラストのテイスト 子供向けのイラストをイメージした、柔らかいタッチと色合い 例示は手元のみでOK 人の顔は不要


次に写真を送付するので、合図があるまで生成は行わず、待機してください。

な……長い!
ChatGPTくんもきちんと待機してくれているので、それぞれの例示となる写真を送り、合図をすれば生成スタート!
今回は縮尺も無いので、ChatGPTくんもササっと作ってくれるでしょう!

んんん……

<×point>
・あさりを1個つまんでるだけ
・左右が切れてる(A4用紙のサイズ比じゃない)

でもかなり想定していた絵に近いです!

<修正点> 
・〇の例
あさりを数個まとめて掴む
手の方向は修正しない
・比率
A4用紙を横長にしたときの比率で画像生成する
・全体
左右が切れてしまっているので手や○×、発泡スチロールなど要素を画面のなかにおさめ

さて、これさえ直ればバッチリですね!

おお~!バッチリ!
と、思いましたが、あさりの数が直っていません…。数個、というあいまいな表現が良くなかったかもしれません。
あと〇と×じゃないですね。いまさら気付きました。

画像の比率や構成は問題ありません。
<修正点>
・例示について
〇と×に修正
・左の例示
あさりを4つ、握って下さい

はい!これで完了。バッチリです!

すわ完成かと喜んだところで、間違いに気付きました。

気付かなければ幸せでしたが…

2.些細な修正を反映させよ!

右の例示のビニール手袋がアハ体験並みにちょっと短くなっています。
なぜなんでしょう…脳トレ……?

右の例示のビニール手袋がアハ体験並みにちょっと短くなっています。
なぜなんでしょう…脳トレ……?

<修正点> 
右の例示のビニール手袋を、手袋の形に修正してください。
左の例示の長さが正しいです。

なぜ。

また左右が切れてしまいました。
たしかに左右を切るなという指示はしていませんでしたが、人間ではありえない修正です。

<修正点>
・画像サイズ1:√2の比率を維持してください
・発泡スチロールや手などは画面内におさめてください
・左の例示のようにビニール手袋を着用していることがわかるよう、右の例示も腕の部分(ビニール手袋ではない部分)を描写してください

意気揚々とA4のサイズ比を調べてドヤ顔で指示したらこれです。
A4用紙のね、横向きがいいんですよ……

しかし!ゴールは見えてきました!
さあ、横長のイラストにして終了です♪

<修正点>
縦1:横√2でお願いします。
それ以外は絶対に変更しないでください

…そで…………?

それ以外は絶対に変更しないで、と言ったはずが、縦長のまま袖が増えました。
袖が増える前の画像を添付して、もう一度念押しをします!

・添付した画像を、A4用紙の横長向きの比率に修正してください。
・それ以外の要素は絶対に変更しないでください。
・行ってしていいのは比率の修正と、それに伴う要素の再配置のみです。

そで~~!

そして、なんとなく右の腕の色が濃くなってきた気がします。定期的に挟まる脳トレ…。
左の例示の腕が袖じゃない可能性もあるので色味をしっかり指定すれば、きっと分かってくれることでしょう。

腕の色は、うすだいだい色(navajowhite #ffdead)にしてください。
左右どちらの例示の腕の色も同色で問題ありません。
発泡スチロール同士の間を5pt離してください。

ジワジワ近づいてきていた発泡スチロールも引き離しましょう。

な……なに……?

絵がザラザラになっただけでなにひとつ変わっていません。
たしかにさっき「他は変えないで」って言いましたけど……

さきほどの修正指示のどの部分がこの画像をザラザラの質感にし、かつ他の修正指示をすべて無視する結果になるのか、教えてください

本当に知りたい。さすがにこうなるとは思ってない…。

非常に鋭い観察です。
今回のように**「質感がザラザラになった」「他の指示が無視された」のは、あなたの修正文そのものが原因ではありません。
正確に言うと、次のようなAIの内部処理上の誤解・解釈のズレ**が起きたためです。

長くなるので要点をまとめると

・「肌の色の指定」+「参照画像」⇒新しいスタイルで生成だ!と解釈した
・A4ヨコ向きという指示⇒全体の再構築しなきゃ!と解釈した
・質感、彩度、線の太さについて保持するように指示されなかった
…結果、元のテーマをもとに再描画した

ということらしいです。

だとしてもそうはならんでしょう。

ChatGPTくんも間違いに気付いてくれたようなので、再度生成してもらいます。

再生成の代償に、〇の例のあさりが減りました。減らさないでほしい…。

前回の画像のスタイル(線・色・質感・背景のトーン)を完全に維持してください。
変更するのは、〇の例示で掴んでいるあさりの数を4個に増やすことのみです。
×の例示や全体の色味・テクスチャ等は一切変更しないでください。

これにて完成です……!

ビニール手袋っていうかゴム手袋にみえなくもないですが…いやいや…
長い戦いでした。
ひとつひとつは些細な修正のはずが、とんでもなく回り道になりました。

3.まとめ

前回の反省を活かしたため滑り出しは非常に好調でしたが、些細な微修正を繰り返すことで、襲い来る脳トレと突然変異。ChatGPTは画像生成における「前の生成物の保持」が苦手な気がします。

それを踏まえての、自戒的な次回への学びです。

・絶対に変えてほしくないところは毎回指示する
・修正点を伝えるときは「変更して良い点は〇〇のみ」であると限定し、強調する
さて、今回の例示イラストを使用するイベントは2025年11月1日(土)・2日(日)に道の駅ふくしまにて開催される「海の幸まつり第7弾」です。

テントがあるので雨でも安心して手ぶらBBQにご参加いただけます!

福島県産品を使用したキッチンカーや屋台もあり、福島県内で活躍する演者のみなさまによるステージもございます。
お子様向けの無料体験もあるので、ぜひぜひお越しください♪
<BBQのご予約はこちら