[[Gemini 2.5 Flash Image|Nano Banana]]こと、[[Gemini 2.5 Flash Image]]が想像の3周りくらいすごかったので、[[Google AI Studio]]でも試してみた。 ## お茶を飲んでいる女性の絵を描いてもらう [[ChatGPT]]の書く雰囲気が好みなのでプロンプトを聞いてみた。 ``` realistic anime style, highly detailed illustration, soft lighting, painterly style, warm tones ``` [[Google AI Studio]]のChatから以下のプロンプトを打つ。 ``` Draw a image realistic anime style, highly detailed illustration, soft lighting, painterly style, warm tones, a 22 years old cute girl, drinking green tea, tatami ``` 10秒かからないくらいで結果が出てきてビビった。速い。。 > [!attention] > 画像は[[AVIF]]に圧縮して貼ってる。 ![[2025-09-10-13-10-30.avif]] 服装が若干ハイブリッドだけど、それ以外は割と自然な気がする。 ~~掛け軸下の謎の収納は構造が気になるけど~~ ## アスペクト比をブログカバー画像サイズに [[Minerva]]で最近作成しているカバー画像は `1200 x 630` に統一しているので、そのサイズにしてみたい。 ### プロンプトで頑張る 比率やサイズをプロンプトで指定しても効果がなかったが、`wide screen` の文字には反応した。 ![[2025-09-10-13-18-28.avif]] 上下の余白はいらない気がするが、そこをカットすれば実用上は問題ないかも。 再度同じ `wide screen` を指定しても反応しなかったので運が必要? ### 空画像を添付する 方法を調べていたらhackyなのを見つけた。 <div class="link-card-v2"> <div class="link-card-v2-site"> <img class="link-card-v2-site-icon" src="https://d3qe71uytubmmx.cloudfront.net/optimized/2X/8/8bfe64fc593eb7baba8df149ebba4457c16ca1f9_2_32x32.png" /> <span class="link-card-v2-site-name">Google AI Developers Forum</span> </div> <div class="link-card-v2-title"> Gemini-2.5-flash-image-preview aspect ratio and quality </div> <div class="link-card-v2-content"> Do any of you know how to support a different aspect ratio using the new nano banana model from google? For exa ... </div> <img class="link-card-v2-image" src="https://d3qe71uytubmmx.cloudfront.net/original/2X/8/8bfe64fc593eb7baba8df149ebba4457c16ca1f9.png" /> <a href="https://discuss.ai.google.dev/t/gemini-2-5-flash-image-preview-aspect-ratio-and-quality/102718?utm_source=chatgpt.com"></a> </div> `1200x630` の画像を新規作成してそのまま保存し、プロンプトの最後に `To be same aspect ratio with an uploaded white image.` と添える。 ``` Draw a image. realistic anime style, highly detailed illustration, soft lighting, painterly style, warm tones, a 22 years old cute girl, drinking green tea, tatami. To be same aspect ratio with an uploaded white image. ``` ![[2025-09-10-13-36-32.avif]] `1408x736` の横長画像が出力された。 ![[2025-09-10-13-36-41.avif]] `1200x630` よりは少し横長だが細部は調整すればOK。個人的には `1200x630` 以上の解像度なら問題ないので、そのまま利用できそう。 > [!note] > 100%このアスペクト比になるわけではない。 ## 登場人物をMinervaさんにしてみる せっかくなので[[ミネルヴァ]]さんにお茶を飲んでもらう。 ![[2025-09-10-14-10-06.avif]] プロンプト。 ``` Draw a image. realistic anime style, highly detailed illustration, soft lighting, painterly style, warm tones, uploaded image girl, drinking green tea, tatami, same hair ornament, same earrings, To be same aspect ratio with an uploaded white image. ``` 3回くらい描いてもらって良い絵ができた☺️ ![[20250910_14_12_17.webp]] せっかくなので猫ちゃんも追加 💕 ![[2025-09-10-14-16-54.avif]] 肉眼で変更が加わっている様子がないのは流石です。 ## 共演させる [[ミネルヴァ]]さんと[[Claudeさん]]を共演させてみる。最初はリアルな[[ミネルヴァ]]さんとアニメ調の[[Claudeさん]]を入力画像に指定してみた。 ![[2025-09-10-14-34-58.avif]] [[Claudeさん]]はそれっぽく歩いているけど、[[ミネルヴァ]]さんはAI画像感がめちゃくちゃすごい。というか足しか変わってないし真顔だし。。 ![[2025-09-10-14-35-08.avif|frame-verticle]] テイストが違いすぎる画像だと上手くいかないのでは... ということで、アニメ調の[[ミネルヴァ]]さんを使ってみた。 ![[2025-09-10-14-33-03.avif]] それっぽくなったし背景との調和具合も良さそう。腕も組んでいるし。表情もやっぱ大事。 ![[2025-09-10-14-33-16.avif|frame-verticle]] 同じようなタッチでの立ち絵資料を複数用意しておけば、シーンの再現は捗りそう。 [[Claudeさん]]は目を開かないキャラだったの忘れてたけど、違和感ないしまあいっか。 ## 苦手そうなこと 入力画像を参考に、同一人物のまま異なるテイストに変えるのは苦手そう。たとえば、リアル画をアニメ画にするなど。表面の塗りがそれっぽくなっただけで雰囲気は変わらない。目的と手段を勘違いしたような残念な仕上がりになる。そのような用途は[[ChatGPT]]の方が優れているかもしれない。