Googlが提供するテキストベースの生成AI「Gemini」で画像を生成してみました。
Geminiはテキストベースと言われていますが、画像生成を指示するプロンプトで簡単に目的の画像を作成してくれとても便利です。
Geminiで画像生成の手順
パソコンでの手順です。
ブラウザは何でも大丈夫だと思いますが、ここではChromeの最新版を使用しています。
パソコンで画像を生成するわけでなく、Geminiの側で処理するので、あまりに古いパソコンでなければどんなものでも大丈夫だと思います。
Webアプリなので使用するOSもWindows、Linux、Macを問いません。ここではMacOS Ventura13.7.5となっています。
実際の画像生成手順
とても簡単です。
- パソコンで gemini.google.com にアクセスします。
- 画像を生成するためのプロンプトを入力します。
これだけです。
プロンプトの参考例
やはりテキストの場合と同じく、なるべく具体的な内容のプロンプトを使用することで満足のいく画像が生成される確率が高くなります。
プロンプトはあまり難しく考える必要はありません。ツボは「具体的に」です。
一度で期待通りの結果が得られなかった場合は、プロンプトを手直しして再度調整してみてください。
だんだんと期待に添った結果が得られるようになると思います。
実際のプロンプト例
- 自然に囲まれた古びた山道を走る未来の自動車の画像を生成して
- サーフボードに乗っている犬の画像を作成して
- スプラッシュを多用した水彩画風で、1 本の川が流れるジャングルの画像を作成して
上記はGooglのヘルプに記載してあるプロンプトの例ですが、かなり具体的であることがわかるでしょう。
ひとつ画像生成してもらいましょう。
一番最初の「自然に囲まれた古びた山道を走る未来の自動車の画像を生成して」を
Geminiに指示すると…
ちょっと全体的に暗いけど指示どおり?のイメージ画像が得られることがわかるでしょう。
ちなみに解像度と画像サイズは以下の通りで、大体このくらいで出力されることが多いです。
Web上で使用するには充分な解像度・サイズですね。
アスペクト比を変える方法
初期のデフォルトでは画像のアスペクト比は1:1(要するに正方形)なのですが、指定してあげるとアスペクト比を変えることができます。
手順
手順と言っても指定するだけです。
Geminiの画像生成でアスペクト比を変更するには、image_generation.generate_images
アプリのaspect_ratio
パラメータを使用します。指定できるアスペクト比は以下のとおりです。
ASPECT_RATIO_1_1
ASPECT_RATIO_16_9
ASPECT_RATIO_9_16
ASPECT_RATIO_3_4
ASPECT_RATIO_4_3
例えば、アスペクト比16:9の画像を生成したい場合は、aspect_ratio
をASPECT_RATIO_16_9
に設定します。
実際にやってみましょう。まずは指示無しのデフォルトでの画像です。
プロンプトは以下のようにしました。
生成された画像です。面白いイメージ画像を作ってくれます。
アスペクト比の変更方法
では、アスペクト比を変えてみましょう。
対応するアスペクト比は“1:1” 、 “3:4” 、 “4:3” 、 “9:16” 、 “16:9” とのことです。
プロンプトは以下のようにしました。
※プロンプトで「アスペクト比を16:9でお願いします」でも同じ結果がでました。
生成されたイメージ画像です。アスペクト比が16:9に変わっていますね。(プロンプトは同じでも生成される画像は毎回違います)
ただアスペクト比を変えると画像のサイズも変わるようで、調べてみると次のようになっていました。
おそらく、使える画像のデータ容量が決まっていて、その範囲で最大のサイズになるように出力しているのではと…推測ですが。
ちょっとプロンプトを変えてみましょう。
東京タワーをスカイツリーに変えてみると…
ほら、スカイツリーに変わっていますね。
こうして具体的な希望を伝えてあげると「希望に添った」イメージ画像を生成してもらえます。
通常では考えられない…例えば「スカイツリーの隣に通天閣を入れてください」などと指示した場合でもその通りのイメージ画像を作成してくれるでしょう。
こういったイメージ画像は画像提供サイトを探してもまずないでしょうし、フリー画像ではなおさらです。
無料のGeminiで好きな画像を生成できるのですから利用しない手はありませんね。
生成画像をダウンロード
生成した画像は画面に表示されているのですが、そのままでは利用しがたいです。
そこで、生成画像のダウンロードをすることになるのですが、その方法はとっても簡単「クリック」するだけです。
ダウンロード手順
- 生成した画像にマウスポインタを乗せる
- 右上に白丸に下向き矢印が出ますのでそこをクリック(右上赤丸のところ)
- しばらくすると「どこにダウンロードするか問合せのウインドウが開く。
- 好きな場所(例えばデスクトップ)を選んでダウンロードしてください。
これで生成画像そのものを入手できます。後はお好きなように画像素編集ソフトなどで加工してお使い下さい。
生成画像を商用利用できる?
結論から言うと「今のところは控えた方が良い」と言ったところです。
Geminiを活用すれば無料で画像生成できるため、多くのユーザーに利用されることが予想されますが、2025年4月現在では公式から商用利用について明確な方針が公表されていません。
そのため、現時点では主なトラブルに巻き込まれないためにもGeminiで生成した画像は商用利用しない方が良いでしょう。
引用:WEEL
引用にもありますが、無用のトラブルにならないように慎重に、当面は控えておいた方が良いでしょう。
個人ブログへの利用なら問題はないでしょうがね。
まとめ:使うっきゃない画像生成
技術の進歩は早いですね。ChatGPTが利用できるようになったのが2022年11月、Geminiはちょっと遅れて2023年12月ですから、まだ2年ほどしか経過していないにもかかわらず、あらゆる分野で使用されつつあります。
個人でも例外ではなく、テキストにとどまらず画像も気楽に作成できる環境が整いつつあります。しかもGeminiは基本「無料」です。これはもう、使ってみるしかありませんね。