
Geminiで生成した画像「背景にスカイツリーが見える東京上空を飛ぶスーパードッグ」
「Geminiの画像生成って、ブログや資料作成に本当に使えるの?」
「無料でどこまでできるんだろう?」
「商用利用や著作権のルールが複雑で心配…」
このような疑問や不安を抱えていませんか。
この記事を読めば、GoogleのAI「Gemini」を使った画像生成の基本から応用、さらには安全な利用方法まで、その全てが分かります。
専門的な知識がなくても、あなたのコンテンツ制作が劇的に効率化するでしょう。
AI専門メディアp-man.orgが、最新情報と実践的なノウハウを基に、どこよりも分かりやすく徹底的に解説します。
Geminiの画像生成とは?3つのスゴい特徴
Geminiの画像生成機能は、Googleが開発した最先端のAI技術です。
テキストで指示するだけで、誰でも簡単に高品質な画像を創り出せます。
他の有名な画像生成AI、例えばChatGPT(DALL-E 3)やMidjourneyと比較しても、Geminiには特筆すべき強みがあります。
ここでは、その核心的な3つの特徴を見ていきましょう。
特徴1:日本語の微妙なニュアンスを汲み取る高精度な理解力
Geminiは、Googleの優れた言語処理能力を基盤としています。
そのため、複雑な日本語の指示や独特の言い回しを、驚くほど正確に解釈して画像に反映させることが可能です。
例えば、「夕暮れ時、少し寂しげな表情で海を眺める女性」といった感情や雰囲気を伴う指示にも的確に応えてくれます。
これにより、日本のユーザーは翻訳を介さずに、思った通りのイメージをストレスなく形にできます。
特徴2:Googleの最新モデル「Imagen 3」搭載による高品質な仕上がり
Geminiの画像生成は、その心臓部にGoogleの最新画像生成モデル「Imagen 3」を搭載しています [1]。
このモデルは、特に写真のようなリアルな画像の生成や、画像内に文字を正確に描き出す能力に優れています。
ブログのアイキャッチ画像にタイトルを入れたり、ポスター風のデザインを作成したりと、プロ級の仕上がりを期待できます。
この技術的な背景が、Geminiが生み出す画像のクオリティを保証しています。
特徴3:チャット形式で手軽に試せる直感的な操作性
Geminiの最大の魅力の一つは、その手軽さです。
特別なソフトウェアのインストールや専門的なスキルは一切不要です。
普段メッセージをやり取りするようなチャット画面で、AIに話しかけるように指示を入力するだけです。
「こうしてほしい」と対話しながら画像を修正していくことも可能で、初心者でも迷うことなく画像生成を始められます。
Geminiで画像生成のやり方
パソコンでの手順・やり方です。
ブラウザは何でも大丈夫だと思いますが、ここではChromeの最新版を使用しています。
パソコンで画像を生成するわけでなく、Geminiの側で処理するので、あまりに古いパソコンでなければどんなものでも大丈夫だと思います。
Webアプリなので使用するOSもWindows、Linux、Macを問いません。ここではMacOS Ventura13.7.5を使用しています。
実際の画像生成手順
とても簡単です。
- パソコンで gemini.google.com にアクセスします。
- 画像を生成するためのプロンプトを入力します。
- 生成された画像をダウンロードします。
これだけです。
ステップ1:GoogleアカウントでGeminiにアクセス
まず、お使いのブラウザでGeminiの公式サイトにアクセスします [2]。
利用にはGoogleアカウントでのログインが必要です。
ほとんどの場合、普段お使いのGoogleアカウントでスムーズに利用を開始できます。
ステップ2:プロンプト(指示文)を入力する
ログインすると、チャット画面が表示されます。
画面下部にある「ここにプロンプトを入力」というテキストボックスに、作成したい画像の説明を日本語で入力しましょう。
例えば、「宇宙を旅する猫のイラスト」のように、まずは簡単な言葉で試してみてください。
ステップ3:生成された画像を確認・ダウンロードする
プロンプトを入力して送信すると、1〜2分でで画像が生成されます。
画像をクリックすると拡大表示され、右上のダウンロードボタンから高画質の画像を保存できます。
無料版のGeminiでも画像生成はできますので一度お試しください。
きっと感銘を受けると思いますよ「無料でここまでできるのか!」ってね。
プロンプトの参考例
後ほど解説しますが、やはりテキストの場合と同じく、なるべく具体的な内容のプロンプトを使用することで満足のいく画像が生成される確率が高くなります。
プロンプトはあまり難しく考える必要はありません。ツボは「具体的に」です。
一度で期待通りの結果が得られなかった場合は、プロンプトを手直しして再度調整してみてください。
だんだんと期待に添った結果が得られるようになると思います。
あと、プロンプトで「画像生成」をして欲しいと明示しないと、時として文字が出力されることがあるのでお気をつけ下さい。「画像を生成して」とか「イラストを描いて」とか、目的は画像だということをハッキリ伝えましょう。
実際のプロンプト例
- 自然に囲まれた古びた山道を走る未来の自動車の画像を生成して
- サーフボードに乗っている犬の画像を作成して
- スプラッシュを多用した水彩画風で、1 本の川が流れるジャングルの画像を作成して
上記はGooglのヘルプに記載してあるプロンプトの例ですが、簡単な割にかなり具体的であることがわかるでしょう。
ひとつ画像生成してもらいましょう。
一番最初の「自然に囲まれた古びた山道を走る未来の自動車の画像を生成して」を
Geminiに指示すると…

「自然に囲まれた古びた山道を走る未来の自動車」というプロンプトで生成した画像
ちょっと全体的に暗いけど指示どおり?のイメージ画像が得られることがわかるでしょう。
ちなみに解像度と画像サイズは以下の通りで、大体このくらいで出力されることが多いです。
Web上で使用するには充分な解像度・サイズですね。
画像生成のスピードは?
どちらも無料版での比較ですが、GeminiとChatGTPで比べてみると、生成速度的にはGeminiの圧勝かな。
Geminiが早いと言うよりも、ChatGTPが遅すぎるといった方が良いかも。
無料版での実感ですので、時間帯によっても変わるのかもしれませんが、ChatGTPは「他のユーザーが沢山画像生成しているのでしばらくかかるよ」とメッセージが出たままフリーズしたのかと思うくらいのろいことが多いです。パソコンをシャットダウンしてそのまま就寝、翌日に確認すると出来上がっている…こんな感じが多いですね。
Geminiは上の「自然に囲まれた古びた山道を走る未来の自動車の画像」を生成するのに1分かかるかどうかと言ったところで、稼働時刻による生成時間の変動はそれほど大きくはないと感じます。
ただ当たり前ですが、高品質の画像を最短時間でたくさん生成したい場合は、画像生成専用のAIを使った方がいいかも。というか、そうするべきかな。
画像生成に特化した生成AI
参考までに画像生成に特化した生成AIを列挙しておきます。
探せば他にもあるかもしれません(2025年6月現在の状況です)
-
- 非常に高品質で芸術的な画像を生成することで知られています。
- Discordのインターフェースを通じて利用し、プロンプト(テキスト指示)から画像を生成します。
- 写実的な画像から、イラスト、ファンタジーアートなど、幅広いスタイルに対応しています。
- 有料サービスですが、そのクオリティから非常に人気が高いです。
-
Stable Diffusion (ステーブルディフュージョン)
- オープンソースで公開されており、ローカル環境での実行が可能です。
- 高いカスタマイズ性があり、様々なモデル(Checkpoint)や拡張機能(LoRA、ControlNetなど)を組み合わせることで、非常に多様な画像を生成できます。
- 特定の人物やスタイルを学習させることも可能です。
- ウェブサービスとしても提供されているもの(DreamStudioなど)もあります。
-
- OpenAIが開発した画像生成AIです。
- テキストプロンプトから画像を生成する能力が高く、特に創造的でユニークな画像を生成することに優れています。
- OpenAIのAPIを通じて利用できるほか、ChatGPT Plusの機能としても統合されています。
-
- Adobeが開発している画像生成AIで、主にクリエイティブ業界での利用を想定しています。
- 著作権に配慮した学習データ(Adobe Stockなど)を使用している点が特徴です。
- PhotoshopやIllustratorなどのAdobe製品と連携し、既存のワークフローに組み込みやすい設計になっています。
- テキストからの画像生成だけでなく、テキストからのブラシ生成や、画像の拡張なども可能です。
-
- Stable Diffusionをベースにしつつ、使いやすいインターフェースと豊富な機能(モデル選択、アップスケーラー、画像to画像など)を提供しているプラットフォームです。
- ゲームアセットやアートワークの生成に特に強みを持っています。
これらのサービスはそれぞれ特徴があり、用途や求めるクオリティ、予算によって最適なものが異なります。無料で試せるものも多いので、ぜひいくつか試してみてはいかがでしょうか。
生成画像のアスペクト比を変える方法
デフォルトでは画像のアスペクト比は1:1(要するに正方形)なのですが、指定してあげるとアスペクト比を変えることができます。
アスペクト比を変える手順
手順と言ってもプロンプトで指定するだけです。
Geminiの画像生成でアスペクト比を変更するには、image_generation.generate_images
アプリのaspect_ratio
パラメータを使用します。指定できるアスペクト比は以下のとおりです。
ASPECT_RATIO_1_1
ASPECT_RATIO_16_9
ASPECT_RATIO_9_16
ASPECT_RATIO_3_4
ASPECT_RATIO_4_3
例えば、アスペクト比16:9の画像を生成したい場合は、aspect_ratio
をASPECT_RATIO_16_9
に設定します。
実際にやってみましょう。まずは指示無しのデフォルトでの画像です。
プロンプトは以下のようにしました。
生成された画像です。指定無しですとアスペクト比1:1になります。
面白いイメージ画像を作ってくれますね。
アスペクト比の変更方法
では、アスペクト比を変えてみましょう。
対応するアスペクト比は“1:1” 、 “3:4” 、 “4:3” 、 “9:16” 、 “16:9” とのことです。
プロンプトは以下のようにしました。
※プロンプトで「アスペクト比を16:9でお願いします」でも同じ結果がでました。
生成されたイメージ画像です。アスペクト比が16:9に変わっていますね。(プロンプトは同じでも生成される画像は毎回違います。同じ画像は2度と…出ないですね)
ただアスペクト比を変えると画像のサイズも変わるようで、調べてみると次のようになっていました。
おそらく、使える画像のデータ容量が決まっていて、その範囲で最大のサイズになるように出力しているのではと…推測ですが。
ちょっとプロンプトを変えてみましょう。
東京タワーをスカイツリーに変えてみると…
ほら、スカイツリーに変わっていますね。
こうして具体的な希望を伝えてあげると「希望に添った」イメージ画像を生成してもらえます。
通常では考えられない…例えば「スカイツリーの隣に通天閣を入れてください」などと指示した場合でもその通りのイメージ画像を作成してくれるでしょう。
ということで、試しに画像生成してみました。見事にスーパードッグの背景に通天閣がありますね。笑

東京上空を飛び回るスーパードッグ。あり得ない通天閣が…!
こういったイメージ画像は画像提供サイトを探してもまずないでしょうし、フリー画像ではなおさらです。
無料のGeminiで好きな画像を生成できるのですから利用しない手はありませんね。
解像度を直接指定することはできない
アスペクト比の指定ができるのだから解像度(例えば1920×1200dpi)も直接指定できるのかと思ったら「拒否」られました。笑
Gieminに聞いてみたところ、以下のような回答がきました。
Q:生成画像の解像度を直接指定する方法はありますか?指定上の制限は?
A:生成画像の解像度指定について
Geminiの画像生成機能では、現在のところ解像度を直接数値で指定するパラメータは提供されていません。
解像度は、指定するアスペクト比(aspect_ratio
)とプロンプトの内容に基づいて、モデルが最適なサイズを自動的に生成します。例えば、ASPECT_RATIO_16_9
を指定した場合、それに応じた横長の画像が生成されますが、具体的なピクセル数(例: 1920×1080)を指示することはできません。
指定上の制限について
現状の解像度に関する主な制限は以下の通りです。
-
- 直接指定不可: ピクセル数やDPI(dots per inch)などの具体的な数値を直接指定することはできません。
- アスペクト比のみ: 調整できるのはアスペクト比のみです。
より高解像度の画像が必要な場合は、生成された画像をダウンロードした後、PhotShopなどの外部の画像編集ツールを使用して解像度を向上させるか、アップスケール(拡大)処理を行う必要があります。
ご希望の解像度での画像生成ができない点はご不便をおかけしますが、現状の機能でできることはアスペクト比の調整のみとなります。
とのことでした。
解像度を設定したければ、
-
- 都合の良さそうなアスペクト比を指定して画像生成した後
- ダウンロードで画像ファイルを入手
- 画像編集ソフト(フォトショップやGIMP)で解像度修正
という事になるようですね。まぁ、あまり大きな画像を要求されてもシステム側のリソースを食い潰すから不可というのが本当のところなのかもね。
※以上はGeminiの仕様で、他の生成AI(ChatGTPなど)や画像生成専用AIでは当てはまらないと思います。それぞれで確認してみてください。
【コツを伝授】思い通りの画像を作るプロンプトの教科書
Geminiから理想の画像を引き出す鍵は、プロンプト(指示文)の書き方にあります。
ここでは、初心者から一歩進んだ使い方を目指す方まで、誰でも実践できるプロンプト作成のコツを体系的に解説します。
基本の型:「要素」「画風」「構図」を組み合わせる
質の高いプロンプトは、いくつかの基本要素の組み合わせで成り立っています。
以下の「型」を意識するだけで、指示の精度が格段に上がります。
基本要素 | 説明 | 具体例 |
---|---|---|
要素(主題+背景) | 何を(誰を)、どこに描いてほしいか。最も重要な部分。 | 「ノートパソコンで作業する女性、背景はモダンなカフェ」 |
画風(スタイル) | どのようなタッチで描いてほしいか。写真、イラスト、絵画など。 | 「リアルな写真風」「水彩画風」「アニメ風」 |
構図(アングル) | どのように被写体を切り取るか。 | 「被写体に寄ったクローズアップ」「引きで全体を写すロングショット」「上からの俯瞰」 |
雰囲気・感情 | 画像全体の色調やムード。 | 「明るく楽しい雰囲気」「静かで落ち着いた雰囲気」「未来的な」 |
応用テクニック5選(ネガティブプロンプト・画質向上など)
基本の型に加えて、以下の応用テクニックを使うと、さらに細かなコントロールが可能になります。
テクニック | 説明 | プロンプト例 |
---|---|---|
1. ネガティブプロンプト | 画像に含めてほしくない要素を指定する。 | 森の風景、**人物なし** |
2. 品質向上キーワード | より高品質な出力を促す「魔法の言葉」。 | 傑作、最高品質、超高解像度、8K |
3. アスペクト比の指定 | 画像の縦横比を指定する。 | アスペクト比 16:9 アスペクト比 1:1 |
4. 詳細な属性指定 | 被写体の特徴を細かく記述する。 | 黒髪のボブカット、青い瞳、赤いドレスを着た女性 |
5. ライティングの指定 | 光の当たり方や雰囲気をコントロールする。 | 朝の柔らかい光、劇的な照明、ネオンライト |
【コピペOK】シーン別プロンプト例文集
ここでは、具体的な利用シーンを想定したプロンプトの例文を紹介します。
ぜひコピーして、ご自身の目的に合わせて改変してみてください。
ブログのアイキャッチ画像向けプロンプト
シーン | プロンプト例 | ポイント |
---|---|---|
IT・ガジェット系 | ノートパソコンを開いて作業する人物の手元。背景はミニマルでおしゃれなオフィス。顔は映さない。俯瞰からの構図。明るい自然光。リアルな写真。 | 顔を映さないことで、汎用性が高くなります。 |
ライフスタイル系 | 白いテーブルの上に置かれたコーヒーカップと一冊の本。窓から柔らかな光が差し込んでいる。温かみのある雰囲気。背景をぼかした写真。 | 「背景をぼかす」ことで主題が際立ちます。 |
SNS投稿(Instagram)向けプロンプト
シーン | プロンプト例 | ポイント |
---|---|---|
旅行・風景 | 日本の美しい桜並木。舞い散る花びらの中を歩く着物姿の女性の後ろ姿。淡い色使いの水彩画風イラスト。アスペクト比 1:1。 | 正方形を指定することで、Instagramのフィードに最適化されます。 |
グルメ | 湯気が立つ熱々のラーメン。具材はチャーシュー、味玉、ネギ。カウンター席から撮影したような構図。食欲をそそるリアルな写真。 | 「湯気」や「熱々」といった表現でシズル感を演出します。 |
プレゼン資料の挿絵向けプロンプト
シーン | プロンプト例 | ポイント |
---|---|---|
チームワーク | ビジネスチームがホワイトボードを囲んで会議している様子。多様な人種の男女。白い背景のシンプルな線画イラスト。フラットデザイン。 | シンプルなイラストは、資料の内容を邪魔せず、メッセージを的確に伝えます。 |
目標達成 | 山の頂上に立つ人物のシルエット。朝日が昇っている。成功や達成感をイメージさせる。力強い雰囲気。 | シルエットにすることで、抽象的で使いやすいビジュアルになります。 |
クオリティの高い「人物」を生成するプロンプト
人物の画像は特にクオリティが求められます。以下の要素を細かく指定するのがコツです。
要素 | プロンプト例 |
---|---|
基本設定 | 20代の日本人女性、優しい笑顔。 |
髪型・服装 | 黒髪のボブカットで、白いTシャツとジーンズを着ている。 |
背景・場所 | 背景は緑豊かな公園の並木道。 |
構図・画質 | 上半身のポートレート。背景を適度にぼかす。一眼レフカメラで撮影したようなリアルな写真。 |
ライティング | 午後の木漏れ日が顔に当たっている。 |
生成画像をダウンロード
生成した画像は画面に表示されているのですが、そのままでは利用しがたいです。
そこで、生成画像のダウンロードをすることになるのですが、その方法はとっても簡単「クリック」するだけです。
ダウンロード手順
- 生成した画像にマウスポインタを乗せる
- 右上に白丸に下向き矢印が出ますのでそこをクリック(右上赤丸のところ)
- しばらくすると「どこにダウンロードするか問合せのウインドウが開く。
ダウンロードする画像ファイルの名称も変えられます。画像モードはPINGです。 - 好きな場所(例えばデスクトップ)を選んでダウンロードしてください。
これで生成画像そのものを入手できます。後はお好きなように画像素編集ソフトなどで加工してお使い下さい。
【最重要】Gemini画像の商用利用と著作権の注意点
AIで画像を生成する上で、最も気になるのが「商用利用」と「著作権」の問題です。
安心してビジネスやコンテンツ制作に活用するため、守るべきルールと注意点を正確に理解しておきましょう。
Geminiで生成した画像は商用利用できる?Googleの公式見解は
Googleの利用規約によると、有料プラン「Gemini Advanced」で生成した画像は、商用利用が許可されると解釈されています [3]。
ただし、生成されたコンテンツが第三者の権利を侵害しないようにする最終的な責任は、ユーザー自身にあると明記されています。
無料版で生成した画像は、商用利用が認められていないため注意が必要です。
著作権の考え方と、安心して使うための3つのチェックポイント
AIが生成した画像の著作権は、まだ法的に明確なコンセンサスがないグレーな領域です。
トラブルを未然に防ぐため、以下の3つのポイントを必ずチェックしましょう。
チェックポイント | 具体的な内容 | なぜ重要か? |
---|---|---|
1. 有名キャラクターやロゴ | アニメのキャラクターや企業のロゴなど、既存の著作物が含まれていないか。 | 著作権侵害に直結するリスクが非常に高い。 |
2. 実在の人物 | 特定の俳優や有名人など、実在の人物に酷似した画像になっていないか。 | パブリシティ権や肖像権の侵害にあたる可能性がある。 |
3. 他者の作品の模倣 | 特定のアーティストの画風を模倣したり、既存のイラストや写真に酷似したりしていないか。 | 意図せず他者の著作権を侵害してしまうリスクがある。 |
AI生成画像を示す「SynthID」とは?透かしは消せる?
Googleは、Geminiで生成された画像に「SynthID」と呼ばれる電子透かし(デジタルウォーターマーク)を埋め込んでいます。
これは人間の目には見えませんが、AIによって生成された画像であることを識別するための技術です。
この透かしを意図的に削除する行為は利用規約に違反する可能性があるため、絶対に行わないでください。
画像生成が「できない」ときの原因と対処法Q&A
便利なGeminiですが、時々うまく画像が生成できないこともあります。
ここでは、よくあるトラブルとその解決策をQ&A形式でまとめました。
Q1. プロンプトが無視される、意図と違う画像が出る
A. 指示が曖昧だったり、矛盾した内容が含まれていたりする可能性があります。
まずはプロンプトを見直し、「より具体的に、シンプルに」書き換えてみてください。
一度に多くの指示を詰め込まず、一つずつ追加していくのも有効な方法です。
Q2. 「安全ポリシー違反」で人物や特定の画像が生成できない
A. Geminiには、不適切な画像(暴力的、差別的、性的なコンテンツなど)の生成を防ぐための安全フィルターが搭載されています。
特に、実在の著名人の名前や、誤解を招く可能性のある表現はブロックされやすいです。
プロンプトから固有名詞を削除し、より一般的な表現に言い換えて試してみてください。
Q3. 突然サービスが使えなくなった、機能停止の噂は本当?
A. まずは一時的なサーバーの不具合やメンテナンスの可能性を考えましょう。
時間をおいて再度試すか、Googleの公式X(旧Twitter)アカウントなどで障害情報が発表されていないか確認してみてください。
過去に一部機能が制限されたことはありますが、恒久的なサービス停止ではなく、現在もサービスは継続しています。
まとめ:使うっきゃない画像生成
技術の進歩は早いですね。ChatGPTが利用できるようになったのが2022年11月、Geminiはちょっと遅れて2023年12月ですから、まだ2年ほどしか経過していないにもかかわらず、あらゆる分野で使用されつつあります。
個人でも例外ではなく、テキストにとどまらず画像も気楽に作成できる環境が整いつつあります。しかもGeminiは基本「無料」です。これはもう、使ってみるしかありませんね。
関連記事
- 【Google Gemini】回答が途中で途切れる現象、理由と対策
- 【徹底比較】GeminiとChatGPT、あなたに最適なAIはどっち?最新生成AIの賢い選び方
- OpenAI「ChatGPT」の無料版と有料版の違いとは?初心者向けにわかりやすく解説
- ChatGPTのDeep Researchとは?特徴・使い方・料金までやさしく解説!
参考情報
おまけ:ちょっと遊んでみました(閲覧注意)
大阪万博のイメージキャラクター「ミャクミャク」と万博会場で大発生している「ユスリカ」が合体したメージ画像をお願いしたところ…。
のようなイメージ画像になりました。
気持ち悪いね。笑笑
※最近はユスリカの問題は沈静化しているようです。笑笑