2025年8月29日、Google DeepMindは最新のAI画像編集モデル「Nano-Banana(ナノバナナ)」を発表しました。
正式名称は「Gemini 2.5 Flash Image」で、Geminiシリーズの高度な指示理解力とImagenの美的表現力を融合したものです。
現在は無料で試すことが可能です。
ただ、これは「お試し期間」の意味合いが強いと見られ、実際、開発者向けAPIの料金がすでに公開されており、今後は有料化される可能性が高いです。
※API経由では「画像1枚あたり約0.039ドル」「1万トークンあたり約30ドル」という価格帯で提供されています。
利用方法
一般ユーザー向け
Geminiアプリから利用可能。アプリ内の「Create images」またはバナナアイコンを選ぶと、Nano-Bananaで画像生成や編集を試せます。
Android・iOSのGeminiアプリをインストールすればすぐに体験可能。
開発者向け
Google AI Studio からアクセス可能。Webブラウザ上で自然言語指示を入力し、生成・編集をテストできます。
企業向け
Vertex AI を通じて利用可能。既存のGoogle Cloud環境と統合し、大規模なワークフローや商用アプリケーションに組み込めます。
技術的要点
これまでの画像生成AIでは、同じキャラクターを使って別のポーズや服装、背景を自然に変化させることは困難でした。
例えば、一度生成したキャラクターを維持したまま「笑顔で座っているポーズにして」「背景を海辺にして」「服をスーツに変えて」といった編集を行うと、別人のようになったり不自然な結果になったりすることが多かったのです。
Nano-Bananaでは、この課題が大幅に改善されました。
自然言語による指示だけで
- キャラクターの一貫性を保ったままポーズや衣装を変更
- 背景を自由に差し替え
- 複数の画像や要素を融合
といった操作が可能です。
つまり、これまでの「プロ向けレタッチ」が、誰でも直感的にできる時代になったといえます。
試してみた
さっそくGoogle AI Studioで試してみた。
Google AI Studioにログインして、「Try Nano Banana」をクリック。

入力欄に指示文を入れます。(日本語でOK)
まずは、試しに「パソコンを操作しているかわいい三毛猫のキャラクター」と入力。
出てきた画像がこちら。

うん、まあまあかわいい。
特に細かい指示を書かなくても何となくそれなりのものを生成してくれる。
比率は、1:1の正方形だ。(1024ピクセル×1024ピクセル)
次に「同じキャラクターでお昼寝をしているところにして」と指示。

整合性を保ったままちゃんと目をつぶって寝ている画像になった。
次に「メガネを外して」と指示。

他はそのままでメガネだけが外された。
次に「画像の比率を16:9にして」と指示。

画像が横長になった分、さっきまでは見えていなかった左右の背景部分が違和感なくちゃんと補填されている。
ただ、見た目はちゃんと16:9になっているように見えるが、実際の画像サイズは1:1(1024ピクセル×1024ピクセル)のままで、上下に余白がある。

黒背景で見るとこんな感じ▲
実際に使用するときにはトリミングが必要になってくるだろう。
次に「やる気を出してすごい勢いでタイピングをしている様子」と指示。

やる気を出しているというよりは、急いでいるような感じだが…笑
特に指示はしていないが、またメガネをかけていたので「メガネを外して」と指示。

う~ん、最初に生成された画像と比べると若干違うキャラクターのようにも見えるが…。
でも細かい指示もなく、ここまで整合性を保って良きに計らって生成してくれるというのはだいぶありがたい。
これまで専門的なスキルや高額なソフトが必要だった高度な編集が、無料で試せる段階に入ったことは大きな転換点です。
まだ発展途上な部分もありますが、今後さらに改良が進めば、プロ・アマ問わず「自分のキャラクターを自在に使いこなす」環境が広がっていくことが期待されますね。
まとめ
Nano-Bananaは、Googleが送り出した最新のAI画像編集モデルであり、キャラクターの一貫性やリアリティを保ちながら、自然言語での直感的な操作を可能にしました。
これまで専門的なスキルや高額なソフトが必要だった高度な編集が、無料で試せる段階に入ったことは大きな転換点です。
今後は、プロのクリエイターだけでなく、一般ユーザーや企業利用においても大きなインパクトをもたらすでしょう。
コメント