Hermes Agent で Nano Banana を使う。
Nano Banana は Google の Gemini ネイティブな画像生成モデルで、生成画像のテキストレンダリングが業界トップクラスです。Pro は最大 4K 解像度を出力し、Nano Banana 2 は拡張アスペクト比で速度に最適化され、Edit は既存画像を編集します。Hermes Agent は RunAPI のカスタム provider を通じて3つすべてを呼び出します — ComfyUI も GPU のセットアップも不要です。
RunAPI を使って Hermes Agent から Google Nano Banana Pro で画像を生成します。
要件:
- RUNAPI_API_KEY から API キーを読み込む。キーをハードコードしない。
- Hermes Agent にすでに設定された custom:runapi provider を使用する。
- https://runapi.ai/api/v1/nano_banana/text_to_image に POST リクエストを送信する。
- model を "nano-banana-pro" に設定する。
- 説明的なプロンプトを書く。Nano Banana は画像内のテキストレンダリングに優れているため、テキストのオーバーレイはすべてプロンプトに含める。
- 任意で、output_resolution を "4k" に設定して最高品質にする。
- レスポンスは task_id を返します。タスクが完了するまでタスクステータスのエンドポイントをポーリングする。
- タスクが完了したら、レスポンスから画像 URL を取得する。
curl -X POST https://runapi.ai/api/v1/nano_banana/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-pro",
"prompt": "A minimalist product card for a coffee brand, the text DARK ROAST in bold sans-serif across the top, a steaming cup below, warm studio lighting",
"aspect_ratio": "4:3",
"output_resolution": "4k",
"output_format": "png"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "nano-banana-pro"
}
Hermes Agent で Nano Banana を使う3ステップ
Configure RunAPI
Set the RUNAPI_API_KEY environment variable. If you already configured RunAPI as a custom:runapi provider in Hermes Agent for chat, the same key and base_url work for Nano Banana image generation.
export RUNAPI_API_KEY=runapi_xxx
Call Nano Banana
Send a POST to the text_to_image endpoint with model set to nano-banana-pro for highest quality, nano-banana-2 for speed, or nano-banana for the base variant. Set output_resolution to 4k on Pro or 2 for maximum detail. For editing, POST to edit_image with nano-banana-edit and include an image_url.
POST /api/v1/nano_banana/text_to_image
Get the result
The response includes a task_id. Poll the task status endpoint until status changes to completed. The finished response contains the generated image URL. RunAPI SDKs and the CLI handle polling automatically.
task_id: tsk_abc123
Nano Banana API パラメータ
| パラメータ | 型 | 説明 |
|---|---|---|
model |
string |
Required. nano-banana-pro (highest quality, 4K), nano-banana-2 (fast, extended ratios), nano-banana (base), or nano-banana-edit (editing). |
prompt |
string |
Text description of the desired image. Include any text you want rendered in the image — Nano Banana handles typography natively. |
image_url |
string |
Source image URL. Required for nano-banana-edit, ignored for text_to_image variants. |
aspect_ratio |
string |
Optional. Output aspect ratio. Pro accepts: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, auto. Nano Banana 2 adds 1:4, 1:8, 4:1, 8:1. |
output_resolution |
string |
Optional. Pro and 2 only. Accepted values: 1k, 2k, 4k. Defaults to 1k. |
output_format |
string |
Optional. Output file format. Accepted values: png, jpeg, jpg. |
callback_url |
string |
Optional. Webhook URL that receives a POST when the task completes. |
Hermes AgentのNano Bananaとは?
Nano Bananaはオーガニックなデザイン機能と世界知識統合で知られるGoogleの画像モデルです。実世界の文脈を理解する画像を生成します——特定のランドマーク・商品タイプ・デザインスタイルを指定すると推測ではなく内蔵知識から引き出します。Hermes AgentはRunAPI custom providerを通じて3つのバリアント全てを呼び出します。
Nano Bananaの活用例
大量のデザインアセット生成
Hermes Agentを通じて複数のビジュアル方向のデザインアセット——カバー画像・サムネイル・広告クリエイティブ——を一括生成し、Nano Bananaの高いプロンプト追従性が各バリアントをブリーフに忠実に保ちます。
ブランド要素を含む広告クリエイティブ
特定のビジュアル要素・カラースキーム・タイポグラフィ要件を含む広告クリエイティブを生成し、Nano Bananaのデザイン知識が手動微調整なしに使える広告素材を生み出します。
UIプロトタイプ用スクリーンショット
デモ・プロトタイプ・マーケティング向けにリアルなUIスクリーンショットとアプリインターフェースモックアップを生成し、Nano Bananaのインターフェースデザイン規範への理解を最大限活用します。
Nano Banana + Hermes Agent のよくある質問
Nano Banana Pro delivers the highest image quality with up to 4K output resolution. Nano Banana 2 is optimized for speed and supports extra aspect ratios like 1:4 and 8:1 for banner and tall formats. The base nano-banana variant is the most affordable option at standard resolution. All three share the same text_to_image endpoint.
For text-to-image generation, POST to /api/v1/nano_banana/text_to_image with any generation variant (nano-banana-pro, nano-banana-2, or nano-banana). For editing, POST to /api/v1/nano_banana/edit_image with model nano-banana-edit and include the source image_url. Both endpoints use the same custom:runapi provider and RUNAPI_API_KEY.
Nano Banana Pro pricing varies by output_resolution: 1k and 2k are the same rate, while 4k costs more per image. Nano Banana 2 follows a similar tier structure. Check the RunAPI pricing page for exact per-image rates. There is no monthly minimum.
No. Hermes Agent calls Nano Banana through the RunAPI custom:runapi provider endpoint. RunAPI handles all GPU infrastructure server-side. No ComfyUI workflow, no cloud GPU rental, no local VRAM requirements — send a prompt and receive an image URL.
Configure the custom:runapi provider in Hermes Agent and set the model to the Nano Banana slug. Hermes Agent sends the request to RunAPI's image generation endpoint, which routes to Google's Gemini-native image generation model.
Nano Banana 2 and Pro are competitive with Midjourney V8 on photorealism and significantly ahead on text rendering accuracy. The main advantage is API access -- Midjourney requires Discord or a separate web UI, while Nano Banana runs through a standard API endpoint via RunAPI.