在 Hermes Agent 中使用 Nano Banana。
Nano Banana 是 Google 的 Gemini 原生圖片生成模型,在生成圖片中擁有業界領先的文字渲染能力。Pro 版本最高可輸出 4K 解析度,Nano Banana 2 針對速度優化並支援更多寬高比,Edit 版本可修改現有圖片。Hermes Agent 透過 RunAPI 自訂 provider 呼叫所有三個版本 — 不需要 ComfyUI 或 GPU 設定。
Use RunAPI to generate an image with Google Nano Banana Pro from Hermes Agent.
Requirements:
- Read the API key from RUNAPI_API_KEY. Do not hardcode the key.
- Use the custom:runapi provider already configured in Hermes Agent.
- Send a POST request to https://runapi.ai/api/v1/nano_banana/text_to_image.
- Set the model to "nano-banana-pro".
- Write a descriptive prompt. Nano Banana excels at rendering text within images, so include any text overlays in the prompt.
- Optionally set output_resolution to "4k" for maximum quality.
- The response returns a task_id. Poll the task status endpoint until the task completes.
- When the task is complete, retrieve the image URL from the response.
curl -X POST https://runapi.ai/api/v1/nano_banana/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-pro",
"prompt": "A minimalist product card for a coffee brand, the text DARK ROAST in bold sans-serif across the top, a steaming cup below, warm studio lighting",
"aspect_ratio": "4:3",
"output_resolution": "4k",
"output_format": "png"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "nano-banana-pro"
}
三個步驟在 Hermes Agent 中使用 Nano Banana
設定 RunAPI
設定 RUNAPI_API_KEY 環境變數。如果你已在 Hermes Agent 中為 chat 將 RunAPI 設定為 custom:runapi provider,相同的 key 和 base_url 即可用於 Nano Banana 圖片生成。
export RUNAPI_API_KEY=runapi_xxx
呼叫 Nano Banana
發送 POST 請求到 text_to_image 端點,model 設為 nano-banana-pro 以獲得最高品質、nano-banana-2 以獲得速度,或 nano-banana 為基礎版本。在 Pro 或 2 上將 output_resolution 設為 4k 以獲得最大細節。若要編輯,POST 到 edit_image 端點,使用 nano-banana-edit 並附上 image_url。
POST /api/v1/nano_banana/text_to_image
取得結果
回應包含一個 task_id。輪詢任務狀態端點,直到 status 變為 completed。完成的回應包含生成的圖片 URL。RunAPI SDK 和 CLI 會自動處理輪詢。
task_id: tsk_abc123
Nano Banana API 參數
| 參數 | 類型 | 說明 |
|---|---|---|
model |
string |
必填。nano-banana-pro(最高品質,4K)、nano-banana-2(快速,擴展寬高比)、nano-banana(基礎版)或 nano-banana-edit(編輯)。 |
prompt |
string |
描述所需圖片的文字。包含你想在圖片中渲染的任何文字 — Nano Banana 原生處理排版。 |
image_url |
string |
來源圖片 URL。nano-banana-edit 為必填,text_to_image 版本則忽略。 |
aspect_ratio |
string |
選填。輸出寬高比。Pro 接受:1:1、2:3、3:2、3:4、4:3、4:5、5:4、9:16、16:9、21:9、auto。Nano Banana 2 額外支援 1:4、1:8、4:1、8:1。 |
output_resolution |
string |
選填。僅限 Pro 和 2。可接受的值:1k、2k、4k。預設為 1k。 |
output_format |
string |
選填。輸出檔案格式。可接受的值:png、jpeg、jpg。 |
callback_url |
string |
選填。任務完成時接收 POST 的 Webhook URL。 |
Hermes Agent 上的 Nano Banana 是什麼?
Nano Banana 是 Google 圖像模型,以有機設計特性和世界知識整合著稱。它生成理解真實世界背景的圖像——指定具體地標、產品類型或設計風格,它會從內置知識中呼叫,而非憑空猜測。Hermes Agent 通過 RunAPI custom provider 呼叫全部三個變體。
Nano Banana 使用場景
大批量設計資產生成
通過 Hermes Agent 批量生成多個視覺方向的設計資產——封面圖、縮略圖、廣告素材——Nano Banana 的強提示詞遵從性確保每個變體與簡報保持一致。
包含品牌元素的廣告創意
生成包含特定視覺元素、顏色方案和排版要求的廣告創意,Nano Banana 的設計知識幫助在不需要手動微調的情況下產出可用的廣告素材。
用於界面原型的 UI 截圖
生成用於演示、原型或營銷的真實感 UI 截圖和應用界面效果圖,充分利用 Nano Banana 對界面設計規範的理解。
Nano Banana + Hermes Agent 常見問題
Nano Banana Pro 提供最高圖片品質,最高可達 4K 輸出解析度。Nano Banana 2 針對速度優化,支援額外的寬高比如 1:4 和 8:1,適合橫幅和高型格式。基礎版 nano-banana 是標準解析度中最經濟的選擇。三者共用相同的 text_to_image 端點。
若要文生圖,POST 到 /api/v1/nano_banana/text_to_image 並使用任一生成版本(nano-banana-pro、nano-banana-2 或 nano-banana)。若要編輯,POST 到 /api/v1/nano_banana/edit_image 並使用 nano-banana-edit 模型,附上來源 image_url。兩個端點使用相同的 custom:runapi provider 和 RUNAPI_API_KEY。
Nano Banana Pro 的定價依 output_resolution 而異:1k 和 2k 費率相同,而 4k 每張圖片費用更高。Nano Banana 2 遵循類似的分層結構。請查看 RunAPI 定價頁面了解確切的每張圖片費率。無最低月費。
可以。Nano Banana 專為圖片中的精確文字渲染而設計。在 prompt 中包含你想要的確切文字 — 模型原生處理字型排列和可讀性,不像大多數擴散模型會扭曲字型。
不需要。Hermes Agent 透過 RunAPI custom:runapi provider 端點呼叫 Nano Banana。RunAPI 在伺服器端處理所有 GPU 基礎設施。不需要 ComfyUI 工作流程、不需要雲端 GPU 租用、不需要本機 VRAM — 發送 prompt 即可收到圖片 URL。