在 Hermes Agent 中使用 Nano Banana。
Nano Banana 是 Google 的 Gemini 原生圖片生成模型,在生成圖片中擁有業界領先的文字渲染能力。Pro 版本最高可輸出 4K 解析度,Nano Banana 2 針對速度優化並支援更多寬高比,Edit 版本可修改現有圖片。Hermes Agent 透過 RunAPI 自訂 provider 呼叫所有三個版本 — 不需要 ComfyUI 或 GPU 設定。
Use RunAPI to generate an image with Google Nano Banana Pro from Hermes Agent.
Requirements:
- Read the API key from RUNAPI_API_KEY. Do not hardcode the key.
- Use the custom:runapi provider already configured in Hermes Agent.
- Send a POST request to https://runapi.ai/api/v1/nano_banana/text_to_image.
- Set the model to "nano-banana-pro".
- Write a descriptive prompt. Nano Banana excels at rendering text within images, so include any text overlays in the prompt.
- Optionally set output_resolution to "4k" for maximum quality.
- The response returns a task_id. Poll the task status endpoint until the task completes.
- When the task is complete, retrieve the image URL from the response.
curl -X POST https://runapi.ai/api/v1/nano_banana/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "nano-banana-pro",
"prompt": "A minimalist product card for a coffee brand, the text DARK ROAST in bold sans-serif across the top, a steaming cup below, warm studio lighting",
"aspect_ratio": "4:3",
"output_resolution": "4k",
"output_format": "png"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "nano-banana-pro"
}
三個步驟在 Hermes Agent 中使用 Nano Banana
設定 RunAPI
設定 RUNAPI_API_KEY 環境變數。如果你已在 Hermes Agent 中為 chat 將 RunAPI 設定為 custom:runapi provider,相同的 key 和 base_url 即可用於 Nano Banana 圖片生成。
export RUNAPI_API_KEY=runapi_xxx
呼叫 Nano Banana
發送 POST 請求到 text_to_image 端點,model 設為 nano-banana-pro 以獲得最高品質、nano-banana-2 以獲得速度,或 nano-banana 為基礎版本。在 Pro 或 2 上將 output_resolution 設為 4k 以獲得最大細節。若要編輯,POST 到 edit_image 端點,使用 nano-banana-edit 並附上 image_url。
POST /api/v1/nano_banana/text_to_image
取得結果
回應包含一個 task_id。輪詢任務狀態端點,直到 status 變為 completed。完成的回應包含生成的圖片 URL。RunAPI SDK 和 CLI 會自動處理輪詢。
task_id: tsk_abc123
Nano Banana API 參數
| 參數 | 類型 | 說明 |
|---|---|---|
model |
string |
必填。nano-banana-pro(最高品質,4K)、nano-banana-2(快速,擴展寬高比)、nano-banana(基礎版)或 nano-banana-edit(編輯)。 |
prompt |
string |
描述所需圖片的文字。包含你想在圖片中渲染的任何文字 — Nano Banana 原生處理排版。 |
image_url |
string |
來源圖片 URL。nano-banana-edit 為必填,text_to_image 版本則忽略。 |
aspect_ratio |
string |
選填。輸出寬高比。Pro 接受:1:1、2:3、3:2、3:4、4:3、4:5、5:4、9:16、16:9、21:9、auto。Nano Banana 2 額外支援 1:4、1:8、4:1、8:1。 |
output_resolution |
string |
選填。僅限 Pro 和 2。可接受的值:1k、2k、4k。預設為 1k。 |
output_format |
string |
選填。輸出檔案格式。可接受的值:png、jpeg、jpg。 |
callback_url |
string |
選填。任務完成時接收 POST 的 Webhook URL。 |
Hermes Agent 上的 Nano Banana 是什麼?
Nano Banana 是評測者因其有機設計特性和世界知識整合而稱為「Photoshop 終結者」的 Google 圖像模型。它生成能理解現實世界情境的圖像——指定特定地標、商品類型或設計風格,它會從內建知識提取,而非憑空猜測。Hermes Agent 透過 RunAPI custom provider 呼叫所有三個變體。
Nano Banana 使用情境
電商商品型錄圖像
為整個型錄生成一致的商品攝影——相同的光線、相同的角度、相同的品牌風格——無需實體攝影棚。
UI 模擬稿與包裝概念
將書面設計簡報轉化為應用程式、包裝或實體產品的視覺模擬稿,比手動線框圖更快進入視覺審查環節。
部落格插圖與品牌系列
為部落格文章或社群媒體活動創建一致的視覺系列,在數十個輸出中每張圖像都保持相同的風格和品牌識別。
Nano Banana + Hermes Agent 常見問題
Nano Banana Pro 提供最高圖片品質,最高可達 4K 輸出解析度。Nano Banana 2 針對速度優化,支援額外的寬高比如 1:4 和 8:1,適合橫幅和高型格式。基礎版 nano-banana 是標準解析度中最經濟的選擇。三者共用相同的 text_to_image 端點。
若要文生圖,POST 到 /api/v1/nano_banana/text_to_image 並使用任一生成版本(nano-banana-pro、nano-banana-2 或 nano-banana)。若要編輯,POST 到 /api/v1/nano_banana/edit_image 並使用 nano-banana-edit 模型,附上來源 image_url。兩個端點使用相同的 custom:runapi provider 和 RUNAPI_API_KEY。
Nano Banana Pro 的定價依 output_resolution 而異:1k 和 2k 費率相同,而 4k 每張圖片費用更高。Nano Banana 2 遵循類似的分層結構。請查看 RunAPI 定價頁面了解確切的每張圖片費率。無最低月費。
可以。Nano Banana 專為圖片中的精確文字渲染而設計。在 prompt 中包含你想要的確切文字 — 模型原生處理字型排列和可讀性,不像大多數擴散模型會扭曲字型。
不需要。Hermes Agent 透過 RunAPI custom:runapi provider 端點呼叫 Nano Banana。RunAPI 在伺服器端處理所有 GPU 基礎設施。不需要 ComfyUI 工作流程、不需要雲端 GPU 租用、不需要本機 VRAM — 發送 prompt 即可收到圖片 URL。