HERMES + NANO BANANA

在 Hermes Agent 中使用 Nano Banana。

Nano Banana 是 Google 的 Gemini 原生圖片生成模型,在生成圖片中擁有業界領先的文字渲染能力。Pro 版本最高可輸出 4K 解析度,Nano Banana 2 針對速度優化並支援更多寬高比,Edit 版本可修改現有圖片。Hermes Agent 透過 RunAPI 自訂 provider 呼叫所有三個版本 — 不需要 ComfyUI 或 GPU 設定。

一個 API key · 文生圖 + 編輯端點 · 最高 4K 輸出
Use RunAPI to generate an image with Google Nano Banana Pro from Hermes Agent.

Requirements:
- Read the API key from RUNAPI_API_KEY. Do not hardcode the key.
- Use the custom:runapi provider already configured in Hermes Agent.
- Send a POST request to https://runapi.ai/api/v1/nano_banana/text_to_image.
- Set the model to "nano-banana-pro".
- Write a descriptive prompt. Nano Banana excels at rendering text within images, so include any text overlays in the prompt.
- Optionally set output_resolution to "4k" for maximum quality.
- The response returns a task_id. Poll the task status endpoint until the task completes.
- When the task is complete, retrieve the image URL from the response.
curl -X POST https://runapi.ai/api/v1/nano_banana/text_to_image \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nano-banana-pro",
    "prompt": "A minimalist product card for a coffee brand, the text DARK ROAST in bold sans-serif across the top, a steaming cup below, warm studio lighting",
    "aspect_ratio": "4:3",
    "output_resolution": "4k",
    "output_format": "png"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "nano-banana-pro"
}
複製 curl 指令進行測試 nano-banana
運作原理

三個步驟在 Hermes Agent 中使用 Nano Banana

1

設定 RunAPI

設定 RUNAPI_API_KEY 環境變數。如果你已在 Hermes Agent 中為 chat 將 RunAPI 設定為 custom:runapi provider,相同的 key 和 base_url 即可用於 Nano Banana 圖片生成。

export RUNAPI_API_KEY=runapi_xxx
2

呼叫 Nano Banana

發送 POST 請求到 text_to_image 端點,model 設為 nano-banana-pro 以獲得最高品質、nano-banana-2 以獲得速度,或 nano-banana 為基礎版本。在 Pro 或 2 上將 output_resolution 設為 4k 以獲得最大細節。若要編輯,POST 到 edit_image 端點,使用 nano-banana-edit 並附上 image_url。

POST /api/v1/nano_banana/text_to_image
3

取得結果

回應包含一個 task_id。輪詢任務狀態端點,直到 status 變為 completed。完成的回應包含生成的圖片 URL。RunAPI SDK 和 CLI 會自動處理輪詢。

task_id: tsk_abc123
參數

Nano Banana API 參數

參數 類型 說明
model string 必填。nano-banana-pro(最高品質,4K)、nano-banana-2(快速,擴展寬高比)、nano-banana(基礎版)或 nano-banana-edit(編輯)。
prompt string 描述所需圖片的文字。包含你想在圖片中渲染的任何文字 — Nano Banana 原生處理排版。
image_url string 來源圖片 URL。nano-banana-edit 為必填,text_to_image 版本則忽略。
aspect_ratio string 選填。輸出寬高比。Pro 接受:1:1、2:3、3:2、3:4、4:3、4:5、5:4、9:16、16:9、21:9、auto。Nano Banana 2 額外支援 1:4、1:8、4:1、8:1。
output_resolution string 選填。僅限 Pro 和 2。可接受的值:1k、2k、4k。預設為 1k。
output_format string 選填。輸出檔案格式。可接受的值:png、jpeg、jpg。
callback_url string 選填。任務完成時接收 POST 的 Webhook URL。

Hermes Agent 上的 Nano Banana 是什麼?

Nano Banana 是評測者因其有機設計特性和世界知識整合而稱為「Photoshop 終結者」的 Google 圖像模型。它生成能理解現實世界情境的圖像——指定特定地標、商品類型或設計風格,它會從內建知識提取,而非憑空猜測。Hermes Agent 透過 RunAPI custom provider 呼叫所有三個變體。

Nano Banana 使用情境

電商商品型錄圖像

為整個型錄生成一致的商品攝影——相同的光線、相同的角度、相同的品牌風格——無需實體攝影棚。

UI 模擬稿與包裝概念

將書面設計簡報轉化為應用程式、包裝或實體產品的視覺模擬稿,比手動線框圖更快進入視覺審查環節。

部落格插圖與品牌系列

為部落格文章或社群媒體活動創建一致的視覺系列,在數十個輸出中每張圖像都保持相同的風格和品牌識別。

FAQ

Nano Banana + Hermes Agent 常見問題

Crosslink Agent Title

Crosslink Agent Body

Crosslink Agent Label

Crosslink Model Title

Crosslink Model Body

Crosslink Model Label

Final Cta Title

Final Cta Body