可以在 OpenClaw 中使用 GPT Image 2 嗎？

可以。OpenClaw agent 透過 RunAPI text_to_image 端點呼叫 GPT Image 2。將 model 欄位設為 gpt-image-2-text-to-image，使用與聊天相同的 RUNAPI_API_KEY 發送請求。無需額外技能或外掛。

GPT Image 2 和 GPT-4o Image 有什麼不同？

GPT Image 2 是 OpenAI 專用的圖片生成模型，品質更高，支援 4K 輸出和透明背景。GPT-4o Image 在聊天情境中生成圖片，但僅限於 1:1、3:2 或 2:3 長寬比。兩者都可透過 RunAPI 使用 — 使用 gpt-image-2-text-to-image 進行獨立生成，使用 gpt-4o-image 進行聊天整合的圖片輸出。

GPT Image 2 支援透明背景嗎？

支援。GPT Image 2 可在 prompt 中指示時輸出帶有透明背景的圖片。這對商品照片、標誌和 UI 元素很有用。在 prompt 中指定透明度 — 例如「product photo with transparent background」。

GPT Image 2 在 RunAPI 上的定價如何？

GPT Image 2 按每張圖片依輸出解析度計費：1k 費用最低，2k 為中等，4k 最高。text_to_image 和 edit_image 適用相同費率。請查看 RunAPI 定價頁面了解最新的每張圖片費率。生成失敗不收費。

可以用 GPT Image 2 編輯現有圖片嗎？

可以。使用 edit_image 端點搭配 model 設為 gpt-image-2-image-to-image。在 source_image_urls 中傳入來源圖片 URL，並在 prompt 中描述編輯內容 — 例如「change the background to a beach sunset」或「add a red hat to the person」。GPT Image 2 能遵循自然語言編輯指令。

OPENCLAW + GPT IMAGE

在 OpenClaw 中使用 GPT Image。

GPT Image 2 是 OpenAI 專用的圖片生成模型 — 文生圖和基於指令的圖片編輯，支援最高 4K 輸出解析度和透明背景。OpenClaw agent 透過與聊天相同的 RunAPI key 和 /v1 端點呼叫，無需安裝額外技能。

取得 API Key 閱讀文件

一個 API key · 文生圖 + 圖片編輯 · 最高 4K 輸出

Use RunAPI to generate an image with OpenAI GPT Image 2.

Requirements:
- Use the RunAPI API at https://runapi.ai/v1/text_to_image.
- Read the API key from RUNAPI_API_KEY environment variable.
- Set the model to "gpt-image-2-text-to-image".
- Write a descriptive prompt. GPT Image 2 follows natural language instructions closely — describe layout, style, text overlays, and transparency needs.
- Optionally set output_resolution to 1k, 2k, or 4k. Default is 1k.
- The response returns a task_id. Poll the task status endpoint until the task completes, then retrieve the output URL.

curl -X POST https://runapi.ai/v1/text_to_image \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2-text-to-image",
    "prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
    "output_resolution": "2k",
    "aspect_ratio": "3:4"
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "gpt-image-2-text-to-image"
}

複製 curl 指令進行測試 gpt-image

運作原理

三步驟在 OpenClaw 中使用 GPT Image

設定 RunAPI

在 shell 設定檔中設定 RUNAPI_API_KEY 環境變數。如果 RunAPI 已在 OpenClaw 中設定用於聊天，同一個 key 也適用於 GPT Image — 無需額外設定。

export RUNAPI_API_KEY=runapi_xxx

呼叫 GPT Image 2

向 text_to_image 端點發送 POST 請求，model 設為 gpt-image-2-text-to-image。加入帶有版面和風格指示的描述性 prompt。將 output_resolution 設為 2k 或 4k 以獲得更高細節。若要編輯現有圖片，使用 edit_image 端點搭配 gpt-image-2-image-to-image 並提供 source_image_urls。

POST /v1/text_to_image

取得結果

API 會立即回傳 task_id。輪詢任務狀態端點，直到狀態變為 completed，然後從回應中取得輸出圖片 URL。GPT Image 2 通常在 10–30 秒內完成，視解析度而定。

task_id: tsk_abc123

參數

GPT Image API 參數

參數	類型	說明
`model`	`string`	必填。gpt-image-2-text-to-image 用於生成，gpt-image-2-image-to-image 用於編輯。
`prompt`	`string`	必填。期望圖片的自然語言描述。支援版面、文字疊加和風格的詳細指示。
`output_resolution`	`string`	選填。輸出解析度 — 1k（預設）、2k 或 4k。較高解析度的每張圖片費用較高。
`aspect_ratio`	`string`	選填。預設為 auto。支援 1:1、3:2、2:3、4:3、3:4、16:9、9:16 等。
`source_image_urls`	`array`	edit_image 端點必填。一個或多個要編輯的來源圖片 URL。

OpenClaw 上的 GPT Image 是什麼？

GPT Image 2 是 OpenAI 專用的圖像模型，其運作方式更像一個結構化的設計助手而非關鍵詞驅動的生成器。你給它一個製作簡報——排版、文字位置、風格約束——它能嚴格遵循指令。OpenClaw agent 通過與聊天相同的 RunAPI 端點呼叫它。

GPT Image 使用場景

品牌視覺與廣告設計

根據詳細的製作簡報生成品牌廣告、社交媒體橫幅和營銷視覺——指定精確的排版、文字位置和風格約束，GPT Image 2 嚴格遵循執行。

帶透明背景的產品圖

生成帶透明背景的產品展示圖，可直接用於電商網站、營銷材料或 UI 疊加層，無需後期去背景處理。

UI 模型與界面概念圖

生成帶可讀文字標籤和清晰佈局層級的 UI 模型和應用界面概念圖，在開發團隊評審前快速可視化設計概念。

FAQ

GPT Image + OpenClaw 常見問題

OpenClaw 通用設定

尚未設定？請從 OpenClaw 的 RunAPI 設定指南開始。

OpenClaw 設定指南 →

GPT Image 模型目錄

查看所有 GPT Image 變體、定價與 API 文件。

GPT Image 模型 →

立即在 OpenClaw 中試用 GPT Image。

取得免費的 RunAPI key，將 prompt 貼入 OpenClaw，即可開始使用 OpenAI GPT Image 2 生成和編輯圖片。

瀏覽模型 →