Flux、Imagen 4、GPT Image を OpenClaw に追加 — 追加スキル不要
OpenClaw エージェントがチャットに使っているのと同じ API キーで、Flux Kontext、Imagen 4、Seedream、GPT Image 2 — 10種類以上の画像モデルを呼び出せます。追加スキルのインストールは不要で、画像生成コストは1枚2セントから、従量課金です。
Install the RunAPI CLI and generate an image in this OpenClaw workspace.
- Run: npx runapi
- It will prompt you for an API key. Sign up at https://runapi.ai if you don't have one.
- Then run: npx runapi run text_to_image --model flux-kontext-pro --prompt "A red cube on a white table"
- Confirm the image URL appears in the output.
Available image models: flux-kontext-pro, imagen-4, seedream-5-lite-text-to-image, gpt-image-2-text-to-image.
4つの画像モデル、1つの API キー、追加スキルゼロ
各モデルは異なる本番用途をカバーします。Flux Kontext はブランド一貫性のある編集とテキストレンダリングに対応します。Imagen 4 はプロンプト忠実度の高いフォトリアルな出力を生成します。Seedream 5 Lite は大量ワークフロー向けに低コストで高速動作します。GPT Image 2 は指示に従う編集とコンポジティングに優れています。4つすべてが、OpenClaw エージェントがチャットで既に使っているのと同じ RunAPI エンドポイントから呼び出し可能です。
テキストレンダリング、ブランド一貫性、インコンテキスト編集。テキストオーバーレイやスタイル参照が重要なマーケティング素材に適しています。1枚あたり2.5セントから。
高いプロンプト忠実度でフォトリアルな生成。スタンダード、ファスト、ウルトラの各ティアで速度と精細度を選べます。1枚あたり2セントから。
大量ワークフロー向けの高速低コスト生成。テキストから画像、画像から画像の両方を1回あたり2.75セントで処理でき、プロトタイピングや反復作業に適しています。
指示に従うコンポジティングと編集。背景除去、スタイル変換、オブジェクト配置など、変換を説明するプロンプトを扱うタスクに最適です。
RunAPI 経由で OpenClaw から画像を生成する
OpenClaw に RunAPI を設定する
OpenClaw で RunAPI をまだ設定していない場合は、OpenClaw セットアップガイドに従ってください。RunAPI プロバイダーを baseUrl https://runapi.ai/v1 と RUNAPI_API_KEY 環境変数で追加します。
画像生成リクエストを送信する
エージェントコードまたは直接の HTTP 呼び出しから RunAPI タスクエンドポイントを使用します。model フィールドに flux-kontext-pro、imagen-4、gpt-image-2 などの画像モデルスラグを設定します。リクエストボディは LLM 呼び出しと同じ JSON パターンに従います。
結果をポーリングして取得する
画像タスクはタスク ID を返します。タスクステータスエンドポイントをポーリングするか、Webhook コールバックを使用します。タスクが完了すると、レスポンスに生成された画像 URL が含まれます。RunAPI の SDK と CLI はポーリングを自動的に処理します。
Flux Kontext vs Imagen 4 vs Seedream vs GPT Image 2
| 比較項目 | Flux Kontext Pro | Imagen 4 | Seedream 5 Lite | GPT Image 2 |
|---|---|---|---|---|
| 最適なデフォルト用途 | ブランド一貫性のある編集、テキストオーバーレイ、ロゴ配置、スタイル参照を使ったインコンテキスト画像修正。 | 詳細なプロンプトからのフォトリアル生成、製品写真、高忠実度の単一画像出力。 | 速度とコストが最大の詳細より重要な、高速大量生成とプロトタイピング。 | 指示に従うコンポジティング、背景変更、スタイル変換、マルチステップ画像編集。 |
| 入力タイプ | テキストプロンプト、インコンテキスト編集のための参照画像、スタイル参照。 | テキストプロンプト。ファスト、スタンダード、ウルトラの品質ティア。 | テキストプロンプト、ソース画像 URL を使った画像から画像。 | 生成用テキストプロンプト、編集とコンポジティング用のテキストと画像 URL の組み合わせ。 |
| 出力品質 | 正確なテキストレンダリングで高い詳細度。編集全体でブランド要素を保持することに優れています。 | 高いプロンプト忠実度でフォトリアル。最大の詳細度にはウルトラティア。 | 速度に見合った良好な品質。ドラフト、サムネイル、反復ループに適しています。 | 強い指示追従性で高品質。空間関係の理解が必要な編集に最適。 |
| 速度 | 標準的な生成速度。インタラクティブおよびバッチワークフローに適しています。 | ほぼ即時の出力向けにファストティアが利用可能。スタンダードとウルトラティアは速度と品質をトレードオフします。 | 4つの中で最速。大量パイプライン向けに最適化されています。 | 標準速度。複雑なマルチステップ編集ではやや低速。 |
| 1枚あたりのコスト | 2.5セントから(Pro)。より高い忠実度のMaxティアは5セント。 | 2セント(ファスト)から6セント(ウルトラ)。スタンダードは4セント。 | テキストから画像、画像から画像ともに1枚あたり2.75セント。 | 3セントから。解像度ベースの料金体系。 |
| OpenClaw エージェントでの最適用途 | エージェントのワークフローにブランド素材、マーケティング画像、またはテキストを多用するビジュアルが含まれる場合。 | エージェントが自然言語の説明からフォトリアルな出力を必要とする場合。 | エージェントがセッションごとに多くの画像を生成し、コストまたは速度が優先される場合。 | エージェントがユーザーの指示に基づいて既存の画像を編集する場合。 |
マーケティング素材の生成
OpenClaw エージェントは Flux Kontext または Imagen 4 を呼び出すことで、製品画像、SNS ビジュアル、広告クリエイティブを生成できます。エージェントは会話コンテキストに基づいてプロンプトを作成し、同じセッションで完成した画像を取得します。
Flux Kontext を探す自動画像編集
既存の画像 URL を編集指示とともに GPT Image 2 または Seedream に渡します。エージェントは手動のデザインツールなしに、背景の除去、スタイルの変換、またはエレメントのコンポジティングができます。
GPT Image 2 を探す大量画像の反復生成
UI コンポーネント、SNS 広告、製品バリエーションをプロトタイピングする OpenClaw エージェントは、Seedream 5 Lite の速度と低い1枚あたりのコストを活用できます。1セッションで20のドラフトを生成し、選ばれたプロンプトを最終出力用に Flux Kontext Pro にルーティングします。
Seedream を探すRunAPI タスクエンドポイント経由で画像を生成する
すべての画像モデルに同じ RunAPI キーとタスクライフサイクルを使用します。モデルスラグとエンドポイントを変更することで Flux、Imagen、Seedream、GPT Image を切り替えます。レスポンスはポーリング用のタスク ID を返します。
{
"model": "flux-kontext-pro",
"prompt": "A futuristic city skyline at sunset, photorealistic, 8K detail"
}
{
"model": "imagen-4",
"prompt": "A golden retriever wearing astronaut suit, studio lighting"
}
{
"model": "gpt-image-2",
"prompt": "Remove the background and add a tropical beach",
"image_url": "https://example.com/photo.jpg"
}
同じ API キーで動画と音楽も生成できる
動画生成
Kling 3.0、Veo 3、Seedance 2.0 で動画クリップを生成します。テキストから動画、画像から動画のエンドポイントは、画像生成と同じ非同期タスクライフサイクルに従います。
動画 API を比較する音楽制作
Suno v4、v4.5、v5 で音楽トラックを制作します。プロンプトでジャンル、ムード、歌詞を説明します。タスクが完了すると、エージェントは音声 URL を受け取ります。
Suno モデルを見る画像生成コストは1枚あたり2セントから
RunAPI は月額サブスクリプションなしの従量課金を採用しています。各画像モデルには、モデルティアと出力解像度に基づく1生成あたりのコストがあります。Flux Kontext Pro は2.5セント、Imagen 4 Fast は2セント、Seedream 5 Lite は2.75セント、GPT Image 2 は3セントから始まります。113種類以上のモデル全体の現在の料金は、ライブ料金ページでご確認ください。
料金体系について
このページの料金は、公開時点での RunAPI 従量課金レートを反映しています。RunAPI はコンピューティングコストに透明なマージンを加算して価格を設定します。実際の1枚あたりのコストは解像度、品質ティア、またはモデル固有のオプションによって異なる場合があります。本番環境へのデプロイ前に必ずライブ料金ページで現在の料金を確認してください。
OpenClaw 画像生成 FAQ
OpenClaw のワークフローで Flux Kontext と Imagen 4 をどう使い分けるべきですか?
エージェントがブランド素材、マーケティング画像、またはテキストを含むビジュアルを生成する場合は Flux Kontext Pro を使用します — スタイルを保持しテキストを正確にレンダリングします。エージェントが自然言語の説明からフォトリアルな出力を必要とする場合は Imagen 4 を使用します。どちらも同じ RunAPI エンドポイントから利用できます。
RunAPI 経由で OpenClaw と連携できる画像モデルはどれですか?
Flux Kontext Pro と Max、ファスト・スタンダード・ウルトラティアの Imagen 4、Seedream 5 Lite、GPT Image 2、Nano Banana、その他多数。6つのプロバイダーにわたる10種類以上の画像モデルが同じ API キーから利用できます。全リストは RunAPI 料金ページで確認でき、新しいモデルが追加されると自動的に更新されます。
RunAPI 経由での画像生成コストはいくらですか?
Imagen 4 Fast で1枚あたり2セントから始まります。Flux Kontext Pro は2.5セント、Seedream 5 Lite は2.75セント、GPT Image 2 は3セントからです。すべての料金は月額最低料金なしの従量課金です。
RunAPI は画像呼び出しと LLM 呼び出しを別々に請求しますか?
いいえ。RunAPI はすべてのモダリティにわたって単一のクレジット残高を使用します。画像、動画、音楽、LLM の呼び出しはすべて同じアカウント残高から差し引かれます。モダリティごとのサブスクリプションや最低利用料金はありません。RunAPI ダッシュボードでモデルごとの支出を確認できます。
OpenClaw のワークフローで画像モデルを切り替えるにはどうすればいいですか?
リクエストボディの model フィールドを変更します。エンドポイント、API キー、タスクライフサイクル、ポーリングパターンはそのままです。エージェントはインテグレーションコードを変更せずにタスクに応じて異なるモデルにルーティングできます。例えば、ドラフトを seedream-5-lite-text-to-image に、最終出力を flux-kontext-pro にルーティングします。
RunAPI は画像生成において fal.ai や Replicate より安価ですか?
RunAPI の画像生成は1枚あたり2セントから始まり、fal.ai の約4セント、Replicate の約3.5セントと比較して競争力があります。料金はモデルと解像度によって異なります。モデルごとの現在の料金は RunAPI 料金ページで確認してください。
数分で OpenClaw に画像生成を追加する。
RunAPI キー1つで、OpenClaw エージェントが Flux Kontext、Imagen 4、Seedream、GPT Image 2、そして画像・動画・音楽・LLM にわたる100種類以上のモデルにアクセスできます。追加スキルも、追加の請求アカウントも不要です。