SKILLS · 31 modèles · 50+ agents

Installez des skills d’API IA dans n’importe quel agent.

Un skill regroupe installation, documentation et appels d’outils pour image, vidéo, musique IA et LLM. Fonctionne avec Claude Code, Codex CLI, Gemini CLI ou directement via npm/pip.

All systems normal
# Works with Claude Code, Codex, Gemini CLI, Cursor, and 50+ agents
npx skills add runapi-ai/<model> -g
The -g flag installs globally so every project picks it up.
Or paste this prompt to your AI agent:
Install the <model> skill for me:

1. Clone https://github.com/runapi-ai/<model>
2. Copy the skills/<model>/ directory into your
   user-level skills directory (e.g. ~/.claude/skills/
   for Claude Code, ~/.codex/skills/ for Codex).
3. Verify that SKILL.md is present.
4. Confirm the install path when done.
One skill gives your agent everything it needs to call the API — setup, docs, and recipes.
APERÇU

RunAPI agrège 31 modèles multimodaux chez 18 fournisseurs et livre chacun comme skill installable en CLI. Une clé ouvre tout le catalogue d’API IA unifiée ; un schéma fonctionne sur chaque runtime.

  • Une seule API key pour tous les fournisseurs
  • Appels schema-first validés avant l’envoi
  • Facturation mesurée par appel, sans engagement
  • Skills compatibles avec 50+ agents : Claude Code, Codex, Cursor, Gemini CLI et plus
CATÉGORIES

Parcourir tous les skills

Filtrez par modalité ou passez directement à un fournisseur.

Claude
Anthropic
Text

Anthropic's LLM for complex reasoning, code, analysis, and extended-context tasks.

à partir de $0.050 / 1K tokens Voir →
DeepSeek
DeepSeek
Text

Reasoning-first LLMs via RunAPI — flash for fast, low-cost work; pro for complex agentic tasks.

à partir de $0.060 / 1K tokens Voir →
ElevenLabs
ElevenLabs
Audio & Music

Voice synthesis, text-to-speech, sound effects, speech-to-text, and audio isolation.

à partir de $0.040 / minute Voir →
Flux 2
Black Forest Labs
Image

Text-to-image and remix-image with strong prompt adherence from Black Forest Labs.

à partir de $0.050 / call Voir →
Flux Kontext
Black Forest Labs
Image

In-context image editing — local edits, style transfer, and character-consistent generation.

à partir de $0.100 / call Voir →
Gemini
Google
Text

Google's multimodal LLM for chat, code generation, reasoning, and long-context tasks.

à partir de $0.030 / 1K tokens Voir →
Gemini Omni
Google
Image

Voice, character, and multimodal video generation resources for narration, dialogue, and agent media workflows.

à partir de $0.0000 / call Voir →
GPT
OpenAI
Text

OpenAI's flagship LLM for chat, code generation, and multi-step reasoning tasks.

à partir de $0.030 / 1K tokens Voir →
GPT Image
OpenAI
Image

Text-to-image and image editing powered by OpenAI's image generation models.

à partir de $0.040 / call Voir →
GPT Image 2
OpenAI
Image

Latest OpenAI image generation with near-perfect multilingual text rendering inside images.

à partir de $0.060 / call Voir →
GPT-4o Image
OpenAI
Image

Native image generation inside GPT-4o — generate and edit images within the conversation.

à partir de $0.060 / call Voir →
Grok Imagine
xAI
Image

Image and video generation from text — text-to-image, image-to-video, and editing with audio.

à partir de $0.020 / call Voir →
Hailuo
MiniMax
Video

Text and image-to-video at native 1080p with accurate physics simulation and motion.

à partir de $0.300 / call Voir →
HappyHorse
Alibaba
Video

Text, image, and edit-video generation with 720p and 1080p output, duration control, first-frame image support, ordered reference images for character-guided clips, and source-video editing.

à partir de $0.480 / second Voir →
Ideogram V3
Ideogram
Text

Text-to-image with industry-leading in-image text accuracy — posters, logos, and typography.

à partir de $0.070 / call Voir →
Imagen 4
Google
Image

Photorealistic text-to-image with precise typography, broad style range, and up to 2K resolution.

à partir de $0.040 / call Voir →
InfiniteTalk
MeiGen-AI
Video

Audio-driven talking-head animation — lip-sync and animate a portrait from any audio input.

à partir de $0.120 / second Voir →
Kling
Kuaishou
Text

Text and image-to-video at up to 4K 60fps with multimodal audio and AI avatar generation.

à partir de $0.050 / second Voir →
Luma
Luma
Video

Video modification and transformation powered by Luma's Dream Machine model.

à partir de $0.500 / call Voir →
Nano Banana
Google
Image

Fast text-to-image with accurate in-image text rendering and multi-character consistency.

à partir de $0.040 / call Voir →
Qwen 2
Alibaba
Image

Text-to-image, image remix, and image editing from Alibaba's Qwen visual model family.

à partir de $0.040 / call Voir →
Recraft
Recraft
Image

AI image upscaling and background removal for design and production workflows.

à partir de $0.010 / call Voir →
Runway
Runway
Video

Video generation and editing — create and transform footage with text prompts.

à partir de $0.120 / call Voir →
Runway Aleph
Runway
Video

Prompt-guided video editing that transforms existing footage with frame-level continuity.

à partir de $1.10 / call Voir →
Seedance
Bytedance
Video

Text and image-to-video with native audio-video joint synthesis, up to 15-second multi-shot clips.

à partir de $0.020 / second Voir →
Seedream
Bytedance
Image

Text-to-image and image editing with strong typography rendering, up to 4K resolution.

à partir de $0.060 / call Voir →
Suno
Suno
Audio & Music

AI music generation — create full songs with vocals, instruments, and lyrics from a text prompt.

à partir de $0.0000 / call Voir →
Topaz
Topaz
Image

AI-powered image and video upscaling — enhance resolution and detail without artifacts.

à partir de $0.120 / second Voir →
Veo 3.1
Google
Video

High-fidelity video generation up to 4K with natively synthesized dialogue, sound effects, and ambience.

à partir de $0.300 / call Voir →
Wan
Alibaba
Video

Comprehensive video and image suite — text-to-video, image-to-video, video editing, and storyboards.

à partir de $0.050 / call Voir →
Z Image
Alibaba
Image

Ultra-fast text-to-image — photorealistic results in ~1 second with 8 inference steps.

à partir de $0.010 / call Voir →
SKILLS

Un skill est plus qu’un binding : docs, schéma et installation en un seul paquet.

Une installation, tous les agents

Choisissez le runtime, collez la commande, et l’agent récupère docs, schéma et adaptateur.

Appels schema-first

Chaque skill embarque un schéma JSON typé. Les mauvaises requêtes sont arrêtées avant la production.

Coût et latence prévisibles

Tarifs par appel ou par unité : voyez le coût de chaque appel avant exécution.

INSTALLER PATTERNS

Une commande, tous les agents.

Fonctionne avec Claude Code, Codex, Gemini CLI, Cursor et 50+ autres agents.

# Works with Claude Code, Codex, Gemini CLI, Cursor, and 50+ agents
npx skills add runapi-ai/<model> -g
The -g flag installs globally so every project picks it up.
Or paste this prompt to your AI agent:
Install the <model> skill for me:

1. Clone https://github.com/runapi-ai/<model>
2. Copy the skills/<model>/ directory into your
   user-level skills directory (e.g. ~/.claude/skills/
   for Claude Code, ~/.codex/skills/ for Codex).
3. Verify that SKILL.md is present.
4. Confirm the install path when done.
TARIFS

Payez seulement ce que vous appelez.

Table complète des tarifs →
VIDEO
$0.300 / call

Video generation — text-to-video, image-to-video, extend, upscale.

IMAGE
$0.060 / call

Image generation and editing — text-to-image, remix, upscale.

AUDIO & MUSIC
$0.040 / minute

Music, speech synthesis, sound effects, and audio processing.

LLM
$0.050 / 1K tokens

Large language models for chat, code, and reasoning.

FAQ

Réponses rapides depuis la documentation.

Qu’est-ce qu’un model skill exactement ?

Un skill regroupe installation, schéma, prompt et adaptateur runtime pour les CLIs compatibles.

Quels CLIs les skills prennent-ils en charge aujourd’hui ?

Les skills fonctionnent avec 50+ agents, dont Claude Code, Codex, Gemini CLI et Cursor.

Faut-il un compte séparé par fournisseur ?

Non. Une clé RunAPI ouvre tout le catalogue et la facturation est unifiée.

Comment la facturation fonctionne-t-elle ?

Par appel ou unité mesurée, facturée mensuellement en USD. Les générations échouées ne sont pas facturées.

Puis-je auto-héberger le SDK ?

Les paquets SDK sur npm, pip et RubyGems sont sous licence MIT.

Où signaler un skill cassé ?

Ouvrez une issue dans le dépôt GitHub public.

COMMENCER

Installez votre premier skill en moins de soixante secondes.

Une commande, pas de parcours d’auth compliqué, les 1 000 premiers appels gratuits.