HERMES + GPT

Utiliser GPT dans Hermes Agent.

GPT-5.5 est le LLM phare d'OpenAI, disponible via RunAPI à la moitié du prix officiel par token. Hermes Agent se connecte via le fournisseur custom:runapi en mode chat_completions — un seul bloc de configuration déverrouille chaque variante GPT (5.5, 5.4, 5.4-mini, 5.3-codex) avec streaming, function calling et sortie structurée.

une seule clé API · compatible OpenAI · réponses en streaming
Utilisez RunAPI pour appeler GPT-5.5 via l'endpoint Chat Completions compatible OpenAI.


  Exigences :

  - Lire la clé API depuis RUNAPI_API_KEY.

  - Utiliser le fournisseur custom:runapi avec base_url https://runapi.ai/v1.

  - Appeler POST https://runapi.ai/v1/chat/completions

  - Définir le modèle sur "gpt-5.5".

  - Inclure un tableau messages avec au moins un message utilisateur.

  - La réponse est synchrone — la complétion arrive dans la même réponse HTTP.

  - Pour le streaming, définir "stream" sur true pour recevoir des événements server-sent.

  - Pour l'API Responses, appeler POST https://runapi.ai/v1/responses à la place.

  
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [
      {"role": "system", "content": "You are a concise coding assistant."},
      {"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
    ],
    "temperature": 0.3,
    "max_tokens": 1024
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.5",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "def merge_sorted(a, b):\n    result = []\n    i = j = 0\n    while i < len(a) and j < len(b):\n        if a[i] <= b[j]:\n            result.append(a[i]);\ i += 1\n        else:\n            result.append(b[j]); j += 1\n    result.extend(a[i:])\n    result.extend(b[j:])\n    return result"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 95,
    "total_tokens": 133
  }
}
Copiez la commande curl pour tester gpt
FONCTIONNEMENT

Utiliser GPT dans Hermes Agent en trois étapes

1

Ajouter RunAPI comme fournisseur personnalisé

Si le fournisseur custom:runapi est déjà configuré dans Hermes Agent, la même clé fonctionne pour GPT. Sinon, ajoutez un fournisseur personnalisé avec base_url https://runapi.ai/v1, key_env défini sur RUNAPI_API_KEY et api_mode défini sur chat_completions.

export RUNAPI_API_KEY=runapi_xxx
2

Sélectionner un modèle GPT

Définissez le modèle par défaut sur gpt-5.5 pour le modèle phare, gpt-5.4 ou gpt-5.4-mini pour un coût moindre, ou gpt-5.3-codex pour les tâches intensives en code. L'endpoint /v1/chat/completions retourne une réponse OpenAI standard avec les comptages d'utilisation et finish_reason.

default: gpt-5.5
3

Utiliser le streaming ou le function calling

Hermes Agent transfère les paramètres stream, tools et response_format via le fournisseur custom:runapi. Tous les paramètres Chat Completions OpenAI standard fonctionnent via RunAPI sans modification.

"stream": true
PARAMÈTRES

Paramètres Chat Completions GPT

Paramètre Type Description
model string Requis. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex ou gpt-5.2.
messages array Requis. Tableau d'objets de message avec les champs role (system, user, assistant) et content.
temperature number Optionnel. Température d'échantillonnage entre 0 et 2. Des valeurs plus basses produisent une sortie plus déterministe. Par défaut 1.
max_tokens integer Optionnel. Nombre maximum de tokens à générer dans la complétion.
stream boolean Optionnel. Si true, retourne des événements server-sent avec des deltas de tokens incrémentiels. Par défaut false.
tools array Optionnel. Tableau de définitions d'outils pour le function calling. Chaque outil a un type, un nom de fonction, une description et un schéma de paramètres.
response_format object Optionnel. Définissez type sur "json_object" ou "json_schema" pour une sortie JSON structurée.
reasoning_effort string Optionnel. Contrôle la profondeur de réflexion pour les modèles pris en charge. Valeurs acceptées low, medium, high.

Qu'est-ce que GPT sur Hermes Agent ?

GPT est la famille LLM d'OpenAI, disponible via le fournisseur custom:runapi de RunAPI à la moitié du coût officiel par token. Hermes Agent se connecte en utilisant le mode API chat_completions standard, vous donnant accès à GPT-5.5, 5.4, 5.4-mini et 5.3-codex avec streaming, appel de fonctions, sortie JSON structurée et entrée vision -- tous via la même configuration de fournisseur que vous utilisez pour Claude ou Gemini.

Cas d'utilisation de GPT

Codage agentique avec les modèles Codex

Utiliser GPT-5.3-codex via Hermes Agent pour la génération de code, le refactoring et les workflows automatisés de PR à un coût par token inférieur aux modèles phares.

Traitement par lot avec des sorties structurées

Traiter de grands ensembles de documents via GPT avec le format de réponse json_schema, extrayant des données structurées à grande échelle pour des pipelines RAG, l'analyse de factures ou la classification de contenu.

Routage dynamique de modèles par complexité de tâche

Router les requêtes simples vers GPT-5.4-mini pour l'efficacité des coûts et les tâches de raisonnement complexes vers GPT-5.5 pour la qualité, tout via le même fournisseur custom:runapi et la même clé API.

FAQ

Questions sur GPT + Hermes Agent

Configuration générale de Hermes Agent

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.

Guide de configuration Hermes Agent →

Catalogue des modèles GPT

Voir toutes les variantes GPT, la tarification par token et la documentation API.

GPT sur RunAPI →

Essayez GPT-5.5 dans Hermes Agent dès aujourd'hui.

Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et appelez GPT-5.5 à la moitié du prix officiel OpenAI par token — streaming, function calling et sortie structurée inclus.