Utiliser GPT dans Hermes Agent.
GPT-5.5 est le LLM phare d'OpenAI, disponible via RunAPI à la moitié du prix officiel par token. Hermes Agent se connecte via le fournisseur custom:runapi en mode chat_completions — un seul bloc de configuration déverrouille chaque variante GPT (5.5, 5.4, 5.4-mini, 5.3-codex) avec streaming, function calling et sortie structurée.
Utilisez RunAPI pour appeler GPT-5.5 via l'endpoint Chat Completions compatible OpenAI.
Exigences :
- Lire la clé API depuis RUNAPI_API_KEY.
- Utiliser le fournisseur custom:runapi avec base_url https://runapi.ai/v1.
- Appeler POST https://runapi.ai/v1/chat/completions
- Définir le modèle sur "gpt-5.5".
- Inclure un tableau messages avec au moins un message utilisateur.
- La réponse est synchrone — la complétion arrive dans la même réponse HTTP.
- Pour le streaming, définir "stream" sur true pour recevoir des événements server-sent.
- Pour l'API Responses, appeler POST https://runapi.ai/v1/responses à la place.
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"messages": [
{"role": "system", "content": "You are a concise coding assistant."},
{"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
],
"temperature": 0.3,
"max_tokens": 1024
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "gpt-5.5",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "def merge_sorted(a, b):\n result = []\n i = j = 0\n while i < len(a) and j < len(b):\n if a[i] <= b[j]:\n result.append(a[i]);\ i += 1\n else:\n result.append(b[j]); j += 1\n result.extend(a[i:])\n result.extend(b[j:])\n return result"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 38,
"completion_tokens": 95,
"total_tokens": 133
}
}
Utiliser GPT dans Hermes Agent en trois étapes
Ajouter RunAPI comme fournisseur personnalisé
Si le fournisseur custom:runapi est déjà configuré dans Hermes Agent, la même clé fonctionne pour GPT. Sinon, ajoutez un fournisseur personnalisé avec base_url https://runapi.ai/v1, key_env défini sur RUNAPI_API_KEY et api_mode défini sur chat_completions.
export RUNAPI_API_KEY=runapi_xxx
Sélectionner un modèle GPT
Définissez le modèle par défaut sur gpt-5.5 pour le modèle phare, gpt-5.4 ou gpt-5.4-mini pour un coût moindre, ou gpt-5.3-codex pour les tâches intensives en code. L'endpoint /v1/chat/completions retourne une réponse OpenAI standard avec les comptages d'utilisation et finish_reason.
default: gpt-5.5
Utiliser le streaming ou le function calling
Hermes Agent transfère les paramètres stream, tools et response_format via le fournisseur custom:runapi. Tous les paramètres Chat Completions OpenAI standard fonctionnent via RunAPI sans modification.
"stream": true
Paramètres Chat Completions GPT
| Paramètre | Type | Description |
|---|---|---|
model |
string |
Requis. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex ou gpt-5.2. |
messages |
array |
Requis. Tableau d'objets de message avec les champs role (system, user, assistant) et content. |
temperature |
number |
Optionnel. Température d'échantillonnage entre 0 et 2. Des valeurs plus basses produisent une sortie plus déterministe. Par défaut 1. |
max_tokens |
integer |
Optionnel. Nombre maximum de tokens à générer dans la complétion. |
stream |
boolean |
Optionnel. Si true, retourne des événements server-sent avec des deltas de tokens incrémentiels. Par défaut false. |
tools |
array |
Optionnel. Tableau de définitions d'outils pour le function calling. Chaque outil a un type, un nom de fonction, une description et un schéma de paramètres. |
response_format |
object |
Optionnel. Définissez type sur "json_object" ou "json_schema" pour une sortie JSON structurée. |
reasoning_effort |
string |
Optionnel. Contrôle la profondeur de réflexion pour les modèles pris en charge. Valeurs acceptées low, medium, high. |
Qu'est-ce que GPT sur Hermes Agent ?
GPT est la famille LLM d'OpenAI, disponible via le fournisseur custom:runapi de RunAPI à la moitié du coût officiel par token. Hermes Agent se connecte en utilisant le mode API chat_completions standard, vous donnant accès à GPT-5.5, 5.4, 5.4-mini et 5.3-codex avec streaming, appel de fonctions, sortie JSON structurée et entrée vision -- tous via la même configuration de fournisseur que vous utilisez pour Claude ou Gemini.
Cas d'utilisation de GPT
Codage agentique avec les modèles Codex
Utiliser GPT-5.3-codex via Hermes Agent pour la génération de code, le refactoring et les workflows automatisés de PR à un coût par token inférieur aux modèles phares.
Traitement par lot avec des sorties structurées
Traiter de grands ensembles de documents via GPT avec le format de réponse json_schema, extrayant des données structurées à grande échelle pour des pipelines RAG, l'analyse de factures ou la classification de contenu.
Routage dynamique de modèles par complexité de tâche
Router les requêtes simples vers GPT-5.4-mini pour l'efficacité des coûts et les tâches de raisonnement complexes vers GPT-5.5 pour la qualité, tout via le même fournisseur custom:runapi et la même clé API.
Questions sur GPT + Hermes Agent
Oui. Hermes Agent prend en charge les fournisseurs personnalisés compatibles OpenAI. Ajoutez RunAPI en tant que custom:runapi avec base_url https://runapi.ai/v1, key_env défini sur RUNAPI_API_KEY et api_mode défini sur chat_completions. Définissez le modèle par défaut sur gpt-5.5.
RunAPI facture 50% du tarif par token officiel d'OpenAI pour tous les modèles GPT. La remise s'applique aux tokens d'entrée et de sortie. Consultez la page de tarification RunAPI pour les tarifs exacts par million de tokens.
Oui. Le fournisseur custom:runapi fonctionne avec toutes les variantes GPT. Changez uniquement le champ model dans votre requête — gpt-5.5, gpt-5.4, gpt-5.4-mini ou gpt-5.3-codex. L'URL de base, la clé API et api_mode restent les mêmes.
Oui. RunAPI proxyfie également l'API OpenAI Responses à /v1/responses. Si Hermes Agent prend en charge la surface de l'API Responses, définissez l'endpoint sur https://runapi.ai/v1/responses. La même clé API et le même fournisseur personnalisé fonctionnent pour les deux endpoints.
Oui. Passez un tableau tools pour le function calling ou définissez response_format sur json_schema pour une sortie structurée. RunAPI transfère ces paramètres au modèle GPT et retourne les tool_calls ou le JSON structuré dans le format de réponse OpenAI standard.
Configuration générale de Hermes Agent
Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.
Guide de configuration Hermes Agent →Catalogue des modèles GPT
Voir toutes les variantes GPT, la tarification par token et la documentation API.
GPT sur RunAPI →Essayez GPT-5.5 dans Hermes Agent dès aujourd'hui.
Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et appelez GPT-5.5 à la moitié du prix officiel OpenAI par token — streaming, function calling et sortie structurée inclus.