Usa GPT in Hermes Agent.
GPT-5.5 è il modello LLM di punta di OpenAI, disponibile tramite RunAPI alla metà del prezzo ufficiale per token. Hermes Agent si connette tramite il provider custom:runapi usando la modalità chat_completions — un blocco di configurazione sblocca ogni variante GPT (5.5, 5.4, 5.4-mini, 5.3-codex) con streaming, chiamate a funzioni e output strutturato.
Usa RunAPI per chiamare GPT-5.5 tramite l'endpoint OpenAI-compatibile Chat Completions.
Requisiti:
- Leggi la API key da RUNAPI_API_KEY.
- Usa il provider custom:runapi con base_url https://runapi.ai/v1.
- Chiama POST https://runapi.ai/v1/chat/completions
- Imposta model su "gpt-5.5".
- Includi un array messages con almeno un messaggio utente.
- La risposta è sincrona — il completamento arriva nella stessa risposta HTTP.
- Per lo streaming, imposta "stream": true per ricevere server-sent events.
- Per la Responses API, chiama POST https://runapi.ai/v1/responses invece.
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"messages": [
{"role": "system", "content": "You are a concise coding assistant."},
{"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
],
"temperature": 0.3,
"max_tokens": 1024
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "gpt-5.5",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "def merge_sorted(a, b):\n result = []\n i = j = 0\n while i < len(a) and j < len(b):\n if a[i] <= b[j]:\n result.append(a[i]); i += 1\n else:\n result.append(b[j]); j += 1\n result.extend(a[i:])\n result.extend(b[j:])\n return result"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 38,
"completion_tokens": 95,
"total_tokens": 133
}
}
Usa GPT in Hermes Agent in tre passaggi
Aggiungi RunAPI come provider personalizzato
Se il provider custom:runapi è già configurato in Hermes Agent, la stessa key funziona per GPT. Altrimenti, aggiungi un provider personalizzato con base_url https://runapi.ai/v1, key_env impostato su RUNAPI_API_KEY e api_mode impostato su chat_completions.
export RUNAPI_API_KEY=runapi_xxx
Seleziona un modello GPT
Imposta il modello predefinito su gpt-5.5 per il modello di punta, gpt-5.4 o gpt-5.4-mini per un costo inferiore, oppure gpt-5.3-codex per task intensivi di codice. L'endpoint /v1/chat/completions restituisce una risposta OpenAI standard con conteggi di utilizzo e finish_reason.
default: gpt-5.5
Usa streaming o chiamate a funzioni
Hermes Agent trasferisce i parametri stream, tools e response_format tramite il provider custom:runapi. Tutti i parametri standard OpenAI Chat Completions funzionano tramite RunAPI senza modifiche.
"stream": true
Parametri GPT Chat Completions
| Parametro | Tipo | Descrizione |
|---|---|---|
model |
string |
Obbligatorio. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex, o gpt-5.2. |
messages |
array |
Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content. |
temperature |
number |
Facoltativo. Temperatura di campionamento tra 0 e 2. Valori più bassi producono output più deterministico. Il valore predefinito è 1. |
max_tokens |
integer |
Facoltativo. Numero massimo di token da generare nel completamento. |
stream |
boolean |
Facoltativo. Se true, restituisce server-sent events con delta di token incrementali. Il valore predefinito è false. |
tools |
array |
Facoltativo. Array di definizioni di strumenti per le chiamate a funzioni. Ogni strumento ha un tipo, un nome di funzione, una descrizione e uno schema di parametri. |
response_format |
object |
Facoltativo. Imposta type su "json_object" o "json_schema" per l'output JSON strutturato. |
reasoning_effort |
string |
Facoltativo. Controlla la profondità di ragionamento per i modelli supportati. I valori accettati sono low, medium, high. |
Cos'è GPT su Hermes Agent?
GPT è la famiglia LLM di OpenAI, disponibile tramite il provider custom:runapi di RunAPI alla metà del costo ufficiale per token. Hermes Agent si connette usando la modalità API chat_completions standard, dandoti GPT-5.5, 5.4, 5.4-mini e 5.3-codex con streaming, chiamate a funzioni, output JSON strutturato e input vision -- tutti tramite la stessa configurazione del provider usata per Claude o Gemini.
Casi d'uso di GPT
Codifica agentiva con i modelli Codex
Usare GPT-5.3-codex tramite Hermes Agent per la generazione di codice, il refactoring e i workflow automatizzati di PR a un costo per token inferiore rispetto ai modelli di punta.
Elaborazione batch con output strutturati
Elaborare grandi set di documenti tramite GPT con il formato di risposta json_schema, estraendo dati strutturati su larga scala per pipeline RAG, analisi di fatture o classificazione dei contenuti.
Routing dinamico dei modelli in base alla complessità del task
Instradare le query semplici a GPT-5.4-mini per l'efficienza dei costi e i task di ragionamento complesso a GPT-5.5 per la qualità, tutto tramite lo stesso provider custom:runapi e la stessa API key.
Domande su GPT + Hermes Agent
Sì. Hermes Agent supporta provider OpenAI-compatibili personalizzati. Aggiungi RunAPI come custom:runapi con base_url https://runapi.ai/v1, key_env impostato su RUNAPI_API_KEY e api_mode impostato su chat_completions. Imposta il modello predefinito su gpt-5.5.
RunAPI addebita il 50% della tariffa ufficiale OpenAI per token per tutti i modelli GPT. Lo sconto si applica sia ai token di input che a quelli di output. Controlla la pagina dei prezzi di RunAPI per le tariffe esatte per milione di token.
Sì. Il provider custom:runapi funziona con tutte le varianti GPT. Cambia solo il campo model nella tua richiesta — gpt-5.5, gpt-5.4, gpt-5.4-mini o gpt-5.3-codex. Il base URL, la API key e l'api_mode rimangono gli stessi.
Sì. RunAPI fa da proxy anche alla OpenAI Responses API su /v1/responses. Se Hermes Agent supporta la superficie Responses API, imposta l'endpoint su https://runapi.ai/v1/responses. La stessa API key e lo stesso provider personalizzato funzionano per entrambi gli endpoint.
Sì. Passa un array tools per le chiamate a funzioni oppure imposta response_format su json_schema per l'output strutturato. RunAPI trasferisce questi parametri al modello GPT e restituisce i tool_calls o il JSON strutturato nel formato di risposta OpenAI standard.
Configurazione generale di Hermes Agent
Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.
Guida di configurazione di Hermes Agent →Catalogo modelli GPT
Vedi tutte le varianti GPT, i prezzi per token e la documentazione API.
GPT su RunAPI →Prova GPT-5.5 in Hermes Agent oggi.
Ottieni una API key RunAPI gratuita, configura il provider custom:runapi e chiama GPT-5.5 alla metà del prezzo ufficiale OpenAI per token — streaming, chiamate a funzioni e output strutturato inclusi.