Posso usare GPT-5.5 in Hermes Agent tramite RunAPI?

Sì. Hermes Agent supporta provider OpenAI-compatibili personalizzati. Aggiungi RunAPI come custom:runapi con base_url https://runapi.ai/v1, key_env impostato su RUNAPI_API_KEY e api_mode impostato su chat_completions. Imposta il modello predefinito su gpt-5.5.

Come si confrontano i prezzi GPT di RunAPI con quelli ufficiali di OpenAI?

RunAPI addebita il 50% della tariffa ufficiale OpenAI per token per tutti i modelli GPT. Lo sconto si applica sia ai token di input che a quelli di output. Controlla la pagina dei prezzi di RunAPI per le tariffe esatte per milione di token.

Posso passare tra varianti GPT senza riconfigurare il provider?

Sì. Il provider custom:runapi funziona con tutte le varianti GPT. Cambia solo il campo model nella tua richiesta — gpt-5.5, gpt-5.4, gpt-5.4-mini o gpt-5.3-codex. Il base URL, la API key e l'api_mode rimangono gli stessi.

La Responses API funziona tramite RunAPI in Hermes Agent?

Sì. RunAPI fa da proxy anche alla OpenAI Responses API su /v1/responses. Se Hermes Agent supporta la superficie Responses API, imposta l'endpoint su https://runapi.ai/v1/responses. La stessa API key e lo stesso provider personalizzato funzionano per entrambi gli endpoint.

Posso usare le chiamate a funzioni e l'output strutturato con GPT su RunAPI?

Sì. Passa un array tools per le chiamate a funzioni oppure imposta response_format su json_schema per l'output strutturato. RunAPI trasferisce questi parametri al modello GPT e restituisce i tool_calls o il JSON strutturato nel formato di risposta OpenAI standard.

HERMES + GPT

Usa GPT in Hermes Agent.

GPT-5.5 è il modello LLM di punta di OpenAI, disponibile tramite RunAPI alla metà del prezzo ufficiale per token. Hermes Agent si connette tramite il provider custom:runapi usando la modalità chat_completions — un blocco di configurazione sblocca ogni variante GPT (5.5, 5.4, 5.4-mini, 5.3-codex) con streaming, chiamate a funzioni e output strutturato.

Ottieni API Key Leggi la documentazione API

una API key · OpenAI-compatibile · risposte in streaming

Usa RunAPI per chiamare GPT-5.5 tramite l'endpoint OpenAI-compatibile Chat Completions.

Requisiti:
- Leggi la API key da RUNAPI_API_KEY.
- Usa il provider custom:runapi con base_url https://runapi.ai/v1.
- Chiama POST https://runapi.ai/v1/chat/completions
- Imposta model su "gpt-5.5".
- Includi un array messages con almeno un messaggio utente.
- La risposta è sincrona — il completamento arriva nella stessa risposta HTTP.
- Per lo streaming, imposta "stream": true per ricevere server-sent events.
- Per la Responses API, chiama POST https://runapi.ai/v1/responses invece.

curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [
      {"role": "system", "content": "You are a concise coding assistant."},
      {"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
    ],
    "temperature": 0.3,
    "max_tokens": 1024
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.5",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "def merge_sorted(a, b):\n    result = []\n    i = j = 0\n    while i < len(a) and j < len(b):\n        if a[i] <= b[j]:\n            result.append(a[i]); i += 1\n        else:\n            result.append(b[j]); j += 1\n    result.extend(a[i:])\n    result.extend(b[j:])\n    return result"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 95,
    "total_tokens": 133
  }
}

Copia il comando curl per testare gpt

COME FUNZIONA

Usa GPT in Hermes Agent in tre passaggi

Aggiungi RunAPI come provider personalizzato

Se il provider custom:runapi è già configurato in Hermes Agent, la stessa key funziona per GPT. Altrimenti, aggiungi un provider personalizzato con base_url https://runapi.ai/v1, key_env impostato su RUNAPI_API_KEY e api_mode impostato su chat_completions.

export RUNAPI_API_KEY=runapi_xxx

Seleziona un modello GPT

Imposta il modello predefinito su gpt-5.5 per il modello di punta, gpt-5.4 o gpt-5.4-mini per un costo inferiore, oppure gpt-5.3-codex per task intensivi di codice. L'endpoint /v1/chat/completions restituisce una risposta OpenAI standard con conteggi di utilizzo e finish_reason.

default: gpt-5.5

Usa streaming o chiamate a funzioni

Hermes Agent trasferisce i parametri stream, tools e response_format tramite il provider custom:runapi. Tutti i parametri standard OpenAI Chat Completions funzionano tramite RunAPI senza modifiche.

"stream": true

PARAMETRI

Parametri GPT Chat Completions

Parametro	Tipo	Descrizione
`model`	`string`	Obbligatorio. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex, o gpt-5.2.
`messages`	`array`	Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content.
`temperature`	`number`	Facoltativo. Temperatura di campionamento tra 0 e 2. Valori più bassi producono output più deterministico. Il valore predefinito è 1.
`max_tokens`	`integer`	Facoltativo. Numero massimo di token da generare nel completamento.
`stream`	`boolean`	Facoltativo. Se true, restituisce server-sent events con delta di token incrementali. Il valore predefinito è false.
`tools`	`array`	Facoltativo. Array di definizioni di strumenti per le chiamate a funzioni. Ogni strumento ha un tipo, un nome di funzione, una descrizione e uno schema di parametri.
`response_format`	`object`	Facoltativo. Imposta type su "json_object" o "json_schema" per l'output JSON strutturato.
`reasoning_effort`	`string`	Facoltativo. Controlla la profondità di ragionamento per i modelli supportati. I valori accettati sono low, medium, high.

Cos'è GPT su Hermes Agent?

GPT è la famiglia LLM di OpenAI, disponibile tramite il provider custom:runapi di RunAPI alla metà del costo ufficiale per token. Hermes Agent si connette usando la modalità API chat_completions standard, dandoti GPT-5.5, 5.4, 5.4-mini e 5.3-codex con streaming, chiamate a funzioni, output JSON strutturato e input vision -- tutti tramite la stessa configurazione del provider usata per Claude o Gemini.

Casi d'uso di GPT

Codifica agentiva con i modelli Codex

Usare GPT-5.3-codex tramite Hermes Agent per la generazione di codice, il refactoring e i workflow automatizzati di PR a un costo per token inferiore rispetto ai modelli di punta.

Elaborazione batch con output strutturati

Elaborare grandi set di documenti tramite GPT con il formato di risposta json_schema, estraendo dati strutturati su larga scala per pipeline RAG, analisi di fatture o classificazione dei contenuti.

Routing dinamico dei modelli in base alla complessità del task

Instradare le query semplici a GPT-5.4-mini per l'efficienza dei costi e i task di ragionamento complesso a GPT-5.5 per la qualità, tutto tramite lo stesso provider custom:runapi e la stessa API key.

FAQ

Domande su GPT + Hermes Agent

Configurazione generale di Hermes Agent

Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.

Guida di configurazione di Hermes Agent →

Catalogo modelli GPT

Vedi tutte le varianti GPT, i prezzi per token e la documentazione API.

GPT su RunAPI →

Prova GPT-5.5 in Hermes Agent oggi.

Ottieni una API key RunAPI gratuita, configura il provider custom:runapi e chiama GPT-5.5 alla metà del prezzo ufficiale OpenAI per token — streaming, chiamate a funzioni e output strutturato inclusi.

Sfoglia i modelli →