HERMES + GPT

Usa GPT in Hermes Agent.

GPT-5.5 è il modello LLM di punta di OpenAI, disponibile tramite RunAPI alla metà del prezzo ufficiale per token. Hermes Agent si connette tramite il provider custom:runapi usando la modalità chat_completions — un blocco di configurazione sblocca ogni variante GPT (5.5, 5.4, 5.4-mini, 5.3-codex) con streaming, chiamate a funzioni e output strutturato.

una API key · OpenAI-compatibile · risposte in streaming
Usa RunAPI per chiamare GPT-5.5 tramite l'endpoint OpenAI-compatibile Chat Completions.

Requisiti:
- Leggi la API key da RUNAPI_API_KEY.
- Usa il provider custom:runapi con base_url https://runapi.ai/v1.
- Chiama POST https://runapi.ai/v1/chat/completions
- Imposta model su "gpt-5.5".
- Includi un array messages con almeno un messaggio utente.
- La risposta è sincrona — il completamento arriva nella stessa risposta HTTP.
- Per lo streaming, imposta "stream": true per ricevere server-sent events.
- Per la Responses API, chiama POST https://runapi.ai/v1/responses invece.
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [
      {"role": "system", "content": "You are a concise coding assistant."},
      {"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
    ],
    "temperature": 0.3,
    "max_tokens": 1024
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.5",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "def merge_sorted(a, b):\n    result = []\n    i = j = 0\n    while i < len(a) and j < len(b):\n        if a[i] <= b[j]:\n            result.append(a[i]); i += 1\n        else:\n            result.append(b[j]); j += 1\n    result.extend(a[i:])\n    result.extend(b[j:])\n    return result"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 95,
    "total_tokens": 133
  }
}
Copia il comando curl per testare gpt
COME FUNZIONA

Usa GPT in Hermes Agent in tre passaggi

1

Aggiungi RunAPI come provider personalizzato

Se il provider custom:runapi è già configurato in Hermes Agent, la stessa key funziona per GPT. Altrimenti, aggiungi un provider personalizzato con base_url https://runapi.ai/v1, key_env impostato su RUNAPI_API_KEY e api_mode impostato su chat_completions.

export RUNAPI_API_KEY=runapi_xxx
2

Seleziona un modello GPT

Imposta il modello predefinito su gpt-5.5 per il modello di punta, gpt-5.4 o gpt-5.4-mini per un costo inferiore, oppure gpt-5.3-codex per task intensivi di codice. L'endpoint /v1/chat/completions restituisce una risposta OpenAI standard con conteggi di utilizzo e finish_reason.

default: gpt-5.5
3

Usa streaming o chiamate a funzioni

Hermes Agent trasferisce i parametri stream, tools e response_format tramite il provider custom:runapi. Tutti i parametri standard OpenAI Chat Completions funzionano tramite RunAPI senza modifiche.

"stream": true
PARAMETRI

Parametri GPT Chat Completions

Parametro Tipo Descrizione
model string Obbligatorio. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex, o gpt-5.2.
messages array Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content.
temperature number Facoltativo. Temperatura di campionamento tra 0 e 2. Valori più bassi producono output più deterministico. Il valore predefinito è 1.
max_tokens integer Facoltativo. Numero massimo di token da generare nel completamento.
stream boolean Facoltativo. Se true, restituisce server-sent events con delta di token incrementali. Il valore predefinito è false.
tools array Facoltativo. Array di definizioni di strumenti per le chiamate a funzioni. Ogni strumento ha un tipo, un nome di funzione, una descrizione e uno schema di parametri.
response_format object Facoltativo. Imposta type su "json_object" o "json_schema" per l'output JSON strutturato.
reasoning_effort string Facoltativo. Controlla la profondità di ragionamento per i modelli supportati. I valori accettati sono low, medium, high.

Cos'è GPT su Hermes Agent?

GPT è la famiglia LLM di OpenAI, disponibile tramite il provider custom:runapi di RunAPI alla metà del costo ufficiale per token. Hermes Agent si connette usando la modalità API chat_completions standard, dandoti GPT-5.5, 5.4, 5.4-mini e 5.3-codex con streaming, chiamate a funzioni, output JSON strutturato e input vision -- tutti tramite la stessa configurazione del provider usata per Claude o Gemini.

Casi d'uso di GPT

Codifica agentiva con i modelli Codex

Usare GPT-5.3-codex tramite Hermes Agent per la generazione di codice, il refactoring e i workflow automatizzati di PR a un costo per token inferiore rispetto ai modelli di punta.

Elaborazione batch con output strutturati

Elaborare grandi set di documenti tramite GPT con il formato di risposta json_schema, estraendo dati strutturati su larga scala per pipeline RAG, analisi di fatture o classificazione dei contenuti.

Routing dinamico dei modelli in base alla complessità del task

Instradare le query semplici a GPT-5.4-mini per l'efficienza dei costi e i task di ragionamento complesso a GPT-5.5 per la qualità, tutto tramite lo stesso provider custom:runapi e la stessa API key.

FAQ

Domande su GPT + Hermes Agent

Configurazione generale di Hermes Agent

Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.

Guida di configurazione di Hermes Agent →

Catalogo modelli GPT

Vedi tutte le varianti GPT, i prezzi per token e la documentazione API.

GPT su RunAPI →

Prova GPT-5.5 in Hermes Agent oggi.

Ottieni una API key RunAPI gratuita, configura il provider custom:runapi e chiama GPT-5.5 alla metà del prezzo ufficiale OpenAI per token — streaming, chiamate a funzioni e output strutturato inclusi.