HERMES + GEMINI

Usa Gemini in Hermes Agent.

Google Gemini è disponibile tramite l'endpoint OpenAI-compatibile di RunAPI. Hermes Agent lo chiama usando il provider custom:runapi — Gemini 3.5 Flash per i loop agente sensibili alla velocità, 3.x Pro per il ragionamento in più passaggi, 2.5 Pro per i task di produzione con contesto lungo. Nessun progetto Google Cloud o credenziale Vertex AI richiesti — solo la stessa RUNAPI_API_KEY e base_url già configurate per la chat.

una API key · endpoint chat OpenAI-compatibile · supporto streaming
Usa RunAPI per inviare una richiesta chat a Google Gemini 3.5 Flash tramite Hermes Agent.

Requisiti:
- Usa il provider custom:runapi già configurato in Hermes Agent
- Chiama l'endpoint chat completions di RunAPI su https://runapi.ai/v1/chat/completions
- Imposta model su "gemini-3.5-flash"
- La variabile d'ambiente RUNAPI_API_KEY fornisce l'autorizzazione
- La risposta è sincrona — la risposta arriva in choices[0].message.content
- Per lo streaming, imposta stream su true e gestisci i server-sent events
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [
      {"role": "system", "content": "You are a concise technical assistant."},
      {"role": "user", "content": "Explain the difference between gRPC and REST in three sentences."}
    ],
    "temperature": 0.7,
    "max_tokens": 256
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gemini-3.5-flash",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 34,
    "completion_tokens": 71,
    "total_tokens": 105
  }
}
Copia il comando curl per testare gemini
COME FUNZIONA

Usa Gemini in Hermes Agent in tre passaggi

1

Configura RunAPI

Imposta la variabile d'ambiente RUNAPI_API_KEY. Se hai già aggiunto RunAPI come provider custom:runapi in Hermes Agent, la stessa key e base_url funzionano per Gemini — cambia solo l'ID del modello. Nessuna credenziale Google Cloud necessaria.

export RUNAPI_API_KEY=runapi_xxx
2

Chiama Gemini tramite chat completions

Invia una richiesta POST a /v1/chat/completions con model impostato su gemini-3.5-flash. Passa un array messages con i ruoli system e user. Hermes Agent invia la stessa struttura di richiesta OpenAI-compatibile che usa per GPT — RunAPI instrada su Gemini in base al parametro model.

POST /v1/chat/completions
3

Leggi la risposta

La risposta arriva in modo sincrono nel formato OpenAI chat completion. La risposta dell'assistente è in choices[0].message.content, con l'utilizzo dei token nell'oggetto usage. Per lo streaming, imposta stream su true e Hermes Agent analizza automaticamente gli eventi SSE delta.

choices[0].message.content
PARAMETRI

Parametri API chat completions Gemini

Parametro Tipo Descrizione
model string Obbligatorio. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview, o gemini-3.1-pro-preview.
messages array Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content.
temperature number Facoltativo. Temperatura di campionamento tra 0 e 2. Valori più bassi producono output più deterministico. Il valore predefinito varia per modello.
max_tokens integer Facoltativo. Numero massimo di token da generare nella risposta.
stream boolean Facoltativo. Quando true, la risposta viene inviata in streaming come server-sent events. Ogni evento contiene un delta con contenuto parziale.
top_p number Facoltativo. Soglia di nucleus sampling tra 0 e 1. Alternativa alla temperature per controllare la casualità dell'output.

Cos'è Gemini su Hermes Agent?

Google Gemini è disponibile tramite il provider custom:runapi di RunAPI senza credenziali Google Cloud. Hermes Agent lo chiama usando la stessa configurazione compatibile con OpenAI usata per GPT e Claude. Gemini 3.5 Flash è l'opzione più veloce per i loop di agente sensibili alla velocità, mentre Gemini 2.5 Pro offre una finestra di contesto da 1M token e la modalità di pensiero per task di ragionamento complesso multi-step.

Casi d'uso di Gemini

Chat vocale e video in tempo reale con Live API

Usare le capacità multimodali di Gemini per applicazioni in tempo reale che elaborano input audio e video insieme al testo, costruendo agenti interattivi capaci di vedere e sentire tramite i workflow di Hermes Agent.

Ancoraggio delle risposte con i dati di Google Search

Abilitare il grounding di Google Search sulle richieste di Gemini per ottenere risposte supportate da dati web attuali, utile per agenti che necessitano di informazioni aggiornate oltre la loro data di taglio dell'addestramento.

Catene di chiamate agli strumenti degli agenti economiche

Eseguire Gemini 3.5 Flash per loop di chiamate agli strumenti veloci ed economici dove l'agente deve effettuare molte chiamate sequenziali. La latenza del primo token inferiore a 100ms mantiene le catene degli agenti reattive senza superare il budget.

FAQ

Domande su Gemini + Hermes Agent

Configurazione generale di Hermes Agent

Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.

Guida di configurazione di Hermes Agent →

Catalogo modelli Gemini

Vedi tutte le varianti Gemini, i livelli di prezzo e la documentazione API.

Modelli Gemini →

Prova Gemini in Hermes Agent oggi.

Ottieni una API key RunAPI gratuita, imposta model su gemini-3.5-flash nel tuo provider custom:runapi e inizia a usare Gemini in Hermes Agent.