---
title: &quot;Usa Gemini in Hermes Agent tramite RunAPI — Guida API LLM&quot;
url: &quot;https://runapi.ai/it/hermes-gemini.md&quot;
canonical: &quot;https://runapi.ai/it/hermes-gemini&quot;
locale: &quot;it&quot;
model: &quot;gemini&quot;
---

# Usa Gemini in Hermes Agent.

Google Gemini è disponibile tramite l&#39;endpoint OpenAI-compatibile di RunAPI. Hermes Agent lo chiama usando il provider custom:runapi — Gemini 3.5 Flash per i loop agente sensibili alla velocità, 3.x Pro per il ragionamento in più passaggi, 2.5 Pro per i task di produzione con contesto lungo. Nessun progetto Google Cloud o credenziale Vertex AI richiesti — solo la stessa RUNAPI_API_KEY e base_url già configurate per la chat.

## API example

```bash
curl -X POST https://runapi.ai/v1/chat/completions \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;gemini-3.5-flash&quot;,
    &quot;messages&quot;: [
      {&quot;role&quot;: &quot;system&quot;, &quot;content&quot;: &quot;You are a concise technical assistant.&quot;},
      {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: &quot;Explain the difference between gRPC and REST in three sentences.&quot;}
    ],
    &quot;temperature&quot;: 0.7,
    &quot;max_tokens&quot;: 256
  }&#39;

```

### Response

```json
{
  &quot;id&quot;: &quot;chatcmpl-abc123&quot;,
  &quot;object&quot;: &quot;chat.completion&quot;,
  &quot;model&quot;: &quot;gemini-3.5-flash&quot;,
  &quot;choices&quot;: [
    {
      &quot;index&quot;: 0,
      &quot;message&quot;: {
        &quot;role&quot;: &quot;assistant&quot;,
        &quot;content&quot;: &quot;gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers.&quot;
      },
      &quot;finish_reason&quot;: &quot;stop&quot;
    }
  ],
  &quot;usage&quot;: {
    &quot;prompt_tokens&quot;: 34,
    &quot;completion_tokens&quot;: 71,
    &quot;total_tokens&quot;: 105
  }
}

```

## How it works

1. **Configura RunAPI** — Imposta la variabile d&#39;ambiente RUNAPI_API_KEY. Se hai già aggiunto RunAPI come provider custom:runapi in Hermes Agent, la stessa key e base_url funzionano per Gemini — cambia solo l&#39;ID del modello. Nessuna credenziale Google Cloud necessaria.
2. **Chiama Gemini tramite chat completions** — Invia una richiesta POST a /v1/chat/completions con model impostato su gemini-3.5-flash. Passa un array messages con i ruoli system e user. Hermes Agent invia la stessa struttura di richiesta OpenAI-compatibile che usa per GPT — RunAPI instrada su Gemini in base al parametro model.
3. **Leggi la risposta** — La risposta arriva in modo sincrono nel formato OpenAI chat completion. La risposta dell&#39;assistente è in choices[0].message.content, con l&#39;utilizzo dei token nell&#39;oggetto usage. Per lo streaming, imposta stream su true e Hermes Agent analizza automaticamente gli eventi SSE delta.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Obbligatorio. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview, o gemini-3.1-pro-preview. |
| `messages` | `array` | Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content. |
| `temperature` | `number` | Facoltativo. Temperatura di campionamento tra 0 e 2. Valori più bassi producono output più deterministico. Il valore predefinito varia per modello. |
| `max_tokens` | `integer` | Facoltativo. Numero massimo di token da generare nella risposta. |
| `stream` | `boolean` | Facoltativo. Quando true, la risposta viene inviata in streaming come server-sent events. Ogni evento contiene un delta con contenuto parziale. |
| `top_p` | `number` | Facoltativo. Soglia di nucleus sampling tra 0 e 1. Alternativa alla temperature per controllare la casualità dell&#39;output. |

## FAQ

### Posso usare Google Gemini in Hermes Agent senza credenziali Google Cloud?

Sì. RunAPI fornisce Gemini tramite il suo endpoint OpenAI-compatibile. Configura RunAPI come provider custom:runapi con base_url https://runapi.ai/v1 e key_env RUNAPI_API_KEY. Nessun progetto Google Cloud, account di servizio o configurazione Vertex AI richiesti.

### Quale versione di Gemini dovrei usare per i workflow agente?

Gemini 3.5 Flash (gemini-3.5-flash) è il più recente e veloce — ideale per loop agente in tempo reale e catene di chiamate agli strumenti. Gemini 2.5 Pro (gemini-2.5-pro) gestisce task con contesto lungo e ragionamento complesso. Le anteprime Gemini 3.x Pro offrono le più recenti capacità di ragionamento a costo maggiore.

### Come funziona il pricing di Gemini su RunAPI?

Gemini è fatturato per token su RunAPI con prezzi pay-as-you-go. I token di input e output sono misurati separatamente. Nessun abbonamento mensile, nessuna spesa minima. Consulta la pagina dei prezzi di RunAPI per le tariffe aggiornate per milione di token.

### Hermes Agent può passare tra Gemini e altri LLM durante la sessione?

Sì. Tutti gli LLM RunAPI condividono lo stesso provider custom:runapi e la stessa API key. Usa il comando /model o hermes model per passare tra gemini-3.5-flash, gpt-5.5, claude-opus-4.6, o qualsiasi altro modello RunAPI senza cambiare la configurazione del provider.

### Gemini tramite RunAPI supporta function calling e tool use?

Sì. RunAPI passa i parametri tools e tool_choice OpenAI-compatibili a Gemini. Definisci gli strumenti nel corpo della richiesta e Gemini restituisce tool_calls nel messaggio dell&#39;assistente. Hermes Agent li elabora allo stesso modo in cui gestisce le chiamate agli strumenti di GPT o Claude.


## Links

- [Guida di configurazione di Hermes Agent →](https://runapi.ai/it/hermes-agent)
- [Modelli Gemini →](https://runapi.ai/it/models/gemini)
- [Model catalog](https://runapi.ai/it/models)
- [API docs](https://runapi.ai/it/docs)