Posso usare Google Gemini in Hermes Agent senza credenziali Google Cloud?

Sì. RunAPI fornisce Gemini tramite il suo endpoint OpenAI-compatibile. Configura RunAPI come provider custom:runapi con base_url https://runapi.ai/v1 e key_env RUNAPI_API_KEY. Nessun progetto Google Cloud, account di servizio o configurazione Vertex AI richiesti.

Quale versione di Gemini dovrei usare per i workflow agente?

Gemini 3.5 Flash (gemini-3.5-flash) è il più recente e veloce — ideale per loop agente in tempo reale e catene di chiamate agli strumenti. Gemini 2.5 Pro (gemini-2.5-pro) gestisce task con contesto lungo e ragionamento complesso. Le anteprime Gemini 3.x Pro offrono le più recenti capacità di ragionamento a costo maggiore.

Come funziona il pricing di Gemini su RunAPI?

Gemini è fatturato per token su RunAPI con prezzi pay-as-you-go. I token di input e output sono misurati separatamente. Nessun abbonamento mensile, nessuna spesa minima. Consulta la pagina dei prezzi di RunAPI per le tariffe aggiornate per milione di token.

Hermes Agent può passare tra Gemini e altri LLM durante la sessione?

Sì. Tutti gli LLM RunAPI condividono lo stesso provider custom:runapi e la stessa API key. Usa il comando /model o hermes model per passare tra gemini-3.5-flash, gpt-5.5, claude-opus-4.6, o qualsiasi altro modello RunAPI senza cambiare la configurazione del provider.

Gemini tramite RunAPI supporta function calling e tool use?

Sì. RunAPI passa i parametri tools e tool_choice OpenAI-compatibili a Gemini. Definisci gli strumenti nel corpo della richiesta e Gemini restituisce tool_calls nel messaggio dell'assistente. Hermes Agent li elabora allo stesso modo in cui gestisce le chiamate agli strumenti di GPT o Claude.

HERMES + GEMINI

Usa Gemini in Hermes Agent.

Google Gemini è disponibile tramite l'endpoint OpenAI-compatibile di RunAPI. Hermes Agent lo chiama usando il provider custom:runapi — Gemini 3.5 Flash per i loop agente sensibili alla velocità, 3.x Pro per il ragionamento in più passaggi, 2.5 Pro per i task di produzione con contesto lungo. Nessun progetto Google Cloud o credenziale Vertex AI richiesti — solo la stessa RUNAPI_API_KEY e base_url già configurate per la chat.

Ottieni API Key Leggi la documentazione API

una API key · endpoint chat OpenAI-compatibile · supporto streaming

Usa RunAPI per inviare una richiesta chat a Google Gemini 3.5 Flash tramite Hermes Agent.

Requisiti:
- Usa il provider custom:runapi già configurato in Hermes Agent
- Chiama l'endpoint chat completions di RunAPI su https://runapi.ai/v1/chat/completions
- Imposta model su "gemini-3.5-flash"
- La variabile d'ambiente RUNAPI_API_KEY fornisce l'autorizzazione
- La risposta è sincrona — la risposta arriva in choices[0].message.content
- Per lo streaming, imposta stream su true e gestisci i server-sent events

curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [
      {"role": "system", "content": "You are a concise technical assistant."},
      {"role": "user", "content": "Explain the difference between gRPC and REST in three sentences."}
    ],
    "temperature": 0.7,
    "max_tokens": 256
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gemini-3.5-flash",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 34,
    "completion_tokens": 71,
    "total_tokens": 105
  }
}

Copia il comando curl per testare gemini

COME FUNZIONA

Usa Gemini in Hermes Agent in tre passaggi

Configura RunAPI

Imposta la variabile d'ambiente RUNAPI_API_KEY. Se hai già aggiunto RunAPI come provider custom:runapi in Hermes Agent, la stessa key e base_url funzionano per Gemini — cambia solo l'ID del modello. Nessuna credenziale Google Cloud necessaria.

export RUNAPI_API_KEY=runapi_xxx

Chiama Gemini tramite chat completions

Invia una richiesta POST a /v1/chat/completions con model impostato su gemini-3.5-flash. Passa un array messages con i ruoli system e user. Hermes Agent invia la stessa struttura di richiesta OpenAI-compatibile che usa per GPT — RunAPI instrada su Gemini in base al parametro model.

POST /v1/chat/completions

Leggi la risposta

La risposta arriva in modo sincrono nel formato OpenAI chat completion. La risposta dell'assistente è in choices[0].message.content, con l'utilizzo dei token nell'oggetto usage. Per lo streaming, imposta stream su true e Hermes Agent analizza automaticamente gli eventi SSE delta.

choices[0].message.content

PARAMETRI

Parametri API chat completions Gemini

Parametro	Tipo	Descrizione
`model`	`string`	Obbligatorio. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview, o gemini-3.1-pro-preview.
`messages`	`array`	Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content.
`temperature`	`number`	Facoltativo. Temperatura di campionamento tra 0 e 2. Valori più bassi producono output più deterministico. Il valore predefinito varia per modello.
`max_tokens`	`integer`	Facoltativo. Numero massimo di token da generare nella risposta.
`stream`	`boolean`	Facoltativo. Quando true, la risposta viene inviata in streaming come server-sent events. Ogni evento contiene un delta con contenuto parziale.
`top_p`	`number`	Facoltativo. Soglia di nucleus sampling tra 0 e 1. Alternativa alla temperature per controllare la casualità dell'output.

Cos'è Gemini su Hermes Agent?

Google Gemini è disponibile tramite il provider custom:runapi di RunAPI senza credenziali Google Cloud. Hermes Agent lo chiama usando la stessa configurazione compatibile con OpenAI usata per GPT e Claude. Gemini 3.5 Flash è l'opzione più veloce per i loop di agente sensibili alla velocità, mentre Gemini 2.5 Pro offre una finestra di contesto da 1M token e la modalità di pensiero per task di ragionamento complesso multi-step.

Casi d'uso di Gemini

Chat vocale e video in tempo reale con Live API

Usare le capacità multimodali di Gemini per applicazioni in tempo reale che elaborano input audio e video insieme al testo, costruendo agenti interattivi capaci di vedere e sentire tramite i workflow di Hermes Agent.

Ancoraggio delle risposte con i dati di Google Search

Abilitare il grounding di Google Search sulle richieste di Gemini per ottenere risposte supportate da dati web attuali, utile per agenti che necessitano di informazioni aggiornate oltre la loro data di taglio dell'addestramento.

Catene di chiamate agli strumenti degli agenti economiche

Eseguire Gemini 3.5 Flash per loop di chiamate agli strumenti veloci ed economici dove l'agente deve effettuare molte chiamate sequenziali. La latenza del primo token inferiore a 100ms mantiene le catene degli agenti reattive senza superare il budget.

FAQ

Domande su Gemini + Hermes Agent

Configurazione generale di Hermes Agent

Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.

Guida di configurazione di Hermes Agent →

Catalogo modelli Gemini

Vedi tutte le varianti Gemini, i livelli di prezzo e la documentazione API.

Modelli Gemini →

Prova Gemini in Hermes Agent oggi.

Ottieni una API key RunAPI gratuita, imposta model su gemini-3.5-flash nel tuo provider custom:runapi e inizia a usare Gemini in Hermes Agent.

Sfoglia i modelli →