Usa Gemini in Hermes Agent.
Google Gemini è disponibile tramite l'endpoint OpenAI-compatibile di RunAPI. Hermes Agent lo chiama usando il provider custom:runapi — Gemini 3.5 Flash per i loop agente sensibili alla velocità, 3.x Pro per il ragionamento in più passaggi, 2.5 Pro per i task di produzione con contesto lungo. Nessun progetto Google Cloud o credenziale Vertex AI richiesti — solo la stessa RUNAPI_API_KEY e base_url già configurate per la chat.
Usa RunAPI per inviare una richiesta chat a Google Gemini 3.5 Flash tramite Hermes Agent.
Requisiti:
- Usa il provider custom:runapi già configurato in Hermes Agent
- Chiama l'endpoint chat completions di RunAPI su https://runapi.ai/v1/chat/completions
- Imposta model su "gemini-3.5-flash"
- La variabile d'ambiente RUNAPI_API_KEY fornisce l'autorizzazione
- La risposta è sincrona — la risposta arriva in choices[0].message.content
- Per lo streaming, imposta stream su true e gestisci i server-sent events
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-flash",
"messages": [
{"role": "system", "content": "You are a concise technical assistant."},
{"role": "user", "content": "Explain the difference between gRPC and REST in three sentences."}
],
"temperature": 0.7,
"max_tokens": 256
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "gemini-3.5-flash",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 34,
"completion_tokens": 71,
"total_tokens": 105
}
}
Usa Gemini in Hermes Agent in tre passaggi
Configura RunAPI
Imposta la variabile d'ambiente RUNAPI_API_KEY. Se hai già aggiunto RunAPI come provider custom:runapi in Hermes Agent, la stessa key e base_url funzionano per Gemini — cambia solo l'ID del modello. Nessuna credenziale Google Cloud necessaria.
export RUNAPI_API_KEY=runapi_xxx
Chiama Gemini tramite chat completions
Invia una richiesta POST a /v1/chat/completions con model impostato su gemini-3.5-flash. Passa un array messages con i ruoli system e user. Hermes Agent invia la stessa struttura di richiesta OpenAI-compatibile che usa per GPT — RunAPI instrada su Gemini in base al parametro model.
POST /v1/chat/completions
Leggi la risposta
La risposta arriva in modo sincrono nel formato OpenAI chat completion. La risposta dell'assistente è in choices[0].message.content, con l'utilizzo dei token nell'oggetto usage. Per lo streaming, imposta stream su true e Hermes Agent analizza automaticamente gli eventi SSE delta.
choices[0].message.content
Parametri API chat completions Gemini
| Parametro | Tipo | Descrizione |
|---|---|---|
model |
string |
Obbligatorio. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview, o gemini-3.1-pro-preview. |
messages |
array |
Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content. |
temperature |
number |
Facoltativo. Temperatura di campionamento tra 0 e 2. Valori più bassi producono output più deterministico. Il valore predefinito varia per modello. |
max_tokens |
integer |
Facoltativo. Numero massimo di token da generare nella risposta. |
stream |
boolean |
Facoltativo. Quando true, la risposta viene inviata in streaming come server-sent events. Ogni evento contiene un delta con contenuto parziale. |
top_p |
number |
Facoltativo. Soglia di nucleus sampling tra 0 e 1. Alternativa alla temperature per controllare la casualità dell'output. |
Cos'è Gemini su Hermes Agent?
Google Gemini è disponibile tramite il provider custom:runapi di RunAPI senza credenziali Google Cloud. Hermes Agent lo chiama usando la stessa configurazione compatibile con OpenAI usata per GPT e Claude. Gemini 3.5 Flash è l'opzione più veloce per i loop di agente sensibili alla velocità, mentre Gemini 2.5 Pro offre una finestra di contesto da 1M token e la modalità di pensiero per task di ragionamento complesso multi-step.
Casi d'uso di Gemini
Chat vocale e video in tempo reale con Live API
Usare le capacità multimodali di Gemini per applicazioni in tempo reale che elaborano input audio e video insieme al testo, costruendo agenti interattivi capaci di vedere e sentire tramite i workflow di Hermes Agent.
Ancoraggio delle risposte con i dati di Google Search
Abilitare il grounding di Google Search sulle richieste di Gemini per ottenere risposte supportate da dati web attuali, utile per agenti che necessitano di informazioni aggiornate oltre la loro data di taglio dell'addestramento.
Catene di chiamate agli strumenti degli agenti economiche
Eseguire Gemini 3.5 Flash per loop di chiamate agli strumenti veloci ed economici dove l'agente deve effettuare molte chiamate sequenziali. La latenza del primo token inferiore a 100ms mantiene le catene degli agenti reattive senza superare il budget.
Domande su Gemini + Hermes Agent
Sì. RunAPI fornisce Gemini tramite il suo endpoint OpenAI-compatibile. Configura RunAPI come provider custom:runapi con base_url https://runapi.ai/v1 e key_env RUNAPI_API_KEY. Nessun progetto Google Cloud, account di servizio o configurazione Vertex AI richiesti.
Gemini 3.5 Flash (gemini-3.5-flash) è il più recente e veloce — ideale per loop agente in tempo reale e catene di chiamate agli strumenti. Gemini 2.5 Pro (gemini-2.5-pro) gestisce task con contesto lungo e ragionamento complesso. Le anteprime Gemini 3.x Pro offrono le più recenti capacità di ragionamento a costo maggiore.
Gemini è fatturato per token su RunAPI con prezzi pay-as-you-go. I token di input e output sono misurati separatamente. Nessun abbonamento mensile, nessuna spesa minima. Consulta la pagina dei prezzi di RunAPI per le tariffe aggiornate per milione di token.
Sì. Tutti gli LLM RunAPI condividono lo stesso provider custom:runapi e la stessa API key. Usa il comando /model o hermes model per passare tra gemini-3.5-flash, gpt-5.5, claude-opus-4.6, o qualsiasi altro modello RunAPI senza cambiare la configurazione del provider.
Sì. RunAPI passa i parametri tools e tool_choice OpenAI-compatibili a Gemini. Definisci gli strumenti nel corpo della richiesta e Gemini restituisce tool_calls nel messaggio dell'assistente. Hermes Agent li elabora allo stesso modo in cui gestisce le chiamate agli strumenti di GPT o Claude.
Configurazione generale di Hermes Agent
Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.
Guida di configurazione di Hermes Agent →Catalogo modelli Gemini
Vedi tutte le varianti Gemini, i livelli di prezzo e la documentazione API.
Modelli Gemini →Prova Gemini in Hermes Agent oggi.
Ottieni una API key RunAPI gratuita, imposta model su gemini-3.5-flash nel tuo provider custom:runapi e inizia a usare Gemini in Hermes Agent.