---
title: &quot;Gebruik Gemini in Hermes Agent via RunAPI — LLM API-gids&quot;
url: &quot;https://runapi.ai/nl/hermes-gemini.md&quot;
canonical: &quot;https://runapi.ai/nl/hermes-gemini&quot;
locale: &quot;nl&quot;
model: &quot;gemini&quot;
---

# Gebruik Gemini in Hermes Agent.

Google Gemini is beschikbaar via het OpenAI-compatibele endpoint van RunAPI. Hermes Agent roept het aan via de custom:runapi-provider — Gemini 3.5 Flash voor snelheidsgevoelige agent-lussen, 3.x Pro voor meerstapsredeneren, 2.5 Pro voor productietaken met lange context. Geen Google Cloud-project of Vertex AI-credentials vereist — gewoon dezelfde RUNAPI_API_KEY en base_url die je al voor chat hebt geconfigureerd.

## API example

```bash
curl -X POST https://runapi.ai/v1/chat/completions \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;gemini-3.5-flash&quot;,
    &quot;messages&quot;: [
      {&quot;role&quot;: &quot;system&quot;, &quot;content&quot;: &quot;You are a concise technical assistant.&quot;},
      {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: &quot;Explain the difference between gRPC and REST in three sentences.&quot;}
    ],
    &quot;temperature&quot;: 0.7,
    &quot;max_tokens&quot;: 256
  }&#39;

```

### Response

```json
{
  &quot;id&quot;: &quot;chatcmpl-abc123&quot;,
  &quot;object&quot;: &quot;chat.completion&quot;,
  &quot;model&quot;: &quot;gemini-3.5-flash&quot;,
  &quot;choices&quot;: [
    {
      &quot;index&quot;: 0,
      &quot;message&quot;: {
        &quot;role&quot;: &quot;assistant&quot;,
        &quot;content&quot;: &quot;gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers.&quot;
      },
      &quot;finish_reason&quot;: &quot;stop&quot;
    }
  ],
  &quot;usage&quot;: {
    &quot;prompt_tokens&quot;: 34,
    &quot;completion_tokens&quot;: 71,
    &quot;total_tokens&quot;: 105
  }
}

```

## How it works

1. **Configureer RunAPI** — Stel de omgevingsvariabele RUNAPI_API_KEY in. Als je RunAPI al als custom:runapi-provider in Hermes Agent hebt toegevoegd, werken dezelfde sleutel en base_url voor Gemini — wijzig alleen het model-ID. Geen Google Cloud-credentials nodig.
2. **Roep Gemini aan via chat completions** — Stuur een POST-verzoek naar /v1/chat/completions met model ingesteld op gemini-3.5-flash. Geef een messages-array mee met system- en user-rollen. Hermes Agent stuurt hetzelfde OpenAI-compatibele verzoekformaat dat het voor GPT gebruikt — RunAPI routeert naar Gemini op basis van de modelparameter.
3. **Lees de reactie** — De reactie komt synchroon aan in OpenAI chat completion-formaat. Het assistentantwoord staat in choices[0].message.content, met tokengebruik in het usage-object. Voor streaming stel je stream in op true en Hermes Agent parseert de SSE-delta-events automatisch.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Verplicht. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview of gemini-3.1-pro-preview. |
| `messages` | `array` | Verplicht. Array van berichtobjecten met role (system, user, assistant) en content-velden. |
| `temperature` | `number` | Optioneel. Samplingtemperatuur tussen 0 en 2. Lagere waarden produceren meer deterministisch resultaat. Standaard verschilt per model. |
| `max_tokens` | `integer` | Optioneel. Maximum aantal te genereren tokens in de reactie. |
| `stream` | `boolean` | Optioneel. Bij true wordt de reactie gestreamd als server-sent events. Elk event bevat een delta met gedeeltelijke inhoud. |
| `top_p` | `number` | Optioneel. Nucleus-samplingdrempel tussen 0 en 1. Alternatief voor temperature om de willekeur van uitvoer te regelen. |

## FAQ

### Kan ik Google Gemini gebruiken in Hermes Agent zonder Google Cloud-credentials?

Ja. RunAPI biedt Gemini via het OpenAI-compatibele endpoint. Configureer RunAPI als custom:runapi-provider met base_url https://runapi.ai/v1 en key_env RUNAPI_API_KEY. Geen Google Cloud-project, serviceaccount of Vertex AI-configuratie vereist.

### Welke Gemini-versie moet ik gebruiken voor agent-workflows?

Gemini 3.5 Flash (gemini-3.5-flash) is de nieuwste en snelste — het beste voor realtime agent-lussen en tool-calling-ketens. Gemini 2.5 Pro (gemini-2.5-pro) verwerkt lange-contexttaken en complex redeneren. Gemini 3.x Pro-previews bieden de nieuwste redeneermogelijkheden tegen hogere kosten.

### Hoe werkt Gemini-facturering op RunAPI?

Gemini wordt per token gefactureerd op RunAPI met pay-as-you-go-prijzen. Invoer- en uitvoertokens worden apart gemeten. Geen maandelijks abonnement, geen minimale uitgave. Controleer de RunAPI-prijspagina voor actuele tarieven per miljoen tokens.

### Kan Hermes Agent mid-sessie wisselen tussen Gemini en andere LLM&#39;s?

Ja. Alle RunAPI-LLM&#39;s delen dezelfde custom:runapi-provider en API-sleutel. Gebruik het /model-commando of hermes model om te wisselen tussen gemini-3.5-flash, gpt-5.5, claude-opus-4.6 of elk ander RunAPI-model zonder de providerconfiguratie te wijzigen.

### Ondersteunt Gemini via RunAPI functieaanroepen en tool-gebruik?

Ja. RunAPI stuurt de OpenAI-compatibele tools- en tool_choice-parameters door naar Gemini. Definieer tools in de request-body en Gemini retourneert tool_calls in het assistentbericht. Hermes Agent verwerkt deze op dezelfde manier als tool-calls van GPT of Claude.


## Links

- [Hermes Agent-configuratiegids →](https://runapi.ai/nl/hermes-agent)
- [Gemini-modellen →](https://runapi.ai/nl/models/gemini)
- [Model catalog](https://runapi.ai/nl/models)
- [API docs](https://runapi.ai/nl/docs)