---
title: &quot;Użyj Gemini w Hermes Agent przez RunAPI — Przewodnik API LLM&quot;
url: &quot;https://runapi.ai/pl/hermes-gemini.md&quot;
canonical: &quot;https://runapi.ai/pl/hermes-gemini&quot;
locale: &quot;pl&quot;
model: &quot;gemini&quot;
---

# Używaj Gemini w Hermes Agent.

Google Gemini jest dostępny przez endpoint kompatybilny z OpenAI od RunAPI. Hermes Agent wywołuje go za pomocą dostawcy custom:runapi — Gemini 3.5 Flash do pętli agenta wrażliwych na czas, 3.x Pro do wieloetapowego rozumowania, 2.5 Pro do produkcyjnych zadań z długim kontekstem. Nie są wymagane projekt Google Cloud ani dane uwierzytelniające Vertex AI — wystarczy ten sam klucz RUNAPI_API_KEY i base_url, który skonfigurowałeś już dla czatu.

## API example

```bash
curl -X POST https://runapi.ai/v1/chat/completions \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;gemini-3.5-flash&quot;,
    &quot;messages&quot;: [
      {&quot;role&quot;: &quot;system&quot;, &quot;content&quot;: &quot;You are a concise technical assistant.&quot;},
      {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: &quot;Explain the difference between gRPC and REST in three sentences.&quot;}
    ],
    &quot;temperature&quot;: 0.7,
    &quot;max_tokens&quot;: 256
  }&#39;

```

### Response

```json
{
  &quot;id&quot;: &quot;chatcmpl-abc123&quot;,
  &quot;object&quot;: &quot;chat.completion&quot;,
  &quot;model&quot;: &quot;gemini-3.5-flash&quot;,
  &quot;choices&quot;: [
    {
      &quot;index&quot;: 0,
      &quot;message&quot;: {
        &quot;role&quot;: &quot;assistant&quot;,
        &quot;content&quot;: &quot;gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers.&quot;
      },
      &quot;finish_reason&quot;: &quot;stop&quot;
    }
  ],
  &quot;usage&quot;: {
    &quot;prompt_tokens&quot;: 34,
    &quot;completion_tokens&quot;: 71,
    &quot;total_tokens&quot;: 105
  }
}

```

## How it works

1. **Skonfiguruj RunAPI** — Ustaw zmienną środowiskową RUNAPI_API_KEY. Jeśli dodałeś już RunAPI jako dostawcę custom:runapi w Hermes Agent, ten sam klucz i base_url działają dla Gemini — zmień tylko identyfikator modelu. Nie są potrzebne dane uwierzytelniające Google Cloud.
2. **Wywołaj Gemini przez chat completions** — Wyślij żądanie POST na adres /v1/chat/completions z modelem ustawionym na gemini-3.5-flash. Przekaż tablicę messages z rolami system i user. Hermes Agent wysyła ten sam kształt żądania kompatybilny z OpenAI, którego używa dla GPT — RunAPI kieruje do Gemini na podstawie parametru model.
3. **Odczytaj odpowiedź** — Odpowiedź przychodzi synchronicznie w formacie chat completion OpenAI. Odpowiedź asystenta znajduje się w choices[0].message.content, a użycie tokenów w obiekcie usage. W trybie strumieniowania ustaw stream na true, a Hermes Agent automatycznie analizuje zdarzenia delta SSE.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Wymagane. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview lub gemini-3.1-pro-preview. |
| `messages` | `array` | Wymagane. Tablica obiektów wiadomości z polami role (system, user, assistant) i content. |
| `temperature` | `number` | Opcjonalne. Temperatura próbkowania od 0 do 2. Niższe wartości dają bardziej deterministyczne wyniki. Wartość domyślna zależy od modelu. |
| `max_tokens` | `integer` | Opcjonalne. Maksymalna liczba tokenów do wygenerowania w odpowiedzi. |
| `stream` | `boolean` | Opcjonalne. Gdy ustawione na true, odpowiedź jest przesyłana strumieniowo jako zdarzenia server-sent. Każde zdarzenie zawiera deltę z częściową treścią. |
| `top_p` | `number` | Opcjonalne. Próg próbkowania nucleus od 0 do 1. Alternatywa dla temperature do kontrolowania losowości wyników. |

## FAQ

### Czy mogę używać Google Gemini w Hermes Agent bez danych uwierzytelniających Google Cloud?

Tak. RunAPI udostępnia Gemini przez endpoint kompatybilny z OpenAI. Skonfiguruj RunAPI jako dostawcę custom:runapi z base_url https://runapi.ai/v1 i key_env RUNAPI_API_KEY. Nie jest wymagany projekt Google Cloud, konto usługi ani konfiguracja Vertex AI.

### Której wersji Gemini powinienem używać do przepływów pracy agenta?

Gemini 3.5 Flash (gemini-3.5-flash) jest najnowszy i najszybszy — najlepszy do pętli agenta w czasie rzeczywistym i łańcuchów wywołań narzędzi. Gemini 2.5 Pro (gemini-2.5-pro) obsługuje zadania z długim kontekstem i złożone rozumowanie. Podglądy Gemini 3.x Pro oferują najnowsze możliwości rozumowania przy wyższym koszcie.

### Jak działa cennik Gemini w RunAPI?

Gemini jest rozliczany za token w RunAPI zgodnie z cennikiem płatności za użycie. Tokeny wejściowe i wyjściowe są naliczane osobno. Bez miesięcznej subskrypcji, bez minimalnych wydatków. Sprawdź stronę cenową RunAPI, aby poznać aktualne stawki za milion tokenów.

### Czy Hermes Agent może przełączać się między Gemini a innymi modelami LLM w trakcie sesji?

Tak. Wszystkie modele LLM RunAPI współdzielą tego samego dostawcę custom:runapi i klucz API. Użyj polecenia /model lub hermes model, aby przełączać się między gemini-3.5-flash, gpt-5.5, claude-opus-4.6 lub innym modelem RunAPI bez zmiany konfiguracji dostawcy.

### Czy Gemini przez RunAPI obsługuje wywołania funkcji i użycie narzędzi?

Tak. RunAPI przekazuje parametry tools i tool_choice kompatybilne z OpenAI do Gemini. Zdefiniuj narzędzia w treści żądania, a Gemini zwróci tool_calls w wiadomości asystenta. Hermes Agent przetwarza je tak samo jak wywołania narzędzi z GPT lub Claude.


## Links

- [Przewodnik konfiguracji Hermes Agent →](https://runapi.ai/pl/hermes-agent)
- [Modele Gemini →](https://runapi.ai/pl/models/gemini)
- [Model catalog](https://runapi.ai/pl/models)
- [API docs](https://runapi.ai/pl/docs)