Kann ich Google Gemini in Hermes Agent ohne Google-Cloud-Zugangsdaten verwenden?

Ja. RunAPI stellt Gemini über seinen OpenAI-kompatiblen Endpunkt bereit. RunAPI als custom:runapi-Provider mit base_url https://runapi.ai/v1 und key_env RUNAPI_API_KEY konfigurieren. Kein Google-Cloud-Projekt, kein Service-Account und keine Vertex-AI-Einrichtung erforderlich.

Welche Gemini-Version sollte ich für Agent-Workflows verwenden?

Gemini 3.5 Flash (gemini-3.5-flash) ist das neueste und schnellste — am besten für Echtzeit-Agent-Schleifen und Tool-Calling-Ketten. Gemini 2.5 Pro (gemini-2.5-pro) verarbeitet Langkontext-Aufgaben und komplexes Reasoning. Gemini 3.x Pro Previews bieten die neuesten Reasoning-Fähigkeiten zu höheren Kosten.

Wie funktioniert die Gemini-Preisgestaltung auf RunAPI?

Gemini wird pro Token auf RunAPI mit Pay-as-you-go-Preisen abgerechnet. Input- und Output-Token werden separat gemessen. Kein monatliches Abonnement, kein Mindestausgabe. Aktuelle Preise pro Million Token auf der RunAPI-Preisseite.

Kann Hermes Agent zwischen Gemini und anderen LLMs mitten in einer Sitzung wechseln?

Ja. Alle RunAPI-LLMs teilen denselben custom:runapi-Provider und denselben API-Key. Den /model-Befehl oder hermes model verwenden, um zwischen gemini-3.5-flash, gpt-5.5, claude-opus-4.6 oder einem anderen RunAPI-Modell zu wechseln, ohne die Provider-Konfiguration zu ändern.

Unterstützt Gemini über RunAPI Function Calling und Tool Use?

Ja. RunAPI leitet die OpenAI-kompatiblen tools- und tool_choice-Parameter an Gemini weiter. Tools im Request-Body definieren und Gemini gibt tool_calls in der Assistent-Message zurück. Hermes Agent verarbeitet diese genauso wie Tool-Calls von GPT oder Claude.

HERMES + GEMINI

Gemini in Hermes Agent verwenden.

Google Gemini ist über RunAPIs OpenAI-kompatiblen Endpunkt verfügbar. Hermes Agent ruft es über den custom:runapi-Provider auf — Gemini 3.5 Flash für latenzempfindliche Agent-Schleifen, 3.x Pro für mehrstufiges Reasoning, 2.5 Pro für Langkontext-Produktionsaufgaben. Kein Google-Cloud-Projekt oder Vertex-AI-Zugangsdaten erforderlich — nur derselbe RUNAPI_API_KEY und dieselbe base_url, die bereits für Chat konfiguriert wurden.

API Key holen Dokumentation lesen

ein API-Key · OpenAI-kompatibler Chat-Endpunkt · Streaming-Unterstützung

RunAPI verwenden, um eine Chat-Anfrage an Google Gemini 3.5 Flash über Hermes Agent zu senden.


      Requirements:

      - Use the custom:runapi provider already configured in Hermes Agent

      - Call the RunAPI chat completions endpoint at https://runapi.ai/v1/chat/completions

      - Set model to "gemini-3.5-flash"

      - The RUNAPI_API_KEY environment variable provides authorization

      - The response is synchronous — the reply arrives in choices[0].message.content

      - For streaming, set stream to true and process server-sent events

curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [
      {"role": "system", "content": "You are a concise technical assistant."},
      {"role": "user", "content": "Explain the difference between gRPC and REST in three sentences."}
    ],
    "temperature": 0.7,
    "max_tokens": 256
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gemini-3.5-flash",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 34,
    "completion_tokens": 71,
    "total_tokens": 105
  }
}

Den curl-Befehl kopieren und testen gemini

SO FUNKTIONIERT ES

Gemini in Hermes Agent in drei Schritten verwenden

RunAPI konfigurieren

Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als custom:runapi-Provider in Hermes Agent hinzugefügt wurde, funktionieren derselbe Key und dieselbe base_url für Gemini — nur die Modell-ID ändern. Keine Google-Cloud-Zugangsdaten nötig.

export RUNAPI_API_KEY=runapi_xxx

Gemini über Chat-Completions aufrufen

Einen POST-Request an /v1/chat/completions mit model gemini-3.5-flash senden. Ein messages-Array mit system- und user-Rollen übergeben. Hermes Agent sendet dieselbe OpenAI-kompatible Anfrage, die es für GPT verwendet — RunAPI leitet basierend auf dem model-Parameter an Gemini weiter.

POST /v1/chat/completions

Antwort auslesen

Die Antwort kommt synchron im OpenAI-Chat-Completion-Format. Die Assistent-Antwort ist in choices[0].message.content, mit Token-Usage im usage-Objekt. Für Streaming stream auf true setzen und Hermes Agent parst die SSE-Delta-Events automatisch.

choices[0].message.content

PARAMETER

Gemini Chat-Completions-API-Parameter

Parameter	Typ	Beschreibung
`model`	`string`	Erforderlich. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview oder gemini-3.1-pro-preview.
`messages`	`array`	Erforderlich. Array von Message-Objekten mit role (system, user, assistant) und content-Feldern.
`temperature`	`number`	Optional. Sampling-Temperatur zwischen 0 und 2. Niedrigere Werte liefern deterministischeren Output. Standard variiert je nach Modell.
`max_tokens`	`integer`	Optional. Maximale Anzahl zu generierender Token in der Antwort.
`stream`	`boolean`	Optional. Wenn true, streamt die Antwort als Server-Sent Events. Jedes Event enthält ein Delta mit partiellem Inhalt.
`top_p`	`number`	Optional. Nucleus-Sampling-Schwellenwert zwischen 0 und 1. Alternative zu temperature zur Steuerung der Output-Zufälligkeit.

Was ist Gemini mit Hermes Agent?

Google Gemini ist über RunAPIs custom:runapi-Provider ohne Google-Cloud-Anmeldedaten verfügbar. Hermes Agent ruft es über dieselbe OpenAI-kompatible Konfiguration auf, die für GPT und Claude verwendet wird. Gemini 3.5 Flash ist die schnellste Option für geschwindigkeitssensible Agent-Schleifen, während Gemini 2.5 Pro ein 1M-Token-Kontextfenster und Denkmodus für komplexe mehrstufige Reasoning-Aufgaben bietet.

Gemini Anwendungsfälle

Echtzeit-Voice-und-Video-Chat mit Live-API

Geminis multimodale Fähigkeiten für Echtzeit-Anwendungen nutzen, die Audio- und Video-Eingaben zusammen mit Text verarbeiten, und interaktive Agenten aufbauen, die über Hermes-Agent-Workflows sehen und hören können.

Antworten mit Google-Search-Daten verankern

Google-Search-Grounding für Gemini-Anfragen aktivieren, um Antworten zu erhalten, die durch aktuelle Webdaten gestützt werden – nützlich für Agenten, die aktuelle Informationen jenseits ihres Trainings-Cutoffs benötigen.

Kosteneffiziente Agent-Tool-Calling-Ketten

Gemini 3.5 Flash für schnelle, günstige Tool-Calling-Schleifen ausführen, bei denen der Agent viele sequentielle Aufrufe machen muss. Subsekunden-First-Token-Latenz hält Agent-Ketten reaktionsfähig ohne das Budget zu sprengen.

FAQ

Gemini + Hermes Agent — Fragen

Hermes Agent Grundeinrichtung

Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.

Hermes Agent Einrichtungsanleitung →

Gemini Modellkatalog

Alle Gemini-Varianten, Preisstufen und API-Dokumentation ansehen.

Gemini models →

Gemini in Hermes Agent noch heute ausprobieren.

Einen kostenlosen RunAPI-Key holen, model im custom:runapi-Provider auf gemini-3.5-flash setzen und Gemini in Hermes Agent verwenden.

Modelle durchsuchen →