OPENCLAW + GEMINI

Gemini in OpenClaw verwenden.

Google Gemini ist über RunAPIs OpenAI-kompatiblen Endpunkt verfügbar — Gemini 3.5 Flash für Sub-100ms-First-Token-Latenz, 3.x Pro für komplexes Reasoning und 2.5 Pro für Produktions-Workloads. OpenClaw behandelt es wie ein anderes OpenAI-kompatibles Modell, sodass dieselbe Provider-Konfiguration und derselbe RUNAPI_API_KEY, der GPT antreibt, auch Gemini aufruft. Kein Google-Cloud-Projekt, kein Service-Account, keine Vertex-AI-Einrichtung.

ein API-Key · OpenAI-kompatibler Chat-Endpunkt · Streaming-Unterstützung
RunAPI verwenden, um eine Chat-Anfrage an Google Gemini 3.5 Flash zu senden.


      Requirements:

      - Use the RunAPI OpenAI-compatible endpoint at https://runapi.ai/v1/chat/completions

      - Set model to "gemini-3.5-flash"

      - Use the RUNAPI_API_KEY environment variable for authorization

      - The response is synchronous — the reply arrives in choices[0].message.content

      - For streaming, set stream to true and process server-sent events

      
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [
      {"role": "system", "content": "You are a concise technical assistant."},
      {"role": "user", "content": "Explain the difference between gRPC and REST in three sentences."}
    ],
    "temperature": 0.7,
    "max_tokens": 256
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gemini-3.5-flash",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 34,
    "completion_tokens": 71,
    "total_tokens": 105
  }
}
Den curl-Befehl kopieren und testen gemini
SO FUNKTIONIERT ES

Gemini in OpenClaw in drei Schritten verwenden

1

RunAPI konfigurieren

Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als OpenClaw-Provider konfiguriert wurde, funktionieren derselbe Key und dieselbe baseUrl für Gemini — einfach die Modell-ID ändern. Keine Google-Cloud-Zugangsdaten nötig.

export RUNAPI_API_KEY=runapi_xxx
2

Gemini über Chat-Completions aufrufen

Einen POST-Request an /v1/chat/completions mit model gemini-3.5-flash senden. Ein messages-Array mit system- und user-Rollen übergeben. Der Endpunkt akzeptiert dieselbe OpenAI-kompatible Form, die der Agent bereits für GPT-Modelle verwendet.

POST /v1/chat/completions
3

Antwort auslesen

Die Antwort kommt synchron im OpenAI-Chat-Completion-Format. Die Assistent-Antwort ist in choices[0].message.content, mit Token-Usage im usage-Objekt. Für Streaming stream auf true setzen und SSE-Events parsen.

choices[0].message.content
PARAMETER

Gemini Chat-Completions-API-Parameter

Parameter Typ Beschreibung
model string Erforderlich. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview oder gemini-3.1-pro-preview.
messages array Erforderlich. Array von Message-Objekten mit role (system, user, assistant) und content-Feldern.
temperature number Optional. Sampling-Temperatur zwischen 0 und 2. Niedrigere Werte liefern deterministischeren Output. Standard variiert je nach Modell.
max_tokens integer Optional. Maximale Anzahl zu generierender Token in der Antwort.
stream boolean Optional. Wenn true, streamt die Antwort als Server-Sent Events. Jedes Event enthält ein Delta mit partiellem Inhalt.
top_p number Optional. Nucleus-Sampling-Schwellenwert zwischen 0 und 1. Alternative zu temperature zur Steuerung der Output-Zufälligkeit.

Was ist Gemini auf OpenClaw?

Google Gemini ist über RunAPI ohne Google-Cloud-Projekt, Service-Account oder Vertex-AI-Einrichtung verfügbar. OpenClaw behandelt es als weiteres OpenAI-kompatibles Modell – dieselbe Provider-Konfiguration und RUNAPI_API_KEY. Gemini 3.5 Flash bietet Subsekunden-First-Token-Latenz für Echtzeit-Agent-Schleifen, während Gemini 2.5 Pro Long-Context-Aufgaben mit seinem 1M-Token-Kontextfenster und Denkmodus für komplexes Reasoning verarbeitet.

Gemini Anwendungsfälle

Multimodale Anwendungen mit Text, Bild, Audio und Video

Bilder, PDFs, Audiodateien oder Videoframes zusammen mit Textprompts für Gemini senden, um zu analysieren, zu beschreiben oder strukturierte Daten zu extrahieren. Gemini verarbeitet alle Eingabetypen nativ über einen API-Aufruf.

Lange Dokumentenanalyse mit 1M-Token-Kontext

Gesamte Codebasen, Rechtsdokumentensätze oder Forschungsarbeitssammlungen in Gemini 2.5 Pros 1M-Token-Kontextfenster für Analyse und Zusammenfassung ohne Chunking oder Retrieval-Pipelines einspeisen.

Echtzeit-Agent-Schleifen mit Flash

Gemini 3.5 Flash für geschwindigkeitssensible Agent-Tool-Calling-Ketten verwenden, bei denen Subsekunden-First-Token-Latenz wichtiger ist als Spitzen-Reasoning-Qualität. Kosten pro Million Tokens gehören zu den niedrigsten verfügbaren.

FAQ

Gemini + OpenClaw — Fragen

OpenClaw Grundeinrichtung

Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für OpenClaw starten.

OpenClaw Einrichtungsanleitung →

Gemini Modellkatalog

Alle Gemini-Varianten, Preisstufen und API-Dokumentation ansehen.

Gemini models →

Gemini in OpenClaw noch heute ausprobieren.

Einen kostenlosen RunAPI-Key holen, das Modell im OpenClaw-Provider auf gemini-3.5-flash setzen und mit Gemini chatten.