---
title: &quot;Usa Gemini en Hermes Agent con RunAPI — Guía de API LLM&quot;
url: &quot;https://runapi.ai/es/hermes-gemini.md&quot;
canonical: &quot;https://runapi.ai/es/hermes-gemini&quot;
locale: &quot;es&quot;
model: &quot;gemini&quot;
---

# Usa Gemini en Hermes Agent.

Google Gemini está disponible a través del endpoint compatible con OpenAI de RunAPI. Hermes Agent lo llama usando el proveedor custom:runapi — Gemini 3.5 Flash para bucles de agentes sensibles a la velocidad, 3.x Pro para razonamiento multipasos, 2.5 Pro para tareas de producción de contexto largo. No se requieren credenciales de proyecto de Google Cloud ni de Vertex AI — solo la misma RUNAPI_API_KEY y base_url que ya configuraste para chat.

## API example

```bash
curl -X POST https://runapi.ai/v1/chat/completions \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;gemini-3.5-flash&quot;,
    &quot;messages&quot;: [
      {&quot;role&quot;: &quot;system&quot;, &quot;content&quot;: &quot;You are a concise technical assistant.&quot;},
      {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: &quot;Explain the difference between gRPC and REST in three sentences.&quot;}
    ],
    &quot;temperature&quot;: 0.7,
    &quot;max_tokens&quot;: 256
  }&#39;

```

### Response

```json
{
  &quot;id&quot;: &quot;chatcmpl-abc123&quot;,
  &quot;object&quot;: &quot;chat.completion&quot;,
  &quot;model&quot;: &quot;gemini-3.5-flash&quot;,
  &quot;choices&quot;: [
    {
      &quot;index&quot;: 0,
      &quot;message&quot;: {
        &quot;role&quot;: &quot;assistant&quot;,
        &quot;content&quot;: &quot;gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers.&quot;
      },
      &quot;finish_reason&quot;: &quot;stop&quot;
    }
  ],
  &quot;usage&quot;: {
    &quot;prompt_tokens&quot;: 34,
    &quot;completion_tokens&quot;: 71,
    &quot;total_tokens&quot;: 105
  }
}

```

## How it works

1. **Configura RunAPI** — Establece la variable de entorno RUNAPI_API_KEY. Si ya añadiste RunAPI como proveedor custom:runapi en Hermes Agent, la misma clave y base_url funcionan para Gemini — cambia solo el ID del model. No se necesitan credenciales de Google Cloud.
2. **Llama a Gemini a través de chat completions** — Envía una solicitud POST a /v1/chat/completions con model establecido en gemini-3.5-flash. Pasa un array messages con roles de system y user. Hermes Agent envía la misma forma de solicitud compatible con OpenAI que usa para GPT — RunAPI enruta a Gemini según el parámetro model.
3. **Lee la respuesta** — La respuesta llega de forma síncrona en formato de chat completion de OpenAI. La respuesta del asistente está en choices[0].message.content, con el uso de tokens en el objeto usage. Para streaming, establece stream en true y Hermes Agent analiza los eventos delta de SSE automáticamente.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Obligatorio. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview o gemini-3.1-pro-preview. |
| `messages` | `array` | Obligatorio. Array de objetos de mensaje con campos role (system, user, assistant) y content. |
| `temperature` | `number` | Opcional. Temperatura de muestreo entre 0 y 2. Valores más bajos producen salidas más deterministas. El valor predeterminado varía por modelo. |
| `max_tokens` | `integer` | Opcional. Número máximo de tokens a generar en la respuesta. |
| `stream` | `boolean` | Opcional. Cuando es true, la respuesta se transmite en streaming como server-sent events. Cada evento contiene un delta con contenido parcial. |
| `top_p` | `number` | Opcional. Umbral de muestreo por núcleo entre 0 y 1. Alternativa a temperature para controlar la aleatoriedad de la salida. |

## FAQ

### ¿Puedo usar Google Gemini en Hermes Agent sin credenciales de Google Cloud?

Sí. RunAPI proporciona Gemini a través de su endpoint compatible con OpenAI. Configura RunAPI como proveedor custom:runapi con base_url https://runapi.ai/v1 y key_env RUNAPI_API_KEY. No se requiere proyecto de Google Cloud, cuenta de servicio ni configuración de Vertex AI.

### ¿Qué versión de Gemini debería usar para flujos de trabajo de agentes?

Gemini 3.5 Flash (gemini-3.5-flash) es el más nuevo y rápido — mejor para bucles de agentes en tiempo real y cadenas de llamadas a herramientas. Gemini 2.5 Pro (gemini-2.5-pro) gestiona tareas de contexto largo y razonamiento complejo. Las versiones preliminares de Gemini 3.x Pro ofrecen las capacidades de razonamiento más recientes a mayor coste.

### ¿Cómo funciona el precio de Gemini en RunAPI?

Gemini se factura por token en RunAPI con precios de pago por uso. Los tokens de entrada y salida se miden por separado. Sin suscripción mensual, sin gasto mínimo. Consulta la página de precios de RunAPI para las tarifas actuales por millón de tokens.

### ¿Puede Hermes Agent cambiar entre Gemini y otros LLMs a mitad de sesión?

Sí. Todos los LLM de RunAPI comparten el mismo proveedor custom:runapi y clave API. Usa el comando /model o hermes model para cambiar entre gemini-3.5-flash, gpt-5.5, claude-opus-4.6 o cualquier otro modelo de RunAPI sin cambiar la configuración del proveedor.

### ¿Gemini a través de RunAPI admite llamadas a funciones y uso de herramientas?

Sí. RunAPI pasa los parámetros tools y tool_choice compatibles con OpenAI a Gemini. Define herramientas en el cuerpo de la solicitud y Gemini devuelve tool_calls en el mensaje del asistente. Hermes Agent los procesa igual que las llamadas a herramientas de GPT o Claude.


## Links

- [Guía de configuración de Hermes Agent →](https://runapi.ai/es/hermes-agent)
- [Modelos de Gemini →](https://runapi.ai/es/models/gemini)
- [Model catalog](https://runapi.ai/es/models)
- [API docs](https://runapi.ai/es/docs)
