HERMES + GEMINI

Usa Gemini en Hermes Agent.

Google Gemini está disponible a través del endpoint compatible con OpenAI de RunAPI. Hermes Agent lo llama usando el proveedor custom:runapi — Gemini 3.5 Flash para bucles de agentes sensibles a la velocidad, 3.x Pro para razonamiento multipasos, 2.5 Pro para tareas de producción de contexto largo. No se requieren credenciales de proyecto de Google Cloud ni de Vertex AI — solo la misma RUNAPI_API_KEY y base_url que ya configuraste para chat.

una clave API · endpoint de chat compatible con OpenAI · compatibilidad con streaming
Usa RunAPI para enviar una solicitud de chat a Google Gemini 3.5 Flash a través de Hermes Agent.


      Requisitos:

      - Usa el proveedor custom:runapi ya configurado en Hermes Agent

      - Llama al endpoint de chat completions de RunAPI en https://runapi.ai/v1/chat/completions

      - Establece model en "gemini-3.5-flash"

      - La variable de entorno RUNAPI_API_KEY proporciona la autorización

      - La respuesta es síncrona — la respuesta llega en choices[0].message.content

      - Para streaming, establece stream en true y procesa server-sent events

      
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [
      {"role": "system", "content": "You are a concise technical assistant."},
      {"role": "user", "content": "Explain the difference between gRPC and REST in three sentences."}
    ],
    "temperature": 0.7,
    "max_tokens": 256
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gemini-3.5-flash",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 34,
    "completion_tokens": 71,
    "total_tokens": 105
  }
}
Copia el comando curl para probarlo gemini
CÓMO FUNCIONA

Usa Gemini en Hermes Agent en tres pasos

1

Configura RunAPI

Establece la variable de entorno RUNAPI_API_KEY. Si ya añadiste RunAPI como proveedor custom:runapi en Hermes Agent, la misma clave y base_url funcionan para Gemini — cambia solo el ID del model. No se necesitan credenciales de Google Cloud.

export RUNAPI_API_KEY=runapi_xxx
2

Llama a Gemini a través de chat completions

Envía una solicitud POST a /v1/chat/completions con model establecido en gemini-3.5-flash. Pasa un array messages con roles de system y user. Hermes Agent envía la misma forma de solicitud compatible con OpenAI que usa para GPT — RunAPI enruta a Gemini según el parámetro model.

POST /v1/chat/completions
3

Lee la respuesta

La respuesta llega de forma síncrona en formato de chat completion de OpenAI. La respuesta del asistente está en choices[0].message.content, con el uso de tokens en el objeto usage. Para streaming, establece stream en true y Hermes Agent analiza los eventos delta de SSE automáticamente.

choices[0].message.content
PARÁMETROS

Parámetros de la API de chat completions de Gemini

Parâmetro Tipo Descrição
model string Obligatorio. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview o gemini-3.1-pro-preview.
messages array Obligatorio. Array de objetos de mensaje con campos role (system, user, assistant) y content.
temperature number Opcional. Temperatura de muestreo entre 0 y 2. Valores más bajos producen salidas más deterministas. El valor predeterminado varía por modelo.
max_tokens integer Opcional. Número máximo de tokens a generar en la respuesta.
stream boolean Opcional. Cuando es true, la respuesta se transmite en streaming como server-sent events. Cada evento contiene un delta con contenido parcial.
top_p number Opcional. Umbral de muestreo por núcleo entre 0 y 1. Alternativa a temperature para controlar la aleatoriedad de la salida.

O que é Gemini no Hermes Agent?

Google Gemini está disponível via provider custom:runapi do RunAPI sem nenhuma configuração do Google Cloud. Hermes Agent o chama ao lado de Claude, GPT e DeepSeek na mesma configuração de workflow.

Casos de uso do Gemini

Chat de voz e vídeo em tempo real com Live API

Use as capacidades multimodais do Gemini para aplicações em tempo real com entrada de voz ou vídeo.

Fundamentando respostas com dados do Google Search

Ative o grounding do Google Search em requisições do Gemini para obter respostas que incluem dados atuais da web.

Cadeias de chamada de ferramentas de agente eficientes em custo

Execute Gemini 3.5 Flash para loops de chamada de ferramentas rápidos e baratos em workflows complexos.

FAQ

Preguntas sobre Gemini + Hermes Agent

Configuración general de Hermes Agent

¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.

Guía de configuración de Hermes Agent →

Catálogo de modelos Gemini

Ver todas las variantes de Gemini, precios y documentación de la API.

Modelos de Gemini →

Prueba Gemini en Hermes Agent hoy.

Obtén una clave RunAPI gratuita, establece model en gemini-3.5-flash en tu proveedor custom:runapi y empieza a usar Gemini en Hermes Agent.