Google Cloud 프로젝트 없이 OpenClaw에서 Google Gemini를 사용할 수 있나요?

네. RunAPI는 OpenAI 호환 엔드포인트를 통해 Gemini 접근을 제공합니다. RUNAPI_API_KEY만 있으면 됩니다 — Google Cloud 프로젝트, 서비스 계정 JSON, Vertex AI 청구 설정이 필요 없습니다.

RunAPI를 통해 어떤 Gemini 모델을 사용할 수 있나요?

RunAPI는 Gemini 3.5 Flash(최신, 가장 빠름), Gemini 2.5 Flash, Gemini 2.5 Pro, Gemini 3 Flash Preview, Gemini 3 Pro Preview, Gemini 3.1 Pro Preview를 제공합니다. 버전 슬러그를 model 파라미터로 전달하세요 — 예: gemini-3.5-flash 또는 gemini-2.5-pro.

RunAPI에서 Gemini 가격은 어떻게 책정되나요?

Gemini는 RunAPI에서 종량제 방식으로 토큰당 청구됩니다. 입력 및 출력 토큰은 별도로 계산됩니다. 월정액 구독이나 최소 지출이 없습니다. 현재 백만 토큰당 요금은 RunAPI 가격 페이지를 확인하세요.

동일한 OpenClaw 세션에서 Gemini와 GPT를 전환할 수 있나요?

네. 두 모델 모두 동일한 RunAPI 프로바이더 설정과 API key를 사용합니다. 프로바이더를 재설정하지 않고 model 파라미터를 gemini-3.5-flash에서 gpt-5.5(또는 다른 RunAPI 모델)로 변경하면 됩니다. OpenClaw는 요청별로 모델을 선택합니다.

RunAPI를 통한 Gemini가 스트리밍 응답을 지원하나요?

네. 요청 본문에서 stream을 true로 설정하세요. RunAPI는 Gemini 응답을 OpenAI 호환 delta 형식의 server-sent events로 스트리밍하므로, OpenClaw는 GPT 스트리밍을 처리하는 것과 동일한 방식으로 처리합니다.

OPENCLAW + GEMINI

OpenClaw에서 Gemini를 사용하세요.

Google Gemini는 RunAPI의 OpenAI 호환 엔드포인트를 통해 사용할 수 있습니다 — Gemini 3.5 Flash는 100ms 이하의 첫 번째 토큰 지연 시간, 3.x Pro는 복잡한 추론, 2.5 Pro는 프로덕션 워크로드에 적합합니다. OpenClaw는 이를 또 다른 OpenAI 호환 모델로 취급하므로, GPT를 구동하는 것과 동일한 프로바이더 설정과 RUNAPI_API_KEY로 Gemini도 호출할 수 있습니다. Google Cloud 프로젝트, 서비스 계정, Vertex AI 설정이 필요 없습니다.

API Key 받기 문서 읽기

하나의 API key · OpenAI 호환 채팅 엔드포인트 · 스트리밍 지원

Use RunAPI to send a chat request to Google Gemini 3.5 Flash.

Requirements:
- Use the RunAPI OpenAI-compatible endpoint at https://runapi.ai/v1/chat/completions
- Set model to "gemini-3.5-flash"
- Use the RUNAPI_API_KEY environment variable for authorization
- The response is synchronous — the reply arrives in choices[0].message.content
- For streaming, set stream to true and process server-sent events

curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [
      {"role": "system", "content": "You are a concise technical assistant."},
      {"role": "user", "content": "Explain the difference between gRPC and REST in three sentences."}
    ],
    "temperature": 0.7,
    "max_tokens": 256
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gemini-3.5-flash",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 34,
    "completion_tokens": 71,
    "total_tokens": 105
  }
}

curl 명령어를 복사하여 테스트하세요 gemini

작동 방식

3단계로 OpenClaw에서 Gemini 사용하기

RunAPI 설정

RUNAPI_API_KEY 환경 변수를 설정하세요. 이미 RunAPI를 OpenClaw 프로바이더로 설정했다면, 동일한 key와 baseUrl로 Gemini를 사용할 수 있습니다 — 모델 ID만 변경하면 됩니다. Google Cloud 자격 증명이 필요 없습니다.

export RUNAPI_API_KEY=runapi_xxx

chat completions를 통해 Gemini 호출

model을 gemini-3.5-flash로 설정하여 /v1/chat/completions에 POST 요청을 보내세요. system과 user 역할이 포함된 messages 배열을 전달하세요. 엔드포인트는 에이전트가 GPT 모델에 사용하는 것과 동일한 OpenAI 호환 형식을 받습니다.

POST /v1/chat/completions

응답 읽기

응답은 OpenAI chat completion 형식으로 동기적으로 도착합니다. 어시스턴트 답변은 choices[0].message.content에 있으며, 토큰 사용량은 usage 객체에 있습니다. 스트리밍의 경우 stream을 true로 설정하고 SSE 이벤트를 파싱하세요.

choices[0].message.content

파라미터

Gemini chat completions API 파라미터

파라미터	유형	설명
`model`	`string`	필수. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview, 또는 gemini-3.1-pro-preview.
`messages`	`array`	필수. role(system, user, assistant)과 content 필드를 가진 메시지 객체 배열.
`temperature`	`number`	선택 사항. 0에서 2 사이의 샘플링 온도. 낮은 값일수록 더 결정론적인 출력을 생성합니다. 기본값은 모델마다 다릅니다.
`max_tokens`	`integer`	선택 사항. 응답에서 생성할 최대 토큰 수.
`stream`	`boolean`	선택 사항. true로 설정하면 응답이 server-sent events로 스트리밍됩니다. 각 이벤트에는 부분 콘텐츠가 포함된 delta가 있습니다.
`top_p`	`number`	선택 사항. 0에서 1 사이의 nucleus 샘플링 임계값. 출력 무작위성 제어를 위한 temperature의 대안.

OpenClaw의 Gemini란?

Google Gemini는 RunAPI를 통해 Google Cloud 프로젝트·서비스 계정·Vertex AI 설정 없이 이용할 수 있습니다. OpenClaw는 이를 다른 OpenAI 호환 모델로 취급합니다——동일한 provider 설정과 RUNAPI_API_KEY. Gemini 3.5 Flash는 실시간 agent 루프를 위해 서브 100ms의 첫 토큰 지연을 제공하며, Gemini 2.5 Pro는 100만 토큰 컨텍스트 창과 사고 모드로 복잡한 추론의 장문 컨텍스트 작업을 처리합니다.

Gemini 활용 사례

텍스트·이미지·오디오·동영상의 멀티모달 앱

텍스트 프롬프트와 함께 이미지·PDF·오디오 파일·동영상 프레임을 전송해 Gemini가 분석·설명·구조화 데이터 추출을 하게 합니다. Gemini는 단일 API 호출로 모든 입력 유형을 네이티브로 처리합니다.

100만 토큰 컨텍스트를 활용한 긴 문서 분석

전체 코드베이스·법적 문서 세트·연구 논문 컬렉션을 Gemini 2.5 Pro의 100만 토큰 컨텍스트 창에 입력해 청크나 검색 파이프라인 없이 분석과 요약을 처리합니다.

Flash를 활용한 실시간 agent 루프

서브 100ms의 첫 토큰 지연이 최고 추론 품질보다 중요한 속도에 민감한 agent 도구 호출 체인에 Gemini 3.5 Flash를 사용합니다. 백만 토큰당 비용은 최저 수준 중 하나입니다.

FAQ

Gemini + OpenClaw 질문

OpenClaw 일반 설정

아직 설정하지 않으셨나요? OpenClaw용 RunAPI 설정 가이드로 시작하세요.

OpenClaw 설정 가이드 →

Gemini 모델 카탈로그

Gemini의 모든 변형, 가격, API 문서를 확인하세요.

Gemini 모델 →

지금 OpenClaw에서 Gemini를 사용해보세요.

무료 RunAPI key를 발급받고, OpenClaw 프로바이더에서 모델을 gemini-3.5-flash로 설정한 후 Gemini와 대화를 시작하세요.

모델 보기 →