OpenClaw에서 Gemini를 사용하세요.
Google Gemini는 RunAPI의 OpenAI 호환 엔드포인트를 통해 사용할 수 있습니다 — Gemini 3.5 Flash는 100ms 이하의 첫 번째 토큰 지연 시간, 3.x Pro는 복잡한 추론, 2.5 Pro는 프로덕션 워크로드에 적합합니다. OpenClaw는 이를 또 다른 OpenAI 호환 모델로 취급하므로, GPT를 구동하는 것과 동일한 프로바이더 설정과 RUNAPI_API_KEY로 Gemini도 호출할 수 있습니다. Google Cloud 프로젝트, 서비스 계정, Vertex AI 설정이 필요 없습니다.
Use RunAPI to send a chat request to Google Gemini 3.5 Flash.
Requirements:
- Use the RunAPI OpenAI-compatible endpoint at https://runapi.ai/v1/chat/completions
- Set model to "gemini-3.5-flash"
- Use the RUNAPI_API_KEY environment variable for authorization
- The response is synchronous — the reply arrives in choices[0].message.content
- For streaming, set stream to true and process server-sent events
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-flash",
"messages": [
{"role": "system", "content": "You are a concise technical assistant."},
{"role": "user", "content": "Explain the difference between gRPC and REST in three sentences."}
],
"temperature": 0.7,
"max_tokens": 256
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "gemini-3.5-flash",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "gRPC uses HTTP/2 and Protocol Buffers for strongly-typed, multiplexed RPC calls with built-in code generation. REST uses HTTP/1.1 (or 2) with JSON payloads and relies on URL paths and HTTP verbs for resource semantics. gRPC is faster for service-to-service calls; REST is simpler to debug and more widely supported by browsers."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 34,
"completion_tokens": 71,
"total_tokens": 105
}
}
3단계로 OpenClaw에서 Gemini 사용하기
RunAPI 설정
RUNAPI_API_KEY 환경 변수를 설정하세요. 이미 RunAPI를 OpenClaw 프로바이더로 설정했다면, 동일한 key와 baseUrl로 Gemini를 사용할 수 있습니다 — 모델 ID만 변경하면 됩니다. Google Cloud 자격 증명이 필요 없습니다.
export RUNAPI_API_KEY=runapi_xxx
chat completions를 통해 Gemini 호출
model을 gemini-3.5-flash로 설정하여 /v1/chat/completions에 POST 요청을 보내세요. system과 user 역할이 포함된 messages 배열을 전달하세요. 엔드포인트는 에이전트가 GPT 모델에 사용하는 것과 동일한 OpenAI 호환 형식을 받습니다.
POST /v1/chat/completions
응답 읽기
응답은 OpenAI chat completion 형식으로 동기적으로 도착합니다. 어시스턴트 답변은 choices[0].message.content에 있으며, 토큰 사용량은 usage 객체에 있습니다. 스트리밍의 경우 stream을 true로 설정하고 SSE 이벤트를 파싱하세요.
choices[0].message.content
Gemini chat completions API 파라미터
| 파라미터 | 유형 | 설명 |
|---|---|---|
model |
string |
필수. gemini-3.5-flash, gemini-2.5-flash, gemini-2.5-pro, gemini-3-flash-preview, gemini-3-pro-preview, 또는 gemini-3.1-pro-preview. |
messages |
array |
필수. role(system, user, assistant)과 content 필드를 가진 메시지 객체 배열. |
temperature |
number |
선택 사항. 0에서 2 사이의 샘플링 온도. 낮은 값일수록 더 결정론적인 출력을 생성합니다. 기본값은 모델마다 다릅니다. |
max_tokens |
integer |
선택 사항. 응답에서 생성할 최대 토큰 수. |
stream |
boolean |
선택 사항. true로 설정하면 응답이 server-sent events로 스트리밍됩니다. 각 이벤트에는 부분 콘텐츠가 포함된 delta가 있습니다. |
top_p |
number |
선택 사항. 0에서 1 사이의 nucleus 샘플링 임계값. 출력 무작위성 제어를 위한 temperature의 대안. |
OpenClaw의 Gemini란?
Google Gemini는 RunAPI를 통해 Google Cloud 프로젝트·서비스 계정·Vertex AI 설정 없이 이용할 수 있습니다. OpenClaw는 이를 다른 OpenAI 호환 모델로 취급합니다——동일한 provider 설정과 RUNAPI_API_KEY. Gemini 3.5 Flash는 실시간 agent 루프를 위해 서브 100ms의 첫 토큰 지연을 제공하며, Gemini 2.5 Pro는 100만 토큰 컨텍스트 창과 사고 모드로 복잡한 추론의 장문 컨텍스트 작업을 처리합니다.
Gemini 활용 사례
텍스트·이미지·오디오·동영상의 멀티모달 앱
텍스트 프롬프트와 함께 이미지·PDF·오디오 파일·동영상 프레임을 전송해 Gemini가 분석·설명·구조화 데이터 추출을 하게 합니다. Gemini는 단일 API 호출로 모든 입력 유형을 네이티브로 처리합니다.
100만 토큰 컨텍스트를 활용한 긴 문서 분석
전체 코드베이스·법적 문서 세트·연구 논문 컬렉션을 Gemini 2.5 Pro의 100만 토큰 컨텍스트 창에 입력해 청크나 검색 파이프라인 없이 분석과 요약을 처리합니다.
Flash를 활용한 실시간 agent 루프
서브 100ms의 첫 토큰 지연이 최고 추론 품질보다 중요한 속도에 민감한 agent 도구 호출 체인에 Gemini 3.5 Flash를 사용합니다. 백만 토큰당 비용은 최저 수준 중 하나입니다.
Gemini + OpenClaw 질문
네. RunAPI는 OpenAI 호환 엔드포인트를 통해 Gemini 접근을 제공합니다. RUNAPI_API_KEY만 있으면 됩니다 — Google Cloud 프로젝트, 서비스 계정 JSON, Vertex AI 청구 설정이 필요 없습니다.
RunAPI는 Gemini 3.5 Flash(최신, 가장 빠름), Gemini 2.5 Flash, Gemini 2.5 Pro, Gemini 3 Flash Preview, Gemini 3 Pro Preview, Gemini 3.1 Pro Preview를 제공합니다. 버전 슬러그를 model 파라미터로 전달하세요 — 예: gemini-3.5-flash 또는 gemini-2.5-pro.
Gemini는 RunAPI에서 종량제 방식으로 토큰당 청구됩니다. 입력 및 출력 토큰은 별도로 계산됩니다. 월정액 구독이나 최소 지출이 없습니다. 현재 백만 토큰당 요금은 RunAPI 가격 페이지를 확인하세요.
네. 두 모델 모두 동일한 RunAPI 프로바이더 설정과 API key를 사용합니다. 프로바이더를 재설정하지 않고 model 파라미터를 gemini-3.5-flash에서 gpt-5.5(또는 다른 RunAPI 모델)로 변경하면 됩니다. OpenClaw는 요청별로 모델을 선택합니다.
네. 요청 본문에서 stream을 true로 설정하세요. RunAPI는 Gemini 응답을 OpenAI 호환 delta 형식의 server-sent events로 스트리밍하므로, OpenClaw는 GPT 스트리밍을 처리하는 것과 동일한 방식으로 처리합니다.
지금 OpenClaw에서 Gemini를 사용해보세요.
무료 RunAPI key를 발급받고, OpenClaw 프로바이더에서 모델을 gemini-3.5-flash로 설정한 후 Gemini와 대화를 시작하세요.