캐시 읽기
입력 토큰 90% 할인. RunAPI를 통한 Sonnet 4.6 캐시 읽기 비용은 $3.00/M 대신 $0.30/M입니다.
Anthropic은 모델에 따라 백만 토큰당 $3~$15를 청구합니다. RunAPI는 모든 Claude 모델을 공식 요금의 절반으로 제공합니다 — 동일한 API, 동일한 출력, 청구서에서 50% 절감.
Anthropic은 세 가지 모델 티어에 대한 토큰당 가격을 공개합니다: 경량 작업용 Haiku, 균형 잡힌 작업부하용 Sonnet, 최대 성능용 Opus. 아래의 모든 가격은 Anthropic이 사용하는 청구 단위인 백만 토큰당 기준입니다.
RunAPI를 통한 Haiku 4.5는 입력 $1/M, 출력 $5/M. 공식 요금은 $2/$10.
RunAPI를 통한 Sonnet 4.6은 입력 $3/M, 출력 $15/M. 공식 요금은 $6/$30.
RunAPI를 통한 Opus 4.7은 입력 $5/M, 출력 $25/M. 공식 요금은 $10/$50.
캐시 읽기는 표준 입력 토큰보다 90% 저렴합니다 — RunAPI를 통한 Haiku의 경우 $0.10/M.
아래 표는 공식 Anthropic 요금과 RunAPI 요금을 나란히 보여줍니다. RunAPI는 모든 Claude 모델에 일률적으로 50% 할인을 적용합니다. 볼륨 약정 및 구독 없음.
| 모델 | 공식 입력 /M | 공식 출력 /M | RunAPI 입력 /M | RunAPI 출력 /M | 컨텍스트 창 |
|---|---|---|---|---|---|
| Opus 4.8 | $15.00 | $75.00 | $7.50 | $37.50 | 200K |
| Opus 4.7 | $10.00 | $50.00 | $5.00 | $25.00 | 200K |
| Opus 4.6 | $10.00 | $50.00 | $5.00 | $25.00 | 200K |
| Sonnet 4.6 | $6.00 | $30.00 | $3.00 | $15.00 | 200K |
| Sonnet 4.5 | $6.00 | $30.00 | $3.00 | $15.00 | 200K |
| Haiku 4.5 | $2.00 | $10.00 | $1.00 | $5.00 | 200K |
Anthropic의 프롬프트 캐싱은 반복되는 프리픽스를 저장하고, 캐시된 버전을 재사용할 때 더 낮은 비용을 청구합니다. 이는 매 요청마다 동일한 시스템 프롬프트와 파일 컨텍스트를 전송하는 Claude Code 같은 코딩 에이전트에 특히 중요합니다.
입력 토큰 90% 할인. RunAPI를 통한 Sonnet 4.6 캐시 읽기 비용은 $3.00/M 대신 $0.30/M입니다.
입력 비용에 25% 추가 — RunAPI를 통한 Sonnet 4.6은 $3.75/M입니다. 캐시된 프리픽스는 5분간 유지됩니다.
입력 요금의 2배 — RunAPI를 통한 Sonnet 4.6은 $6.00/M입니다. 컨텍스트 재사용이 빈번한 긴 코딩 세션에 유용합니다.
Anthropic은 최대 24시간의 처리 시간을 허용하는 배치 요청에 대해 모든 모델에 50% 할인을 제공합니다. RunAPI는 이 할인을 그대로 제공합니다.
토큰 비용은 실제 작업에 연결하기 전까지는 추상적으로 느껴집니다. 아래는 두 가지 사용 수준에서 예상 월간 비용을 포함한 다섯 가지 일반적인 개발자 작업부하입니다.
| 작업부하 | 모델 | 가벼운 사용 (~50 작업/일) | 과다 사용 (~200 작업/일) | 공식 요금 대비 월간 절감액 |
|---|---|---|---|---|
| 바이브 코딩 세션 (Claude Code) | Sonnet 4.6 | $45/월 | $180/월 | $45–$180 |
| PR 코드 리뷰 에이전트 | Opus 4.7 | $75/월 | $300/월 | $75–$300 |
| RAG 기반 문서 챗봇 | Haiku 4.5 | $12/월 | $48/월 | $12–$48 |
| 콘텐츠 생성 파이프라인 | Sonnet 4.6 | $30/월 | $120/월 | $30–$120 |
| 멀티 에이전트 오케스트레이터 | Opus 4.7 | $150/월 | $600/월 | $150–$600 |
개발자들은 Claude를 GPT-5 및 Gemini 2.5 Pro와 자주 비교합니다. 아래는 백만 토큰당 기준으로 플래그십 모델들을 비교한 결과입니다.
| 공급자 | 플래그십 모델 | 입력 /M | 출력 /M | RunAPI 요금 |
|---|---|---|---|---|
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI는 위에 나열된 모든 공급자에 50% 할인을 적용합니다. 가격은 2026년 6월 기준으로 확인되었습니다.
Claude Max는 무제한 Claude Code 사용에 월 $100($200은 5x 플랜)입니다. API는 토큰당 요금이 부과됩니다. Sonnet 4.6에서 월 1,000만 출력 토큰 미만을 사용하는 개발자의 경우, RunAPI 경로는 Max 구독보다 비용이 적게 들며 — 어떤 모델 티어에도 사용 한도가 없습니다.
Claude Code에서 Sonnet 무제한 및 제한적 Opus 사용. 고정 월 비용. API 접근 없음.
월 약정 없이 토큰당 지불. Sonnet 4.6은 입력 $3/M, 출력 $15/M. $100으로 약 670만 출력 토큰 — 대부분의 개인 개발자에게 충분합니다.
매일 1,000만 출력 토큰을 지속적으로 초과하는 헤비 사용자. RunAPI의 Sonnet 4.6 손익분기점은 약 670만 출력 토큰입니다.
팀, CI 파이프라인, 멀티 모델 설정, Sonnet과 함께 Opus 또는 Haiku 접근을 원하는 개발자. 한도 없음, 대기 없음, 구독 잠금 없음.
runapi.ai에서 가입하세요. 무료 티어에는 신용카드가 필요하지 않습니다.
대시보드 → API 키로 이동하세요. 키를 생성하고 저장하세요 — OpenAI API 키로 사용하게 됩니다.
기본 URL을 https://api.runapi.ai/v1으로 설정하고 RunAPI API 키를 사용하세요. Python, Node.js, Go, Ruby, 또는 curl 등 OpenAI 호환 클라이언트라면 모두 작동합니다.
모델 파라미터에 claude-sonnet-4-6, claude-opus-4-7, 또는 다른 Claude 모델 ID를 사용하세요. RunAPI가 공식 요금의 50%로 라우팅과 청구를 처리합니다.
아니요. RunAPI는 Anthropic의 API로 요청을 직접 프록시합니다. 모델 출력, 안전 필터, 동작은 Anthropic을 직접 호출하는 것과 동일합니다.
RunAPI는 모델 공급자와 볼륨 가격 협상을 통해 개발자에게 절감액을 전달합니다. 품질 차이는 없으며 — 동일한 모델, 동일한 API입니다.
네. ANTHROPIC_BASE_URL을 https://api.runapi.ai로 설정하고 RunAPI 키를 API 키로 사용하세요. Claude Code는 수정 없이 작동합니다.
RunAPI는 24시간 이내에 조정합니다. Anthropic의 공개 요금 대비 50% 할인이 유지됩니다.
네. 신규 계정은 모든 모델을 테스트할 수 있는 무료 크레딧을 받습니다. 이후 청구는 최소 금액 없이 철저하게 사용한 만큼만 지불합니다.
네. 캐시 읽기, 5분 쓰기, 1시간 쓰기 모두 Anthropic 캐시 가격의 50%로 지원됩니다.
네. RunAPI는 OpenAI와 호환됩니다. OpenAI 클라이언트를 api.runapi.ai/v1로 연결하고 Claude 모델 ID를 사용하세요.
사용한 만큼 지불합니다. 계정에 잔액을 충전하면 각 API 호출 시 토큰 비용이 차감됩니다. 구독, 청구서, 계약이 없습니다.
무료 RunAPI 계정을 만들고, API 키를 받아 공식 Anthropic 가격의 50% 할인된 가격으로 Claude Opus, Sonnet, 또는 Haiku를 사용해 보세요.