캐시된 입력
반복적인 프롬프트 프리픽스는 줄어든 입력 요금으로 청구됩니다. RunAPI는 OpenAI의 캐시 요금의 50%로 할인을 제공합니다.
GPT-5.4는 백만 토큰당 입력 $2.50, 출력 $15이며, GPT-5.5는 $5와 $30입니다. RunAPI는 모든 GPT 모델을 공식 요금의 절반으로 제공합니다 — 동일한 API, 동일한 출력, 청구서에서 50% 절감.
OpenAI는 별도의 입력 및 출력 요금과 더 저렴한 캐시 입력 요금으로 각 GPT 모델에 백만 토큰당 가격을 책정합니다. 아래의 모든 수치는 OpenAI가 사용하는 청구 단위인 백만 토큰당 기준입니다.
RunAPI를 통한 GPT-5.4는 입력 $1.25/M, 출력 $7.50/M. 공식 요금은 $2.50/$15.
RunAPI를 통해 50% 할인으로 청구되는 플래그십 요금의 일부인 GPT-5.4-mini.
RunAPI를 통한 GPT-5.5는 입력 $2.50/M, 출력 $15/M. 공식 요금은 $5/$30.
캐시된 입력 토큰은 표준 입력의 일부 비용 — RunAPI에서 50%로 제공됩니다.
표는 공식 OpenAI 요금과 RunAPI 요금을 나란히 보여줍니다. RunAPI는 모든 GPT 모델에 일률적으로 50% 할인을 적용합니다. 볼륨 약정 및 구독 없음.
| 모델 | 공식 입력 /M | 공식 출력 /M | RunAPI 입력 /M | RunAPI 출력 /M | 컨텍스트 창 |
|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $2.50 | $15.00 | 400K |
| GPT-5.4 | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
| GPT-5.4-mini | $0.25 | $2.00 | $0.13 | $1.00 | 400K |
| GPT-5.3-codex | $2.50 | $15.00 | $1.25 | $7.50 | 400K |
OpenAI는 캐시된 입력 토큰에 더 낮은 요금을 청구하고, 지연된 처리 시간을 허용하는 배치 요청에 깊은 할인을 제공합니다. 두 가지 모두 코딩 에이전트 및 대량 처리와 같은 반복적인 작업부하에 중요합니다.
반복적인 프롬프트 프리픽스는 줄어든 입력 요금으로 청구됩니다. RunAPI는 OpenAI의 캐시 요금의 50%로 할인을 제공합니다.
배치 API에 제출된 요청은 최대 24시간 처리 시간으로 표준 요금의 절반으로 실행됩니다. RunAPI는 자체 할인 위에 이 할인도 제공합니다.
GPT-5 모델은 추론 노력을 설정할 수 있습니다. 낮은 노력은 더 적은 추론 토큰을 생성하여, 미터링 청구에서 출력 비용을 직접 줄입니다.
요청당 최대 출력 토큰을 제한하여 비용을 제한하고 긴 에이전트 작업에서 무한 생성을 방지합니다.
토큰 요금은 실제 작업에 연결하기 전까지는 추상적으로 느껴집니다. 아래는 RunAPI 요금으로 두 가지 사용 수준에서 예상 월간 비용을 포함한 일반적인 개발자 작업부하입니다.
| 작업부하 | 모델 | 가벼운 사용 (~50 작업/일) | 과다 사용 (~200 작업/일) | 공식 요금 대비 월간 절감액 |
|---|---|---|---|---|
| 코딩 에이전트 (Codex) | GPT-5.3-codex | $20/월 | $80/월 | $20–$80 |
| 고객 지원 챗봇 | GPT-5.4-mini | $6/월 | $24/월 | $6–$24 |
| RAG 지식 어시스턴트 | GPT-5.4 | $18/월 | $72/월 | $18–$72 |
| 콘텐츠 생성 파이프라인 | GPT-5.4 | $25/월 | $100/월 | $25–$100 |
| 멀티 에이전트 오케스트레이터 | GPT-5.5 | $90/월 | $360/월 | $90–$360 |
개발자들은 GPT를 Claude 및 Gemini와 비교합니다. 아래는 RunAPI 요금과 함께 백만 토큰당 기준으로 플래그십 모델들을 비교한 결과입니다.
| 공급자 | 플래그십 모델 | 입력 /M | 출력 /M | RunAPI 요금 |
|---|---|---|---|---|
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $1.25 / $7.50 |
| Anthropic | Claude Opus 4.7 | $10.00 | $50.00 | $5.00 / $25.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.63 / $5.00 |
RunAPI는 위에 나열된 모든 공급자에 50% 할인을 적용합니다. 가격은 2026년 6월 기준으로 확인되었습니다.
runapi.ai에서 가입하세요. 무료 티어에는 신용카드가 필요하지 않습니다.
대시보드 → API 키로 이동하세요. 키를 생성하고 저장하세요 — OpenAI API 키로 사용하게 됩니다.
기본 URL을 https://api.runapi.ai/v1로 설정하고 RunAPI 키를 사용하세요. OpenAI 호환 클라이언트라면 모두 작동합니다.
모델 파라미터에 gpt-5.4, gpt-5.5, 또는 다른 GPT 모델 ID를 사용하세요. RunAPI가 공식 요금의 50%로 라우팅과 청구를 처리합니다.
GPT-5.4는 공식적으로 백만 입력 토큰당 $2.50, 백만 출력 토큰당 $15입니다. GPT-5.5는 $5와 $30입니다. RunAPI를 통하면 모든 GPT 모델이 해당 요금의 절반으로 청구됩니다 — GPT-5.4는 백만 토큰당 입력 $1.25, 출력 $7.50입니다.
RunAPI는 모델 공급자와 볼륨 가격 협상을 통해 개발자에게 절감액을 전달합니다. 요청은 동일한 출력, 안전 필터, 동작으로 동일한 OpenAI 모델에 도달하므로, 유일한 차이는 청구서의 낮은 요금입니다. 품질 절충이 없으며 별도의 청구 티어도 없습니다 — 할인은 모든 GPT 모델에 자동으로 적용됩니다.
네. OpenAI는 반복적인 프롬프트 프리픽스를 줄어든 캐시 입력 요금으로 청구하여, 동일한 컨텍스트를 재전송하는 에이전트의 비용을 낮춥니다. RunAPI는 OpenAI의 캐시 요금의 50%로 캐시 할인을 제공하므로, 캐싱 절감액이 기본 할인과 함께 적용됩니다.
배치 API는 최대 24시간 처리 시간 대신 표준 요금의 50%로 요청을 실행합니다. 즉각적인 응답이 필요하지 않은 대량 작업에 적합합니다. RunAPI는 이 할인을 제공하므로, 배치 작업은 이미 할인된 요금의 절반으로 청구됩니다.
플래그십 입력 토큰에서, GPT-5.4($2.50)는 Gemini 2.5 Pro($1.25)와 Claude Opus($10) 사이에 위치합니다. 가장 저렴한 선택은 모델 티어와 작업부하에 따라 다릅니다. RunAPI는 세 가지 모두에 요금을 절반으로 줄이므로, 상대적 순위는 동일하게 유지됩니다.
네. RunAPI는 OpenAI 호환입니다. OpenAI 클라이언트를 https://api.runapi.ai/v1으로 연결하고, RunAPI 키를 사용하여 GPT 모델 ID를 전달하세요. OpenAI SDK를 이미 사용하는 기존 코드는 기본 URL과 키 외에 변경 없이 작동하므로, 기존 프로젝트를 마이그레이션하는 데 약 1분이 걸립니다.
네. GPT-5.3-codex는 RunAPI를 통해 공식 요금의 50%로 제공됩니다. 백만 토큰당 입력 $1.25, 출력 $7.50입니다. 설정에서 기본 URL과 키를 재정의하여 Codex 및 다른 OpenAI 호환 코딩 도구와 함께 작동합니다. 캐시된 입력 및 배치 할인도 제공되어 반복적인 코딩 세션의 실효 비용을 더욱 낮춥니다.
네. 신규 RunAPI 계정은 약정 전에 모든 GPT 모델을 테스트할 수 있는 무료 크레딧을 받습니다. 이후 청구는 최소 지출, 구독, 월간 약정 없이 엄격하게 사용한 만큼만 지불합니다 — 잔액을 충전하면 각 호출 시 토큰 비용이 차감됩니다. 대시보드에서 모델별 사용량을 확인할 수 있습니다.
무료 RunAPI 계정을 만들고, API 키를 받아 공식 OpenAI 가격의 50% 할인된 가격으로 모든 OpenAI GPT 모델을 호출하세요.