---
title: &quot;Hermes Agent에서 RunAPI로 ElevenLabs 사용하기 — TTS &amp; 오디오 API 가이드&quot;
url: &quot;https://runapi.ai/ko/hermes-elevenlabs.md&quot;
canonical: &quot;https://runapi.ai/ko/hermes-elevenlabs&quot;
locale: &quot;ko&quot;
model: &quot;elevenlabs&quot;
---

# Hermes Agent에서 ElevenLabs를 사용하세요.

ElevenLabs는 RunAPI를 통해 6개의 오디오 엔드포인트를 제공합니다 — 초저지연의 turbo-v2.5 TTS, 29개 언어를 지원하는 multilingual-v2, 다중 화자 대화용 dialogue-v3, 효과음, 음성 인식 전사, 보컬 분리. Hermes Agent는 하나의 API key로 custom:runapi 공급자를 통해 모두 호출합니다.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;,
    &quot;text&quot;: &quot;Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.&quot;,
    &quot;speed&quot;: 1.0,
    &quot;stability&quot;: 0.5,
    &quot;similarity_boost&quot;: 0.75
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;text-to-speech-turbo-v2.5&quot;
}

```

## How it works

1. **RunAPI 설정** — Hermes Agent가 실행되는 환경에 RUNAPI_API_KEY를 설정하세요. 이미 RunAPI를 custom:runapi 공급자로 추가했다면 동일한 key와 base_url로 모든 ElevenLabs 엔드포인트 — TTS, STT, 대화, 효과음, 오디오 분리 — 를 처리합니다.
2. **text_to_speech 호출** — model을 text-to-speech-turbo-v2.5로 설정하고, 변환할 텍스트와 선택적으로 voice, speed, stability 파라미터를 포함하여 text_to_speech 엔드포인트로 POST 요청을 보내세요. Hermes Agent가 custom:runapi 공급자를 통해 요청을 라우팅합니다. 다국어 출력에는 voice와 language_code를 사용하여 text-to-speech-multilingual-v2를 사용하세요.
3. **결과 가져오기** — 엔드포인트는 즉시 task_id를 반환합니다. 상태가 completed가 될 때까지 작업 상태 엔드포인트를 폴링한 후 응답에서 오디오 URL을 읽으세요.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | 필수. text-to-speech-turbo-v2.5(저지연) 또는 text-to-speech-multilingual-v2(29개 언어). |
| `text` | `string` | 필수. 음성으로 변환할 텍스트. 최대 5000자. |
| `voice` | `string` | ElevenLabs 음성 ID. multilingual-v2에서는 필수. turbo-v2.5는 생략 시 기본 음성을 사용합니다. |
| `speed` | `float` | 선택 사항. 재생 속도 배율. 범위 0.7~1.2. |
| `stability` | `float` | 선택 사항. 음성 일관성. 범위 0.0~1.0. 낮을수록 표현력이 높아집니다. |
| `similarity_boost` | `float` | 선택 사항. 음성 유사도 강화. 범위 0.0~1.0. |
| `style` | `float` | 선택 사항. 스타일 과장. 범위 0.0~1.0. |
| `language_code` | `string` | 선택 사항. multilingual-v2의 목표 언어 (예: en, es, ja). |
| `callback_url` | `string` | 선택 사항. 작업 완료 시 POST를 수신할 웹훅 URL. |

## FAQ

### Hermes Agent에서 ElevenLabs를 사용할 수 있나요?

네. Hermes Agent에서 RunAPI를 base_url https://runapi.ai/v1과 key_env RUNAPI_API_KEY로 custom:runapi 공급자로 설정하면 ElevenLabs 엔드포인트 — text_to_speech, speech_to_text, text_to_dialogue, text_to_sound, isolate_audio — 를 모두 호출할 수 있습니다.

### turbo-v2.5와 multilingual-v2의 차이점은 무엇인가요?

turbo-v2.5는 저지연과 영어 우선 출력에 최적화되어 있으며 음성이 지정되지 않으면 기본 음성을 적용합니다. multilingual-v2는 29개 언어를 지원하며 명시적인 voice ID와 선택적 language_code가 필요합니다. turbo는 글자당 비용이 약 절반입니다.

### RunAPI에서 ElevenLabs는 어떻게 청구되나요?

음성 합성 및 대화 엔드포인트는 입력 텍스트의 글자 수 기준으로 청구됩니다. 음성 인식은 오디오 분 단위로 청구됩니다. 오디오 분리는 작업당 청구됩니다. 현재 요금은 RunAPI 가격 페이지를 확인하세요.

### Hermes Agent에서 ElevenLabs로 오디오를 전사할 수 있나요?

네. source_audio_url을 포함하여 /api/v1/elevenlabs/speech_to_text의 speech_to_text 엔드포인트를 호출하세요. diarize 파라미터로 선택적 화자 분리와 tag_audio_events로 오디오 이벤트 태깅을 지원합니다. 결과는 비동기적으로 반환됩니다.

### RunAPI를 통한 오디오 분리는 어떻게 작동하나요?

혼합 오디오 파일을 가리키는 source_audio_url을 포함하여 /api/v1/elevenlabs/isolate_audio의 isolate_audio 엔드포인트를 호출하세요. 엔드포인트가 배경 소음에서 보컬을 추출하고 정제된 오디오 URL을 반환합니다. 작업은 비동기식이므로 폴링하거나 callback_url을 사용하세요.


## Links

- [Hermes Agent 설정 가이드 →](https://runapi.ai/ko/hermes-agent)
- [RunAPI의 ElevenLabs →](https://runapi.ai/ko/models/elevenlabs)
- [Model catalog](https://runapi.ai/ko/models)
- [API docs](https://runapi.ai/ko/docs)
