Usa InfiniteTalk en Hermes Agent.
InfiniteTalk genera videos de avatar parlante sincronizados con labios desde un archivo de audio y una imagen de rostro. Hermes Agent lo llama a través del endpoint personalizado de RunAPI — configura custom:runapi una vez, envía audio_to_video y consulta el video terminado.
Usa RunAPI para generar un video de avatar parlante con InfiniteTalk.
Requisitos:
- Lee la clave API de RUNAPI_API_KEY.
- Usa el proveedor custom:runapi con base_url https://runapi.ai/v1.
- Llama a POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Establece model en "infinitetalk-from-audio".
- Establece source_audio_url en la URL del archivo de audio.
- Establece source_image_url en la URL de la imagen del rostro.
- Establece prompt para describir la salida deseada.
- La tarea es asíncrona. Consulta el task_id devuelto hasta que el estado sea "completed".
- Cuando termine, lee la URL del video de la salida de la respuesta.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
Usa InfiniteTalk en Hermes Agent en tres pasos
Configura RunAPI
Establece RUNAPI_API_KEY en el entorno donde se ejecuta Hermes Agent. Si ya añadiste RunAPI como proveedor custom:runapi, la misma clave gestiona las solicitudes de InfiniteTalk.
export RUNAPI_API_KEY=runapi_xxx
Llama a InfiniteTalk
Envía una solicitud POST al endpoint audio_to_video con el model, la URL de audio, la URL de imagen y un prompt. Hermes Agent puede construir y enviar esta solicitud a través del proveedor custom:runapi.
POST /api/v1/infinitetalk/audio_to_video
Consulta el resultado
El endpoint devuelve un task_id de inmediato. Consulta el endpoint de estado de la tarea hasta que el estado sea completado y luego lee la URL del video de salida de la respuesta.
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
Parámetros de la API de InfiniteTalk
| Parámetro | Tipo | Descripción |
|---|---|---|
model |
string |
Obligatorio. Usa infinitetalk-from-audio. |
source_audio_url |
string |
Obligatorio. URL del archivo de audio fuente para sincronizar con los labios. |
source_image_url |
string |
Obligatorio. URL de la imagen del rostro o avatar a animar. |
prompt |
string |
Obligatorio. Descripción de texto de la salida de video deseada. Máximo 5000 caracteres. |
output_resolution |
string |
Opcional. Resolución del video de salida. Valores aceptados: 480p, 720p. Por defecto 480p. |
seed |
integer |
Opcional. Semilla de reproducibilidad. Entero entre 10000 y 1000000. |
callback_url |
string |
Opcional. URL de webhook que recibe un POST cuando se completa la tarea. |
¿Qué es InfiniteTalk en Hermes Agent?
InfiniteTalk crea videos de avatar parlante impulsando la animación del rostro, la sincronización de labios y el movimiento de cabeza desde un archivo de audio y una imagen de referencia. Hermes Agent lo llama a través del proveedor custom:runapi para construir pipelines de varios pasos -- por ejemplo, generar voz con ElevenLabs y luego pasar la URL de audio a InfiniteTalk para un flujo de trabajo completo de texto a video parlante.
Casos de uso de InfiniteTalk
Contenido de YouTube con presentadores de IA
Generar videos de talking head desde una sola foto para canales de YouTube, eliminando la necesidad de filmación en cámara mientras se mantiene un presentador consistente en todos los videos.
Doblaje de video con sincronización de labios
Reanimar rostros en videos existentes para que coincidan con nuevas pistas de audio en diferentes idiomas, produciendo contenido doblado donde los movimientos de boca coinciden con el discurso traducido.
Videos largos de clases y presentaciones
Crear videos de avatar parlante de duración ilimitada desde narración grabada para cursos en línea, webinars o contenido de capacitación interno usando solo una foto del instructor.
Preguntas sobre InfiniteTalk + Hermes Agent
Sí. Hermes Agent puede llamar al endpoint de InfiniteTalk de RunAPI a través del proveedor custom:runapi. Establece RUNAPI_API_KEY en tu entorno y envía un POST a /api/v1/infinitetalk/audio_to_video con el model, la URL de audio y la URL de imagen.
No. La misma RUNAPI_API_KEY que usas para chat, imagen y generación de video también funciona para InfiniteTalk. Todos los modelos de RunAPI comparten una clave y un saldo de créditos.
Asíncrono. El endpoint de creación devuelve un task_id de inmediato. Consulta el endpoint de estado de la tarea o proporciona un callback_url para recibir un webhook cuando el video esté listo.
InfiniteTalk usa facturación por tarea. Consulta la página de precios de RunAPI para las tarifas actuales. Los créditos se deducen del mismo saldo usado para todos los modelos de RunAPI.
Configuración general de Hermes Agent
¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.
Guía de configuración de Hermes Agent →Catálogo de modelos InfiniteTalk
Ver variantes, precios y documentación de la API de InfiniteTalk.
InfiniteTalk en RunAPI →Prueba InfiniteTalk en Hermes Agent hoy.
Obtén una clave RunAPI gratuita, configura el proveedor custom:runapi y genera videos de avatar parlante sincronizados con labios desde cualquier archivo de audio.