HERMES + INFINITETALK

Usa InfiniteTalk en Hermes Agent.

InfiniteTalk genera videos de avatar parlante sincronizados con labios desde un archivo de audio y una imagen de rostro. Hermes Agent lo llama a través del endpoint personalizado de RunAPI — configura custom:runapi una vez, envía audio_to_video y consulta el video terminado.

una clave API · endpoint de audio a video · polling de tareas asíncronas
Usa RunAPI para generar un video de avatar parlante con InfiniteTalk.


      Requisitos:

      - Lee la clave API de RUNAPI_API_KEY.

      - Usa el proveedor custom:runapi con base_url https://runapi.ai/v1.

      - Llama a POST https://runapi.ai/api/v1/infinitetalk/audio_to_video

      - Establece model en "infinitetalk-from-audio".

      - Establece source_audio_url en la URL del archivo de audio.

      - Establece source_image_url en la URL de la imagen del rostro.

      - Establece prompt para describir la salida deseada.

      - La tarea es asíncrona. Consulta el task_id devuelto hasta que el estado sea "completed".

      - Cuando termine, lee la URL del video de la salida de la respuesta.

      
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}
Copia el comando curl para probarlo infinitetalk
CÓMO FUNCIONA

Usa InfiniteTalk en Hermes Agent en tres pasos

1

Configura RunAPI

Establece RUNAPI_API_KEY en el entorno donde se ejecuta Hermes Agent. Si ya añadiste RunAPI como proveedor custom:runapi, la misma clave gestiona las solicitudes de InfiniteTalk.

export RUNAPI_API_KEY=runapi_xxx
2

Llama a InfiniteTalk

Envía una solicitud POST al endpoint audio_to_video con el model, la URL de audio, la URL de imagen y un prompt. Hermes Agent puede construir y enviar esta solicitud a través del proveedor custom:runapi.

POST /api/v1/infinitetalk/audio_to_video
3

Consulta el resultado

El endpoint devuelve un task_id de inmediato. Consulta el endpoint de estado de la tarea hasta que el estado sea completado y luego lee la URL del video de salida de la respuesta.

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
PARÁMETROS

Parámetros de la API de InfiniteTalk

Parámetro Tipo Descripción
model string Obligatorio. Usa infinitetalk-from-audio.
source_audio_url string Obligatorio. URL del archivo de audio fuente para sincronizar con los labios.
source_image_url string Obligatorio. URL de la imagen del rostro o avatar a animar.
prompt string Obligatorio. Descripción de texto de la salida de video deseada. Máximo 5000 caracteres.
output_resolution string Opcional. Resolución del video de salida. Valores aceptados: 480p, 720p. Por defecto 480p.
seed integer Opcional. Semilla de reproducibilidad. Entero entre 10000 y 1000000.
callback_url string Opcional. URL de webhook que recibe un POST cuando se completa la tarea.

¿Qué es InfiniteTalk en Hermes Agent?

InfiniteTalk crea videos de avatar parlante impulsando la animación del rostro, la sincronización de labios y el movimiento de cabeza desde un archivo de audio y una imagen de referencia. Hermes Agent lo llama a través del proveedor custom:runapi para construir pipelines de varios pasos -- por ejemplo, generar voz con ElevenLabs y luego pasar la URL de audio a InfiniteTalk para un flujo de trabajo completo de texto a video parlante.

Casos de uso de InfiniteTalk

Contenido de YouTube con presentadores de IA

Generar videos de talking head desde una sola foto para canales de YouTube, eliminando la necesidad de filmación en cámara mientras se mantiene un presentador consistente en todos los videos.

Doblaje de video con sincronización de labios

Reanimar rostros en videos existentes para que coincidan con nuevas pistas de audio en diferentes idiomas, produciendo contenido doblado donde los movimientos de boca coinciden con el discurso traducido.

Videos largos de clases y presentaciones

Crear videos de avatar parlante de duración ilimitada desde narración grabada para cursos en línea, webinars o contenido de capacitación interno usando solo una foto del instructor.

FAQ

Preguntas sobre InfiniteTalk + Hermes Agent

Configuración general de Hermes Agent

¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.

Guía de configuración de Hermes Agent →

Catálogo de modelos InfiniteTalk

Ver variantes, precios y documentación de la API de InfiniteTalk.

InfiniteTalk en RunAPI →

Prueba InfiniteTalk en Hermes Agent hoy.

Obtén una clave RunAPI gratuita, configura el proveedor custom:runapi y genera videos de avatar parlante sincronizados con labios desde cualquier archivo de audio.