| Uso predeterminado |
Anuncios con muchas referencias, flujos de creadores, fotos de producto y dirección creativa con varios activos. |
Clips sociales cinematográficos, escenas con diálogo, control tipo storyboard y secuencias narrativas más largas. |
Clips cortos de alta fidelidad, tomas principales pulidas, generación de imagen a video y flujos API alineados con Google. |
| Contrato de entrada |
Texto más primer/último fotograma, referencias de imagen, video, audio y control amplio de relación de aspecto. |
Texto, control de primer/último fotograma, elementos de referencia y dirección de escena por instrucción. |
Texto, generación de imagen a video, imágenes de referencia y flujos de primer/último fotograma. |
| Presupuesto de referencias |
Mejor cuando una petición puede incluir varias imágenes, referencias de video y audio; úsalo si los activos subidos son el producto. |
Mejor cuando las referencias guían la escena, no cuando necesitas empaquetar muchos activos en una petición. |
Mejor cuando bastan imágenes de referencia o primer/último fotograma; menos adecuado para briefs con muchos activos. |
| Duración |
4-15 segundos; útil cuando una unidad generada debe cubrir un ritmo de anuncio completo. |
3-15 segundos; útil cuando el clip necesita ritmo, acción o continuidad de diálogo. |
4, 6 u 8 segundos; útil para clips cortos, muy pulidos e inserciones visuales. |
| Audio |
Conviene tratarlo como flujo de referencia multimodal cuando las pistas de audio forman parte del brief. |
Buen encaje para audio nativo, diálogo multilingüe y ritmo de escena. |
Buen encaje para audio nativo en flujos cortos de video de Google. |
| Resolución |
480p, 720p, 1080p; el encaje depende de los activos de referencia y del destino de salida. |
720p, 1080p, 4K; bueno cuando la especificación de salida importa para social o entrega cinematográfica. |
720p, 1080p, 4K; bueno cuando el requisito es salida corta de alta fidelidad. |
| Estrategia de petición |
Enruta por tipo de activo: solo texto, primer fotograma, primer/último fotograma o múltiples referencias. |
Enruta por necesidad de escena: clip social sin sonido, clip con sonido o flujo tipo motion-control. |
Enruta por modo y coste: texto, primer/último fotograma, referencias, quality, fast, upscale o extension. |
| Latencia y reintentos |
La lógica de reintento debe vigilar fallos de validación de referencias y disponibilidad de URLs de activos. |
La lógica de reintento debe vigilar coste con audio, fallos de larga duración y deriva del prompt. |
La lógica de reintento debe vigilar controles preview, bloqueos de seguridad y coste de regenerar clips cortos. |
| Flujo de desarrollo |
Úsalo cuando tu app acepta activos subidos por usuarios y necesita campos schema para referencias. |
Úsalo cuando tu app expone dirección de escena, opciones de audio o elecciones de clip más largo. |
Úsalo cuando tu app ya encaja con el comportamiento de modelos de Google o generación corta de imagen a video. |
| Riesgo principal |
Los flujos con muchas referencias crean más bordes de validación, almacenamiento y reintento. |
El control narrativo aún varía según la instrucción; planifica una ruta alternativa para fallos de diálogo o acción. |
La duración corta limita productos que necesitan continuidad de escena más larga. |
| Mal encaje cuando |
Solo necesitas un hero clip corto de texto a video con pocas referencias. |
No necesitas audio, diálogo, ritmo o control de secuencia. |
Necesitas continuidad de 15 segundos o control creativo con muchas referencias. |