Metodología de puntuación
Cada modelo se puntúa del 1 al 10 en cinco dimensiones. La puntuación total (sobre 50) determina la clasificación.
- Salida 3D — ¿El modelo genera entornos 3D explorables o vídeo 2D plano?
- Consistencia de reentrada — ¿Se mantiene la misma geometría al volver a una escena?
- Calidad de audio — ¿El audio se co-genera de forma nativa o se añade por separado?
- Libertad de cámara — ¿Se puede mover la cámara libremente después de la generación?
- Acceso y precios — ¿Hay un plan gratuito? ¿Es fácil empezar?
Clasificación
| Puesto | Modelo | 3D | Reentrada | Audio | Cámara | Acceso | Total |
|--------|--------|----|-----------|-------|--------|--------|-------|
| 1 | Happy Oyster | 10 | 9 | 8 | 10 | 8 | 45 |
| 2 | Sora | 3 | 2 | 5 | 4 | 6 | 20 |
| 3 | Veo | 3 | 2 | 4 | 4 | 5 | 18 |
| 4 | Runway | 2 | 1 | 3 | 3 | 8 | 17 |
| 5 | Kling | 2 | 1 | 3 | 3 | 7 | 16 |
| 6 | Pika | 1 | 1 | 1 | 2 | 8 | 13 |
| 7 | Seedance | 2 | 1 | 1 | 2 | 6 | 12 |
Última actualización: abril de 2026. Las puntuaciones reflejan las capacidades disponibles públicamente.
Happy Oyster
Puntuación: 45/50 — El único modelo que genera verdaderos mundos 3D. El modo Dirección y el modo Exploración ofrecen una interactividad sin igual. El audio se co-genera de forma nativa. Acceso anticipado gratuito disponible. Pierde puntos en consistencia de audio (aún en acceso anticipado) y documentación limitada.
Sora
Puntuación: 20/50 — La mayor fidelidad visual para vídeo pasivo. Sin salida 3D, sin reentrada, sin edición en tiempo real. Requiere ChatGPT Plus. Ideal para clips cinematográficos de un solo plano sin interacción con la escena.
Runway
Puntuación: 17/50 — Pipeline de vídeo 2D sólido con el mejor plan gratuito entre los modelos de pago. Gen-4 ofrece buena conversión de imagen a vídeo. Sin capacidades 3D. Ideal para edición rápida de vídeo y flujos de trabajo de motion design.
Kling
Puntuación: 16/50 — Buena consistencia de personajes en los clips generados. Las trayectorias de cámara se fijan en la generación. Sin exploración libre. Ideal para contenido de vídeo corto en redes sociales.
Veo
Puntuación: 18/50 — La propuesta de Google DeepMind con alta calidad visual. Audio generado por separado. Sin reentrada 3D. Ideal para usuarios del ecosistema Google.
Pika
Puntuación: 13/50 — Ligero y rápido. Mejor plan gratuito para uso casual. Solo 2D, sin generación de audio. Bueno para prototipado rápido y contenido social.
Seedance
Puntuación: 12/50 — El modelo de ByteDance con excelente calidad de movimiento para danza y movimiento. Solo pipeline 2D. Acceso gratuito limitado.
Qué esperar a continuación
El espacio de modelos de mundo evoluciona rápidamente. Desarrollos clave a seguir en 2026:
- Disponibilidad de la API de Happy Oyster (actualmente sin documentar)
- Posible anuncio de modo 3D de Sora
- Nuevos participantes de Meta y Apple
- Capacidades de exportación a motores de juego en todos los modelos