Midjourney da el salto al mundo de las IAs generadoras de vídeo con su modelo V1

Midjourney V1 permite generar clips de 5 segundos a partir de imágenes. Esta es una pieza clave en los planes de futuro de la compañía.
Fotograma de un vídeo generado con Midjourney V1. Es la imagen de tres gatitos de diferente color que llevan puestas chaquetas peludas con capucha.
19 de junio de 2025
Copiar enlace

Midjourney ha logrado posicionarse como una de las IAs generadoras de imágenes más relevantes del mercado, pero las aspiraciones de este laboratorio de investigación independiente apuntan mucho más alto: quiere conseguir desarrollar un modelo de IA capaz de realizar simulaciones de mundo abierto en tiempo real.

El primer paso para poder hacer realidad esta visión ya lo tienen cubierto con su modelo de generación de imágenes y, ahora, acaban de hacer realidad la fase dos de su plan con el lanzamiento de V1, su primera IA generadora de vídeos.

V1 se basa en la conversión de imagen a vídeo, permitiendo a los usuarios y usuarias subir o generar una imagen para después animarla, transformándola en un clip de 5 segundos. Al igual que con los modelos generadores de imágenes de Midjourney, V1 producirá cuatro resultados y la persona podrá quedarse con los que más le convenzan.

Por el momento, V1 ya se encuentra disponible en la plataforma web de Midjourney al suscribirse al plan Básico de 10$ al mes. Las personas suscritas a los planes Pro (60$/mes) o Mega (120$/mes) podrán disfrutar de generación de vídeo ilimitada en modo de velocidad “Relax”. Esto es provisional, ya que la compañía ha informado de que revisará los precios aplicados a su modelo de vídeo próximamente.

Cómo funciona Midjourney V1

A diferencia de otras IAs generadoras de vídeo, V1 no funciona a través de prompts de texto, si no que se trata de un modelo de “imagen a vídeo”. Por eso, para poder crear un vídeo deberás subir una imagen a la barra de prompts y marcarla como “frame inicial” o generar una con la IA de Midjourney y pulsar “Animar” .

Además de la configuración de animación automática, también existe la opción de animación “manual”, a través de la cual puedes describir con palabras cómo deseas que se muevan los elementos de la escena y lo que ocurrirá en el clip.

Otro ajuste importante es el de “bajo movimiento” o “alto movimiento”. El primero se aplica a aquellos vídeos en los que la “cámara” permanece mayoritariamente fija y el sujeto se mueve de forma más lenta y menos dinámica, su principal inconveniente es que a veces produce resultados que prácticamente carecen de movimiento. Mientras que el segundo es ideal para escenas en las que todo debe moverse, tanto el sujeto como la cámara, pero puede generar errores o deformaciones.

Un punto interesante es que, una vez que tengas tu clip de 5 segundos, podrás extenderlo hasta un máximo de cuatro veces. Teniendo en cuenta que cada extensión le sumará aproximadamente 4 segundos a tu clip, podrías llegar a obtener vídeos de hasta 21 segundos en total.

Construyendo modelos que creen simulaciones de mundo abierto en tiempo real

David Holz, CEO de Midjourney, compartió su visión acerca del futuro de su IA a través de una entrada de blog, afirmando que, aunque en los últimos años se han enfocado en las imágenes, «creemos que el destino inevitable de esta tecnología son modelos capaces de simulaciones en mundo abierto en tiempo real.

¿Qué significa eso? Básicamente, imagina un sistema de IA que genera imágenes en tiempo real. Puedes ordenarle que se mueva por un espacio 3D, los entornos y personajes también se mueven, y puedes interactuar con todo».

Para conquistar ese objetivo, Holz indica que es preciso desarrollar tecnología visual (sus modelos de imagen), lograr que se muevan (su reciente modelo de vídeo), conseguir poder moverse a través de ese espacio (modelos 3D) y hacerlo todo de forma inmediata (modelos en tiempo real).

La compañía planea poder dar forma a todos estos elementos de forma individual en 2026 para luego lanzarlos y, posteriormente, combinarlos en un sistema unificado. «Puede que al principio sea costoso, pero antes de lo que pensáis, será algo que todo el mundo podrá usar».

Foto: Midjourney

Otros artículos de

Publicado por

Content Manager en Marketing4eCommerce
"Content Manager" en Marketing4eCommerce, que traducido quiere decir: redactora, revisora, y fan absoluta de generar imágenes con IA.

Suscríbete a M4C

Únete a nuestro canal de Telegram

¡Todo lo que necesitas saber!

Apúntate a nuestra newsletter y recibe gratis en tu correo nuestros mejores artículos sobre eCommerce y marketing digital.