Sora (IA) causa furor ¿sabes por qué?

por Alicia Pérez Estévez

Sora aparece en el mercado de la inteligencia artificial, logrando cosas que parecen imposibles. Un vídeo de una mariposa que vuela dentro del mar o el de un camaleón que tiene las plumas de un pavo real, con total definición y perfección de la imagen, dando una sensación de realidad espectacular. Ahora bien, lo más interesante es que se trata de imágenes generadas a partir de un texto y en segundos. Sora es pues, la última novedad de OpenAI de generación de vídeos, que viene a complementar la puerta que ya abrió en su momento chatGPT

Técnicamente Sora es…

Un simulador de lo físico en vídeos de máximo 60 segundos y de alta fidelidad, con diferentes propósitos. Un modelo de IA “que puede crear escenas realistas e imaginativas a partir de instrucciones de texto”, y que funciona gracias al aprendizaje continuo de datos e información, que le permiten comprender lo que el usuario pide y asociarlo a su correspondencia en la realidad tangible. 

Sora también es capaz de generar vídeos a partir de una imagen estática, y recrear todo un mundo a partir de ella, así como completar, ampliar y hacer más complejo un vídeo ya existente. Es una tecnología que es “entrenada” para comprender e integrar el lenguaje humano y de la realidad tangible tal y como la conocemos, y así recrearla. 

Aunque sabemos que representa mucho más que eso. De hecho, los desarrolladores de OpenAI le han llamado “Sora” porque en japonés significa “cielo” lo que representa la inmensidad de posibilidades creativas que pueden lograrse gracias a esta herramienta. El cielo es el límite con Sora, o al menos esta es la expectativa que a poco tiempo de su lanzamiento está generando. 

Sora

¿Cómo funciona Sora?

Para hacer funcionar a Sora es necesario darle una indicación llamada prompt, que básicamente es escribir, teclear, en un recuadro simple de una web, unas cuantas palabras-frases que describan de manera suficientemente detallada lo que se quiere ver en el vídeo, de hecho mientras más precisa mejor, como por ejemplo: “anciano sonriendo con un sombrero amarillo caminando junto a un pingüino en un atardecer en la nieve” y entonces Sora generará en poco tiempo un vídeo que represente fielmente lo que se le ha pedido:

Sora

O ahora pensemos en que le pedimos a Sora que genere un vídeo de un adorable perro dálmata que pasa a través de unas ventanas en la plata baja de un colorido edificio de Burano en Italia y la herramienta “fabrica” un vídeo tal cual.

sora

 Aunque el prompt más difundido fue uno los primeros que mostró OpenAI para hablar de las bondades de Sora, que consistió en generar un vídeo con la siguiente descripción: “La hermosa y nevada ciudad de Tokio está llena de actividad. La cámara se mueve por la bulliciosa calle de la ciudad, siguiendo a varias personas que disfrutan del hermoso clima nevado y compran en los puestos cercanos. Preciosos pétalos de sakura vuelan por el viento junto con los copos de nieve”.

sora

OpenIA ha logrado esta herramienta bárbara que permite hacer esta imagen tan exacta, gracias a registrar una cantidad infinita de vídeos, animaciones y contenido audiovisual proveniente de vídeos públicos y otros cedidos por sus autores y gracias a entrenar a Sora para comprender estos lenguajes e ir generando “parches visuales” que se van refinando hasta obtener estos vídeos sorprendentes y a medida. La cosa es que es un entrenamiento y registro de información contínuo, por lo que a mayor interacción reciba Soria, más precisos serán sus resultados. 

Aunque los desarrolladores hablan de que su utilidad va mucho más allá del campo de la creatividad o la ensoñación, pues Sora es un modelo de inteligencia artificial que podría ayudar a evolucionar e incluso transformar diferentes áreas de la sociedad y de la cotidianidad de las personas. Algunos ejemplos de cómo Sora podría ser trascendental en el futuro serían:

En la educación como una herramienta muy útil para ilustrar de manera audiovisual, hechos, mapas, escenas, situaciones históricas, geográficas, políticas, de una forma prácticamente tangible en esos vídeos tan realistas, y así ayudar a los alumnos a entender procesos con mayor rapidez, atractivo y profundidad. 

En el campo de medicina y la investigación, Sora y tecnologías similares podrían recrear comportamientos internos del cuerpo humano que sin cirugía o otras pruebas no podrían verse, así como hacer simulaciones de procesos biológicos que ayudarían a los científicos a mejorar procesos, crear nuevas medicinas, etc.

En el mundo de los negocios podría ser una herramienta definitiva pues ayudaría a las empresas a mostrar prototipos de sus productos y servicios antes de probarlos, con una precisión bastante realista de lo que luego podrán disfrutar en el plano de la realidad. Para sectores inmobiliarios, arquitectura, ecología y procesos de sostenibilidad podría ser de inmensa ayuda, proyectando escenarios que luego puedan construirse y aterrizarse en la realidad tangible. 

Obviamente la tecnología de Sora podría ser definitiva para el desarrollo del cine y las artes audiovisuales, porque permite generar efectos y secuencias para películas sorprendentes en pocos segundos y sin tener que realizar todo el despliegue de tiempo, esfuerzo y dinero que a día de hoy implica hacer una serie, un documental, una película e incluso anuncios y vídeos de marketing. 

Los productos de inteligencia artificial de OpenAI están siendo mayormente utilizados por empresas de tecnología y de educación.

Statista

Es importante decir, que esta tecnología tiene un precedente en una versión que lanzó en abril de 2023 la empresa Runway AI, que logró hacer vídeos muy cortitos y con defectos visuales sobre un perro que habla por teléfono por ejemplo, y que aunque no llegó al público, representa el punto de partida que luego OpenAI 10 meses después presentara de una forma más robusta y funcional. 

sora

Sora de prueba

Si, este modelo de inteligencia artificial se encuentra en fase de prueba y disponible solo para un grupo reducido de desarrolladores independientes a la empresa que están evaluando diferentes parámetros antes de que pueda ser abierta al público. 

¿Y por qué lanzarlo y mostrar sus bondades sin que esté aún accesible? Tim Brooks, quien es uno de los desarrolladores de Sora, cuenta que el feedback de las personas es crucial en esta fase de prueba, de hecho tomaron en cuenta las respuestas recibidas en su publicación de lanzamiento en X, para generar nuevos prompts y vídeos en su momento. 

“La intención es ofrecer un anticipo de lo que se avecina, para que la gente pueda ver las posibilidades de esta tecnología y podamos recibir sus comentarios”

Tim Brooks, desarrollador de Sora

Tampoco está disponible, entre otras cosas porque aún no está en capacidad de generar vídeos totalmente perfectos como en la realidad. Sora por ejemplo podría equivocarse y tal y como explican en OpenIA, en un vídeo donde un chica muerde una galleta Sora podría no mostrar la marca del mordisco posteriormente, o confundir la derecha con la izquierda, o simular de forma incorrecta la trayectoria de una cámara o una toma, o simplemente no comprender totalmente situaciones más complejas. 

También está en período de prueba pues están afinando detalles para garantizar la mayor seguridad a la hora de usar Sora y evitar los peligros que su uso indiscriminado podría generar. Están preparando la herramienta para que sea capaz de rechazar textos que soliciten vídeos que no cumplan con las reglas del juego. Así, sería imposible que Sora recree un vídeo de contenido sexual, odio, violencia, o que pongan en riesgo la imagen de figuras públicas, gracias a revisar cada solicitud y fotograma generado antes de poder ser compartido. 

Se trata de una tecnología que no requiere ninguna formación para usarse ni altos recursos, sino que cualquier persona con un móvil podría acceder a ello, entonces sobre todo en el área de las estafas y el crimen, OpenAI quiere asegurar que se tienen las máximas medidas. Se están calculando los riesgos políticos por ejemplo, de que se utilice esta inteligencia artificial para recrear falsos vídeos de líderes importantes haciendo declaraciones falsas o con connotaciones negativas. 

Por lo pronto, Sora y la inteligencia artificial se presentan como una auténtica maravilla muy útil en tantos aspectos, que ahora no es posible imaginar. Si quieres echar un vistazo más completo de las posibilidades de Sora, revisa el perfil de X de Tim Brooks, uno de sus desarrolladores, donde va publicando vídeos impresionantes realizados con esta tecnología. ¡Sora, hazme un vídeo!

Si te ha gustado, puedes compartirlo aquí: