TVyVideo + Radio

Sora, nueva inteligencia artificial para crear videos

sora

Latinoamérica. La compañía OpenAI, creadora de Chat GPT, anunció la creación de la una nueva inteligencia artificial destinada a crear videos a partir de textos denominada Sora.

Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico.

El modelo tiene un profundo conocimiento del lenguaje, lo que le permite interpretar indicaciones con precisión y generar personajes convincentes que expresan emociones vibrantes. Sora también puede crear múltiples tomas dentro de un solo video generado que persisten con precisión los personajes y el estilo visual.

Además de poder generar un vídeo únicamente a partir de instrucciones de texto, el modelo puede tomar una imagen fija existente y generar un vídeo a partir de ella, animando el contenido de la imagen con precisión y atención al pequeño detalle. El modelo también puede tomar un vídeo existente y ampliarlo o completar los fotogramas faltantes. Obtenga más información en nuestro informe técnico.

- Publicidad -

Destacó que es un desarrollo que está en proceso, por lo cual están otorgando acceso a una serie de artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos.

“Estamos compartiendo el progreso de nuestra investigación desde el principio para comenzar a trabajar y recibir comentarios de personas ajenas a OpenAI y para brindarle al público una idea de las capacidades de IA que hay en el horizonte”, señaló.

Versión de prueba
OpenAI informó que el modelo actual tiene debilidades. Entre ellas, dificultades para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco.

El modelo también puede confundir los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica.

Foco en seguridad
La compañía anunció que tomará varias medidas de seguridad importantes antes de que Sora esté disponible en los productos de OpenAI. Buscan evitar desinformación, contenido de odio y prejuicios.

También están creando herramientas para ayudar a detectar contenido engañoso, como un clasificador de detección que puede indicar cuándo Sora generó un video. Planean incluir metadatos de C2PA en el futuro si implementan el modelo en un producto OpenAI.

“Nuestro clasificador de texto verificará y rechazará las solicitudes de ingreso de texto que infrinjan nuestras políticas de uso, como aquellas que solicitan violencia extrema, contenido sexual, imágenes de odio, imágenes de celebridades o la IP de otros. También hemos desarrollado clasificadores de imágenes sólidos que se utilizan para revisar los fotogramas de cada video generado para ayudar a garantizar que cumpla con nuestras políticas de uso, antes de mostrarlo al usuario”, resaltó la compañía.

Richard Santa, RAVT

Richard Santa, RAVTEmail: [email protected]

Editor

Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.

No hay comentarios

• Si ya estás registrado, favor ingresar primero al sistema.

Conozca el programa de capacitación de Cinemotion Labs

Conozca el programa de capacitación de Cinemotion Labs

Colombia. Cinemotion Labs, el encuentro de la industria cinematográfica que se realizará en Medellín el 11 y 12 de agosto, presentó su programa de capacitación, una completa agenda sobre producción y...

Netflix Ads lanza su publicidad interactiva en Latam

Netflix Ads lanza su publicidad interactiva en Latam

Latinoamérica. Netflix Ads anunció la expansión de su formato de publicidad interactiva a Latinoamérica. Disponible en los Estados Unidos y Canadá desde el 1 de julio, esta función entrará en fase de...

AJA presentó el chasis Xpand Thunderbolt 5

AJA presentó el chasis Xpand Thunderbolt 5

Latinoamérica. AJA Video Systems presentó Io Xpand , un chasis de expansión PCIe de alto rendimiento compatible con Thunderbolt 5 para las tarjetas de E/S de vídeo y audio AJA KONA y Corvid.

Latina TV instala los nuevos multiplexores de VideoSwitch

Latina TV instala los nuevos multiplexores de VideoSwitch

Perú. Latina Televisión, uno de los broadcasters líderes del mercado peruano, incorporó dos multiplexores ISDB-Tb del fabricante argentino VideoSwitch, de referencia DMUX-3100 en configuración Main +...

Broadcasters construyen reconocimiento en streaming

Broadcasters construyen reconocimiento en streaming

Latinoamérica. El público puede pasar de la plataforma de un broadcaster al canal de un creador, de un momento deportivo en redes sociales a una película en una plataforma de streaming, o de un...

IA se prepara para cobrar por resultados y no por consultas

IA se prepara para cobrar por resultados y no por consultas

Latinoamérica. Durante los últimos años, el negocio de la inteligencia artificial se ha basado principalmente en el consumo: número de consultas efectuadas, volumen de texto procesado o licencias...

Congo Films y Telemedellín tendrán diplomados sobre cine

Congo Films y Telemedellín tendrán diplomados sobre cine

Colombia. Telemedellín Academy y Congo Films School lanzaron una serie de diplomados dirigidos a profesionales y personas interesadas en el sector audiovisual de la ciudad de Medellín.

Google DeepMind y A24 desarrollarán flujos de trabajo para cine

Google DeepMind y A24 desarrollarán flujos de trabajo para cine

Latinoamérica. Google DeepMind y A24 anuncian una colaboración pionera centrada en la investigación. La colaboración combina un laboratorio de investigación con el estudio más orientado al cineasta...

Lanzan seguridad de streaming para la era de la IA

Lanzan seguridad de streaming para la era de la IA

Latinoamérica. Nagravision presentó NAGRA Venturi, una solución de seguridad de streaming basada en inteligencia que ayuda a los proveedores de servicios y titulares de derechos a detectar amenazas,...

BVS suma marcas de Chauvet a su portafolio

BVS suma marcas de Chauvet a su portafolio

Argentina. BVS alcanzó una alianza estratégica con Chauvet, por medio de la cual se convierte en su Distribuidor Oficial y ampliando así su propuesta de valor para la industria Broadcast & Media.

Suscribase Gratis

SUSCRÍBASE AL INFO-BOLETIN

• Gane 25 Puntos de Lealtad •

¿REQUIERE UNA COTIZACIÓN?

ENTREVISTAS DESTACADAS

PATROCINADORES

ULTIMO BOLETIN

Ultimo Info-Boletin