Meta nos acerca un paso más a las películas generadas por IA

Al igual que el director de «Los Vengadores», Joe Russo, estoy cada vez más convencido de que las películas y los programas de televisión producidos enteramente por inteligencia artificial serán posibles durante nuestras vidas.

Una serie de descubrimientos de IA en los últimos meses, en particular el motor hiperrealista de conversión de texto a voz de OpenAI, han dejado entrever esta nueva y valiente frontera. pero muerto anuncio Hoy estamos poniendo el futuro del contenido generado por IA en un estado particularmente relajado, al menos para mí.

Esta mañana, Meta presentó Emu Video, una evolución de la herramienta de creación de imágenes del gigante tecnológico, Emu. Con un título (por ejemplo, «Perro corriendo por una loma cubierta de hierba»), una foto o una imagen combinada con una descripción, Emu Video puede crear un clip animado de cuatro segundos.

Los vídeos de Emu se pueden editar utilizando un modelo de IA complementario llamado Emu Edit, que también se anunció hoy. Los usuarios pueden describir las ediciones que desean realizar en Emu Edit en lenguaje natural (por ejemplo, “mismo clip, pero en cámara lenta”) y ver los cambios reflejados en un video recién creado.

Ahora bien, la tecnología de generación de vídeo no es nueva. Meta ha intentado esto antes, al igual que Google. Mientras tanto, empresas emergentes como Runway ya están comenzando a crear negocios con él.

Pero los videos de 512 x 512 y 16 fps de Emu Video se encuentran fácilmente entre los mejores que he visto en términos de fidelidad, hasta el punto de que a mi ojo inexperto le resulta difícil distinguirlos de los reales.

Créditos de imagen: muerto

Bueno, al menos algunos de ellos. Emu Video parece tener más éxito animando escenas simples, en su mayoría estáticas (como cascadas y time-lapses del horizonte de una ciudad) que se desvían del realismo, es decir, en estilos como el cubismo, el anime y la «artesanía con papel recortado». y steampunk. Un vídeo de la Torre Eiffel al amanecer «como un cuadro», con la torre reflejada en el Sena debajo, me recordó a una tarjeta electrónica que podrías ver en ella. saludo americano.

Vídeo emo

Créditos de imagen: muerto

Sin embargo, incluso en el mejor trabajo de Emu Video, la rareza inducida por la IA logra infiltrarse, como físicas extrañas (como patinetas que se mueven paralelas al suelo) y apéndices extraños (dedos de los pies y piernas que se curvan detrás de los pies y piernas que se mezclan entre sí). ). Las cosas a menudo aparecen y desaparecen de la vista sin mucha lógica, como los pájaros que vuelan sobre nosotros en el clip de la Torre Eiffel antes mencionado.

READ  Mobile World Congress 2023: Showcase está de vuelta con un cambio hacia B2B

Después de pasar mucho tiempo explorando las creaciones de Emu Video (o al menos los ejemplos que Meta ha elegido cuidadosamente), comencé a notar otra señal clara: los temas en los clips no… bueno, Hacer mucho. Hasta donde puedo decir, Emu Video no parece tener un buen conocimiento de los verbos de movimiento, quizás una limitación de la arquitectura básica del modelo.

Vídeo emo

Créditos de imagen: muerto

Por ejemplo, el simpático mapache antropomórfico del vídeo de Emu llevaría una guitarra, pero no rasguear Guitarra, incluso si el título del clip incluye la palabra «cuerda». O dos unicornios “jugarán” al ajedrez, pero sólo en el sentido de que se sentarán con curiosidad frente al tablero sin mover las piezas.

Vídeo emo

Créditos de imagen: muerto

Así que claramente hay trabajo por hacer. Sin embargo, el metraje en bruto más básico de Emu Video Yo diría que hoy en día no estaría fuera de lugar en una película o programa de televisión, y las consecuencias morales de eso, francamente, me aterrorizan.

Vídeo emo

Créditos de imagen: muerto

Dejando a un lado los peligros de los deepfakes, temo por los animadores y artistas cuyo sustento depende de la creación de los tipos de escenas que la IA como Emu Video ahora puede aproximar. Meta y sus competidores de IA probablemente argumentarán que Emu Video es la empresa del CEO de Meta, Mark Zuckerberg. Él dice Está integrado en Facebook e Instagram (con suerte para mejor). Filtros de toxicidad A partir de metaetiquetas generadas por IA), más en lugar de reemplazar Artistas humanos. Pero yo diría que es una visión optimista, si no falsa, especialmente cuando se trata de dinero.

READ  Prepárate para el combate espacial con la última versión MR de Valo Motion Astro Blade

A principios de este año, Netflix utilizó imágenes de fondo generadas por IA en un corto animado de tres minutos. Compañía reclamado Esa tecnología podría ayudar a resolver la supuesta escasez de mano de obra en el anime, pero ignora convenientemente cómo los bajos salarios y las agotadoras condiciones laborales a menudo dejan a los artistas sin trabajo.

En una controversia similar, el estudio detrás de la secuencia de créditos de Marvel’s Secret Invasion admitió haber utilizado inteligencia artificial, específicamente la herramienta de conversión de texto a imagen Midjourney, para crear gran parte del arte de la secuencia. El director de la serie, Ali Selim, confirmó que el uso de inteligencia artificial encaja con los temas paranoicos de la serie, pero la mayor parte de la comunidad de artistas y fans Muy en desacuerdo.

Vídeo emo

Créditos de imagen: muerto

Los actores también podrían estar a punto de morir. Uno de los principales puntos conflictivos en la reciente huelga de SAG-AFTRA fue el uso de inteligencia artificial para crear formularios digitales. Los estudios finalmente acordaron pagar a los actores por sus imágenes generadas por IA. ¿Pero podrían reconsiderarlo a medida que la tecnología mejore? Creo que es probable.

Para empeorar las cosas, la IA como Emu Video generalmente se entrena con imágenes y videos producidos por artistas, fotógrafos y cineastas, y sin que estos creadores sean notificados o compensados. en libros blancos Al acompañar el lanzamiento de Emu Video, Meta solo dice que el modelo fue entrenado en un conjunto de datos de 34 millones de «pares de video y texto» que varían de 5 a 60 segundos de duración, sin mencionar de dónde provienen esos videos, sus estados de derechos de autor o si las licencias de Meta. a ellos.

Vídeo emo

Créditos de imagen: muerto

Ha habido vaivenes hacia estándares en toda la industria que permitan a los artistas “optar por no” recibir capacitación o recibir dinero por obras generadas por IA a las que han contribuido. Pero si Emu Video sirve de indicación, la tecnología, como suele suceder, pronto triunfará sobre la ética. Quizás este fuera realmente el caso.

READ  WWDC 2022 Episodio - 9to5Mac Happy Hour #385

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *