Este 'software' hará que digas en vídeo lo que jamás dirías en persona
Todos conocemos las posibilidades del Photoshop: rostros tan retocados que ni los propios implicados se reconocen, michelines que desaparecen o tallas que crecen o menguan, según la parte del cuerpo de que se trate. También conocemos los gazapos de los duendes digitales: dedos que desaparecen, brazos en posturas imposibles o personas con tres piernas.
La manipulación de imágenes es tan antigua como la propia fotografía, comenzando por un famoso retrato de Abraham Lincoln en el que su cuerpo era en realidad el de otra persona. Dictadores como Stalin, Mao y Hitler fueron famosos por eliminar de las fotos a los personajes caídos en desgracia. En otros casos se hacía lo contrario, añadir mediante recortes a los que no habían podido posar para la foto de grupo.
Los medios digitales han facilitado a los diseñadores una poderosa herramienta, pero su uso también genera polémica cuando se emplean para crear modelos imposibles de belleza. Y por otra parte, los montajes fotográficos son tan populares en internet que hoy una imagen ya no vale más que mil palabras; debemos andarnos con tiento a la hora de valorar la autenticidad de un documento gráfico.
El retoque de vídeos tampoco es una técnica novedosa. Una gran parte del cine actual, si no todo, depende de los efectos digitales añadidos después del rodaje: cromas, personajes de animación o incluso casi todo lo que rodea al único actor real, como en la reciente versión de El libro de la selva. La manipulación de vídeos tampoco es algo exclusivo del cine comercial; un caso famoso de engaño fue el elaborado montaje que mostraba un presunto ovni sobre la ciudad de Jerusalén.
TRANSPLANTE DE CARA
Sin embargo, los vídeos en general no levantan tanta suspicacia como las fotos, tal vez porque su manipulación es más compleja. Al menos podemos tener la certeza de que, si un vídeo muestra a una persona diciendo algo ante una cámara, el documento es legítimo. O así era hasta ahora: un equipo de ingenieros de computación de la Universidad de Stanford (Estados Unidos), el Instituto Max Planck de Informática y la Universidad de Erlangen-Nuremberg (Alemania) está desarrollando una herramienta de software con la que ya nada volverá a ser lo mismo.
Hasta ahora teníamos antecedentes como la appFace Swap Live, disponible para Apple y Android. Esta aplicación intercambia partes del rostro entre dos personas en vídeo y en tiempo real, de manera que se pueden poner las palabras de alguien en la cara de otro. El efecto puede ser divertido, pero la falsificación es muy evidente, ya que el resultado es un pastiche de facciones sin ninguna pretensión de realismo.
Por el contrario, lo que han conseguido los investigadores dirigidos por el alemán Matthias Niessner es un efecto de un realismo casi increíble. "La mayoría de los rastreadores de caras en tiempo real que existen hoy se basan en rasgos sueltos, y por tanto capturan sólo un modelo tosco del rostro", expone Niessner a El Huffington Post. "Nuestro abordaje trata de utilizar toda la información disponible en la captura, es decir, cada píxel".
El software desarrollado por Niessner y sus colaboradores permite editar cualquier vídeo utilizando un ordenador normal con una webcam estándar. La cámara captura la imagen de la persona fuente, aquella cuyas expresiones se van a trasplantar al rostro de la persona objetivo.
El software necesita grabar unos 15 segundos de vídeo para recoger un repertorio de gestualización. El sistema avanzado de reconocimiento facial crea un modelo de la cara en 3D, una especie de máscara virtual. A continuación, transfiere las expresiones de la fuente al objetivo mediante procedimientos de animación.
Como ejemplos, los investigadores muestran vídeos en los que manipulan las expresiones de personajes como George W. Bush, Arnold Schwarzenegger, Donald Trump o Vladimir Putin. "El modelo sintético resultante se parece tanto al original que es difícil diferenciar entre la cara sintetizada y la real", dice Niessner. "Los resultados son difíciles de distinguir de la realidad, y a menudo pasa inadvertido que el contenido no es real".
El único problema surge cuando el rostro que se va a alterar carece de una expresión en su repertorio habitual; sucede, por ejemplo, con Putin. Dado que es difícil verle sonreír, la reconstrucción del gesto que realiza el software a partir del rostro fuente resulta antinatural, casi aterradora.
REALIDAD VIRTUAL, CADA VEZ MÁS REAL
Sin embargo, Niessner aclara que su intención no es facilitar la suplantación: "El vídeo de demostración está puramente orientado a la investigación; nuestro objetivo es demostrar las capacidades de la tecnología de gráficos y la visión por ordenador, y transmitirlo de una manera aprovechable y divertida". Los investigadores están interesados en mostrar cómo la computación actual puede crear modelos matemáticos del mundo que permiten interactuar con él, entenderlo y reconstruirlo.
En este campo, las técnicas de realidad aumentada y virtual están aportando grandes avances, como lo demuestra el hecho de que los nuevos sistemas de realidad virtual fueran las grandes estrellas en la reciente edición de la feria Mobile World Congress de Barcelona. La reconstrucción de objetos deformables que ofrece el software de Niessner y sus colaboradores es una innovación que aumentará el realismo de las animaciones.
De hecho, Niessner asegura que una de las aplicaciones de su trabajo será precisamente la detección del fraude en vídeos retocados, ya que las expresiones reales del rostro y las transiciones entre ellas son únicas para cada persona, "algo similar al análisis de la escritura", dice. Comparando un vídeo con otro de referencia de la misma persona, los investigadores podrán detectar inconsistencias que les sirvan para descubrir si el clip de prueba es real o está manipulado.
DOBLAJES MÁS NATURALES
Naturalmente, la principal aplicación de este trabajo será probablemente el cine. "Los vídeos generados por ordenador han sido parte del cine comercial durante más de 30 años", señala Niessner. "Prácticamente todas las grandes producciones contienen un porcentaje significativo de contenido generado sintéticamente, desde El señor de los anillos a El curioso caso de Benjamin Button".
Aunque ya existen técnicas de animación que permiten transferir las expresiones humanas a un avatar virtual, estos sistemas requieren dispositivos especiales y complejos que deben montarse sobre el cuerpo o la cara del actor. El nuevo software permitirá trasplantar los gestos faciales de un actor a otro sin utilizar más aparatos que un ordenador y una webcam, lo que podría aplicarse también a la modificación del movimiento de la boca para adaptarlos al doblaje y conseguir un efecto más natural. Otro ámbito a explorar será el de los videojuegos, donde el movimiento de un jugador podrá transferirse a su avatar virtual con un resultado realista.
No todos los usos potenciales de este software son recreativos. Niessner apunta que también podría aprovecharse para la investigación médica. De hecho, el ingeniero precisa que el proyecto partió originalmente de este ámbito, en concreto del análisis facial para estudiar la cicatrización en las operaciones de labio leporino. El rastreo de partes corporales u órganos durante los procesos quirúrgicos o el examen de las expresiones faciales en pacientes de trastornos psicológicos son dos de las posibles utilidades del programa creado por Niessner y su equipo. "Esperamos que disfrutéis viendo el vídeo y que os llevéis un mensaje positivo", concluye el investigador.