El equipo de investigación de Adobe presentó una tecnología de escalado de imagen que hace que los vídeos se vean más nítidos y manteniendo la consistencia temporal.
De esa forma, ha logrado resolver el problema de imagen borrosa que generan las soluciones de este tipo.
VideoGigaGAN es un nuevo modelo de superrsolución de vídeo (VSR) con el que Adobe aborda el problema del escalado de imagen.
VIDEOGIGAGAN TERMINA CON LOS RESULTADOS BORROSOS
La decisión de sumar esta novedad radica en que, aunque este tipo de modelos mantienen la consistencia temporal, suelen generar resultados borrosos.
Para evitar este problema, la compañía de edición de ‘software’ ha recurrido a un muestrario de imágenes a gran escala, GigaGAN, para entrenar su nuevo modelo.
Esta utiliza una red generativa adversial para la generación de imágenes estáticas de resolución superior, pero su aplicación a los vídeo produce parpadeos.
ADOBE EMPLEÓ UN MÓDULO DE PROPAGACIÓN
Para evitar esto, y dado que inflar GigaGAN con módulos temporales no soluciona el problema, Adobe empleó un módulo de propagación de características guiado por flujo recurrente.
Mediante esta decisión, busca fomentar la agregación de información a través de diferentes fotogramas, como detallan en el texto de la investigación, publicado en Arxiv.org.
Esto se complementó con la aplicación de bloques de suavizado para abordar el parpadeo temporal y una lanzadera de alta frecuencia para añadir detalles a los vídeos.
UN MODELO VSR
El resultado es un modelo VSR que puede producir vídeos de alta calidad con una resolución hasta ocho veces superior a la original.
Esto es, de 128 x 128 a 1.024 x 1.024. El vídeo, además de mostrar una imagen detallada, también mantiene la consistencia temporal.
Fuente: EP.