GauGAN: la AI de NVIDIA convierte bocetos en paisajes fotorrealistas

Continuamos con las noticias de la GPU Technology Conference después del anuncio de la computadora de una sola plataca Nvidia Jetson Nano de $ 99 dedicada a la implementación de aplicaciones en inteligencia artificial para desarrolladores, investigadores y aficionados.

En este mismo GTC 2019, Nvidia, el proveedor global de procesadores y chips de gráficos reveló un creador de imágenes animado por inteligencia artificial. El software llamado GauGAN por sus diseñadores, ofrece una visión general de las posibilidades que ofrecen las plataformas de redes neuronales de Nvidia.

Esta AI se basa en los aprendizajes del sistema Pix2Pix introducido el año pasado que puede representar mundos virtuales, dijo la vicepresidenta de investigación de aprendizaje profundo aplicado Bryan Catanzaro de Nvidia, pero Pix2Pix no puede pintar paisajes porque al hacerlo deja artefactos en la imagen resultante.

GauGAN está diseñado para realizar un boceto y convertirlo en una imagen fotorrealista en segundos. GauGAN ofrece tres herramientas: un cubo de pintura, una pluma y un lápiz.

La demostración de GauGAN en la edición actual de la GPU Technology Conference sigue el lanzamiento, a mitad del mes anterior, de un sitio que muestra retratos de rostros humanos generados por inteligencia artificial.

Cabe señalar que, a fines del año anterior, la compañía ya había presentado una inteligencia artificial capaz de generar rostros humanos de una realidad preocupante.

Concepto GAN

El denominador común de estas iniciativas con el software GauGAN es el concepto GAN.

Un GAN es un modelo generativo en el que dos redes compiten en un escenario de teoría de juegos.

La primera red es el generador, genera una muestra (por ejemplo, una imagen), mientras que su adversario, el discriminador, intenta detectar si una muestra es real o si es el resultado del generador.

El aprendizaje puede ser modelado como un juego de suma cero. Estos programas de computadora compiten millones de veces para mejorar sus habilidades de imagen hasta que tengan la capacidad de crear imágenes completas.

En pocas palabras, GAN significa que dos redes funcionan una contra la otra.

Primero se alimenta con datos en bruto que se descompone. A partir de estos, trata de crear una imagen. Luego lo envía a otra red que, solo tiene fotos o imágenes reales en su base de datos. Esta segunda red hará un juicio de la imagen e informará a la primera.

Si la imagen no se parece al resultado esperado, el primer algoritmo reanuda el proceso. Si hay una coincidencia, se le informa que está en el camino correcto y termina por entender qué es una buena imagen.

Así es como funciona GauGAN

Una vez que está suficientemente entrenado, puede producir imágenes en la cadena. Según los datos publicados por Nvidia, el discriminador que se ejecuta en el fondo del software GauGAN tiene una base de datos de un millón de imágenes de la naturaleza.

GauGAN podría ofrecer una herramienta poderosa para crear mundos virtuales. Incluso en esta demostración limitada, está claro que el software creado en torno a estas habilidades atraería a todos, desde diseñadores de videojuegos hasta arquitectos y jugadores ocasionales.

Con una inteligencia artificial que entiende cómo se ve el mundo real, estos profesionales podrían hacer un mejor prototipo de sus ideas y hacer cambios rápidos en una escena sintética.

La compañía no tiene planes de lanzarlo comercialmente, pero pronto podría lanzar una prueba pública para permitir que cualquiera use el software.

A través de la demostración del software GauGAN, Nvidia destaca los aspectos positivos del uso de las tecnologías que se basan en la GAN, pero debe decirse que este conjunto de técnicas también se puede utilizar para fines siniestros.

Deepfakes (imágenes generadas por computadora superpuestas en otros o en videos existentes) son parte de este lote y terceros malintencionados confían en ellos para difundir noticias falsas y engaños.

Nvidia mantiene la plataforma en línea AI Playground. Enumera los proyectos en los que se lanza la compañía en términos de inteligencia artificial y los usuarios de Internet tienen la oportunidad de lanzar demostraciones.


Sé el primero en comentar