GauGAN: l'AI de NVIDIA converteix esbossos en paisatges fotorealistes

Continuem amb les notícies de la GPU Technology Conference després de l'anunci de l'ordinador d'una sola plataca Nvidia Jetson Nano de $ 99 dedicada a la implementació d'aplicacions en intel·ligència artificial per a desenvolupadors, investigadors i aficionats.

En aquest mateix GTC 2019, Nvidia, el proveïdor global de processadors i xips de gràfics revelar un creador d'imatges animat per intel·ligència artificial. El programari anomenat GauGAN pels seus dissenyadors, ofereix una visió general de les possibilitats que ofereixen les plataformes de xarxes neuronals de Nvidia.

aquesta AI es basa en els aprenentatges de sistema Pix2Pix introduït l'any passat que pot representar mons virtuals, va dir la vicepresidenta d'investigació d'aprenentatge profund aplicat Bryan Catanzaro de Nvidia, però Pix2Pix no pot pintar paisatges perquè a el fer-ho deixa artefactes en la imatge resultant.

GauGAN està dissenyat per realitzar un esbós i convertir-lo en una imatge fotorealista en segons. GauGAN ofereix tres eines: una galleda de pintura, una ploma i un llapis.

La demostració de GauGAN en l'edició actual de la GPU Technology Conference segueix el llançament, A meitat del mes anterior, d'un lloc que mostra retrats de rostres humans generats per intel·ligència artificial.

Cal assenyalar que, a finals de l'any anterior, la companyia ja havia presentat una intel·ligència artificial capaç de generar rostres humans d'una realitat preocupant.

concepte GAN

El denominador comú d'aquestes iniciatives amb el programari GauGAN és el concepte GAN.

Un GAN és un model generatiu en el qual dues xarxes competeixen en un escenari de teoria de jocs.

La primera xarxa és el generador, genera una mostra (per exemple, una imatge), mentre que el seu adversari, el discriminador, intenta detectar si una mostra és real o si és el resultat de l'generador.

L'aprenentatge pot ser modelat com un joc de suma zero. Aquests programes d'ordinador competeixen milions de vegades per millorar les seves habilitats d'imatge fins que tinguin la capacitat de crear imatges completes.

En poques paraules, GAN vol dir que dues xarxes funcionen una contra l'altra.

Primer s'alimenta amb dades en brut que es descompon. A partir d'aquests, trat de crear una imatge. Luego l'envia a una altra xarxa que, només té fotos o imatges reals a la base de dades. Aquesta segona xarxa farà un judici de la imatge i informarà a la primera.

Si la imatge no s'assembla a el resultat esperat, el primer algoritme reprèn el procés. Si hi ha una coincidència, se l'informa que està en el camí correcte i acaba per entendre què és una bona imatge.

Així és com funciona GauGAN

Una vegada que està prou entrenat, pot produir imatges a la cadena. Segons les dades publicades per Nvidia, el discriminador que s'executa en el fons de l'programari GauGAN té una base de dades d'un milió d'imatges de la natura.

GauGAN podria oferir una eina poderosa per crear mons virtuals. Fins i tot en aquesta demostració limitada, està clar que el programari creat al voltant d'aquestes habilitats atrauria a tots, des de dissenyadors de videojocs fins a arquitectes i jugadors ocasionals.

Amb una intel·ligència artificial que entén com es veu el món real, aquests professionals podrien fer un millor prototip de les seves idees i fer canvis ràpids en una escena sintètica.

La companyia no té plans de llançar comercialment, però aviat podria llançar una prova pública per permetre que qualsevol faci servir el programari.

A través de la demostració del programari GauGAN, Nvidia destaca els aspectes positius de l'ús de les tecnologies que es basen en la GAN, però s'ha de dir que aquest conjunt de tècniques també es pot utilitzar per a fins sinistres.

Deepfakes (Imatges generades per ordinador superposades en altres o en vídeos existents) són part d'aquest lot i tercers malintencionats confien en ells per difondre notícies falses i enganys.

Nvidia manté la plataforma en línia AI Playground. Enumera els projectes en què es llança la companyia en termes d'intel·ligència artificial i els usuaris d'Internet tenen l'oportunitat de llançar demostracions.

DesdeLinux

GauGAN: l'AI de NVIDIA converteix esbossos en paisatges fotorealistes

concepte GAN

Així és com funciona GauGAN

Deixa el teu comentari Cancel lar la resposta