GauGAN: NVIDIA AI förvandlar skisser till fotorealistiska landskap

Vi fortsätter med nyheterna om GPU Technology Conference efter tillkännagivandet av en-däcksdatorn Nvidia Jetson Nano på $ 99 dedikerade till implementering av applikationer i artificiell intelligens för utvecklare, forskare och hobbyister.

I samma GTC 2019, Nvidia, den globala leverantören av processorer och grafikchips avslöjade en bildmakare animerad av artificiell intelligens. Programvaran kallas GauGAN av dess designers ger en översikt över de möjligheter som Nvidias neurala nätverksplattformar erbjuder.

Denna AI bygger på lärdomar från Pix2Pix-systemet som introducerades förra året som kan representera virtuella världar, säger Nvidias vice vd för tillämpad djupinlärningsforskning Bryan Catanzaro, men Pix2Pix kan inte måla landskap eftersom det gör artefakter i den resulterande bilden.

GauGAN är utformad för att göra en skiss och förvandla den till en fotorealistisk bild på några sekunder. GauGAN erbjuder tre verktyg: en färgskopa, en penna och en penna.

GauGAN-demonstrationen i den nuvarande upplagan av GPU Technology Conference följ lanseringen, i mitten av föregående månad, från en webbplats som visar porträtt av mänskliga ansikten som genereras av artificiell intelligens.

Det bör noteras att företaget i slutet av föregående år redan hade presenterat en artificiell intelligens som kunde skapa mänskliga ansikten med en oroande verklighet.

GAN-koncept

Gemensamma nämnare för dessa initiativ med GauGAN-programvara är GAN-konceptet.

Ett GAN är en generativ modell där två nätverk konkurrerar i ett spelteorisscenario.

Det första nätverket är generatorn, genererar ett exempel (till exempel en bild), medan dess motståndare, diskriminatorn, försöker upptäcka om ett prov är verkligt eller om det är resultatet av generatorn.

Lärande kan modelleras som ett nollsummaspel. Dessa datorprogram tävlar miljontals gånger för att förbättra dina bildkunskaper tills de har möjlighet att skapa kompletta bilder.

Enkelt uttryckt betyder GAN att två nätverk fungerar mot varandra.

Det matas först rådata som sönderdelas. Från dessa, tråtta skapa en bild. Lskicka den sedan till ett annat nätverk det har bara riktiga foton eller bilder i sin databas. Detta andra nätverk kommer att bedöma bilden och informera den första.

Om bilden inte ser ut som det förväntade resultatet fortsätter den första algoritmen processen. Om det finns en match, informeras du om att du är på rätt väg och slutar med att förstå vad en bra bild är.

Är det så det fungerar GauGAN

När du väl är utbildad kan du producera bilder i kedjan. Enligt uppgifter publicerade av Nvidia, den diskriminator som körs i bakgrunden av GauGAN-programvaran har en databas med en miljon bilder av naturen.

GauGAN kan erbjuda ett kraftfullt verktyg för att skapa virtuella världar. Även i denna begränsade demo är det uppenbart att programvaran bygger på dessa färdigheter det skulle tilltala alla från videospeldesigners till arkitekter till avslappnade spelare.

Med en artificiell intelligens som förstår hur den verkliga världen ser ut, kan dessa proffs bättre prototyper sina idéer och göra snabba förändringar i en syntetisk scen.

Företaget har inga planer på att släppa det kommersiellt, men skulle snart kunna starta ett offentligt test för att låta vem som helst använda programvaran.

Genom GauGAN-programvarudemo, Nvidia lyfter fram positiva användningsområden av teknik som är baserad på GAN, Men det måste sägas att denna uppsättning tekniker också kan användas för olyckliga ändamål.

Deepfakes (datorgenererade bilder ovanpå andra eller befintliga videor) är en del av detta parti och litas av skadliga tredje parter att sprida falska nyheter och bluffar.

Nvidia underhåller onlineplattformen AI Playground. Den listar de projekt som företaget sätter igång med avseende på artificiell intelligens och internetanvändare har möjlighet att starta demos.

DesdeLinux

GauGAN: NVIDIA AI förvandlar skisser till fotorealistiska landskap

GAN-koncept

Är det så det fungerar GauGAN

Lämna din kommentar Avbryt svar