GauGAN: NVIDIA AI forvandler skitser til fotorealistiske landskaber

NVIDIA-GauGAN-AI-demo-skærmbillede

Vi fortsætter med nyheden om GPU Technology Conference efter annonceringen af ​​single-deck-computeren Nvidia Jetson Nano på $ 99 dedikeret til implementering af applikationer i kunstig intelligens til udviklere, forskere og hobbyister.

I den samme GTC 2019, Nvidia, den globale udbyder af processorer og grafikchips afslørede en billedproducent animeret af kunstig intelligens. Den kaldte software Gaugan af dets designere, giver et overblik over de muligheder, som Nvidias neurale netværksplatforme tilbyder.

Denne AI bygger på læring fra Pix2Pix-systemet, der blev introduceret sidste år der kan repræsentere virtuelle verdener, sagde Nvidias vicepræsident for anvendt dyb læringsforskning Bryan Catanzaro, men Pix2Pix kan ikke male landskaber, fordi det efterlader artefakter i det resulterende billede.

GauGAN er designet til at lave en skitse og gøre det til et fotorealistisk billede på få sekunder. GauGAN tilbyder tre værktøjer: en malingsspand, en pen og en blyant.

GauGAN-demonstrationen i den aktuelle udgave af GPU Technology Conference følg lanceringeni midten af ​​den foregående måned, fra et websted, der viser portrætter af menneskelige ansigter genereret af kunstig intelligens.

Det skal bemærkes, at virksomheden i slutningen af ​​det foregående år allerede havde præsenteret en kunstig intelligens, der var i stand til at skabe menneskelige ansigter med en bekymrende virkelighed.

GAN koncept

Fællesnævneren for disse initiativer med GauGAN-software er GAN-konceptet.

Et GAN er en generativ model, hvor to netværk konkurrerer i et spilteori-scenarie.

Det første netværk er generatoren, genererer en prøve (for eksempel et billede), mens dens modstander, diskriminatoren, forsøger at opdage, om en prøve er reel, eller om den er resultatet af generatoren.

Læring kan modelleres som et nulsumsspil. Disse computerprogrammer konkurrerer millioner af gange om at forbedre dine billedbehandlingsevner indtil de har evnen til at oprette komplette billeder.

Kort sagt betyder GAN, at to netværk arbejder mod hinanden.

Det tilføres først rådata, der nedbrydes. Fra disse trotte oprette et billede. Lsend det derefter til et andet netværk det har kun rigtige fotos eller billeder i sin database. Dette andet netværk vurderer billedet og informerer det første.

Hvis billedet ikke ligner det forventede resultat, genoptager den første algoritme processen. Hvis der er et match, informeres du om, at du er på rette vej, og du ender med at forstå, hvad et godt image er.

Er det sådan, det fungerer Gaugan

Når du er uddannet tilstrækkeligt, kan du producere billeder i kæden. Ifølge data offentliggjort af Nvidia, den diskriminator, der kører på baggrund af GauGAN-softwaren, har en database med en million billeder af naturen.

GauGAN kunne tilbyde et kraftfuldt værktøj til at skabe virtuelle verdener. Selv i denne begrænsede demo er det klart, at softwaren er bygget op omkring disse færdigheder det ville appellere til alle fra designere af videospil til arkitekter til afslappede spillere.

Med en kunstig intelligens, der forstår, hvordan den virkelige verden ser ud, kunne disse professionelle bedre prototype deres ideer og foretage hurtige ændringer i en syntetisk scene.

Virksomheden har ingen planer om at frigive det kommercielt, men kan snart lancere en offentlig prøveversion for at tillade nogen at bruge softwaren.

Gennem GauGAN-softwaredemoen, Nvidia fremhæver det positive ved brugen af teknologier, der er baseret på GAN, Men det skal siges, at dette sæt teknikker også kan bruges til uhyggelige formål.

Deepfakes (computergenererede billeder overlejret på andre eller eksisterende videoer) er en del af denne batch og er tillid af ondsindede tredjeparter til at sprede falske nyheder og hoaxes.

Nvidia vedligeholder AI Playground online platform. Den viser de projekter, som virksomheden lancerer med hensyn til kunstig intelligens, og internetbrugere har mulighed for at starte demoer.


Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.

  1.   Marcela sagde han

    Hvor sej