GauGAN: Ginagawa ng NVIDIA AI ang mga sketch sa mga photorealistic na landscape

Nagpapatuloy kami sa balita ng Conference ng Teknolohiya ng GPU pagkatapos ng anunsyo ng solong platform computer Nvidia Jetson Nano ng $ 99 na nakatuon sa pagpapatupad ng mga application sa artipisyal na intelihensiya para sa mga developer, mananaliksik at libangan.

Sa parehong GTC 2019 na ito, Nvidia, ang pandaigdigang tagabigay ng mga processor at graphics chip nagsiwalat ng isang tagagawa ng imahe na animated ng artipisyal na katalinuhan. Tinawag ang software GauGAN ng mga tagadisenyo nito, nagbibigay ng isang pangkalahatang-ideya ng mga posibilidad na inaalok ng mga Nvidia neural network platform.

Ang AI na ito bumubuo sa mga natututo mula sa sistemang Pix2Pix na ipinakilala noong nakaraang taon na maaaring kumatawan sa mga virtual na mundo, sinabi ng bise presidente ng Nvidia ng inilapat na pagsasaliksik sa malalim na pag-aaral na si Bryan Catanzaro, ngunit ang Pix2Pix ay hindi maaaring magpinta ng mga landscape dahil ang paggawa nito ay nag-iiwan ng mga artifact sa nagresultang imahe.

Ang GauGAN ay idinisenyo upang makagawa ng isang sketch at gawin itong isang photorealistic na imahe sa ilang segundo. Nag-aalok ang GauGAN ng tatlong mga tool: isang pintura na balde, isang bolpen, at isang lapis.

Ang GauGAN Demonstration sa kasalukuyang edisyon ng GPU Technology Conference sundin ang paglulunsad, sa kalagitnaan ng nakaraang buwan, mula sa isang site na nagpapakita ng mga larawan ng mga mukha ng tao na nabuo ng artipisyal na katalinuhan.

Dapat pansinin na, sa pagtatapos ng nakaraang taon, ang kumpanya ay nagpakita na ng isang artipisyal na intelihensiya na may kakayahang bumuo ng mga mukha ng tao ng isang nababahalang katotohanan.

Konsepto ng GAN

Ang karaniwang denominator ng mga hakbangin na ito na may GauGAN software ay ang konsepto ng GAN.

Ang isang GAN ay isang generative na modelo kung saan dalawang mga network ang nakikipagkumpitensya sa isang senaryo ng teorya ng laro.

Ang unang network ay ang generator, bumubuo ng isang sample (halimbawa, isang imahe), habang ang kalaban nito, ang diskriminasyon, ay sumusubok na tuklasin kung ang isang sample ay totoo o kung ito ang resulta ng generator.

Ang pag-aaral ay maaaring ma-modelo bilang isang zero-sum game. Ang mga programang ito sa computer ay nakikipagkumpitensya ng milyun-milyong beses upang mapabuti ang iyong mga kasanayan sa imaging hanggang sa magkaroon sila ng kakayahang lumikha ng kumpletong mga imahe.

Sa madaling salita, nangangahulugan ang GAN na ang dalawang mga network ay gumagana laban sa bawat isa.

Una itong pinakain ng hilaw na data na nabubulok. Mula sa mga ito, tdaga lumikha ng isang imahe. Lpagkatapos ipadala ito sa ibang network iyon, mayroon lamang itong mga tunay na larawan o larawan sa database nito. Ang pangalawang network na ito ay gagawa ng paghuhusga ng imahe at ipapaalam sa una.

Kung ang imahe ay hindi katulad ng inaasahang resulta, ipagpapatuloy ng unang algorithm ang proseso. Kung mayroong isang tugma, malalaman mo na ikaw ay nasa tamang landas at nauunawaan mo kung ano ang isang magandang imahe.

Ganyan ba ito gumagana GauGAN

Kapag ikaw ay sapat na nagsanay, makakagawa ka ng mga imahe sa kadena. Ayon sa data na inilathala ng Nvidia, ang diskriminasyon na tumatakbo sa background ng GauGAN software ay may isang database ng isang milyong mga imahe ng kalikasan.

Maaaring mag-alok ang GauGAN ng isang malakas na tool para sa paglikha ng mga virtual na mundo. Kahit na sa limitadong demo na ito, malinaw na ang software na binuo sa paligid ng mga kasanayang ito maaakit nito ang lahat mula sa mga tagadisenyo ng video game sa mga arkitekto sa mga kaswal na manlalaro.

Sa pamamagitan ng isang artipisyal na intelihensiya na nauunawaan kung ano ang hitsura ng totoong mundo, ang mga propesyonal na ito ay maaaring mas mahusay na prototype ang kanilang mga ideya at gumawa ng mabilis na pagbabago sa isang synthetic na eksena.

Ang kumpanya ay walang plano na palabasin ito sa komersyo, ngunit maaaring maglunsad ng isang pampublikong pagsubok upang payagan ang sinuman na gamitin ang software.

Sa pamamagitan ng demo ng software ng GauGAN, Nvidia-highlight ang mga positibong paggamit ng mga teknolohiya na batay sa GAN, Ngunit dapat sabihin na ang hanay ng mga diskarteng ito ay maaari ding gamitin para sa malaswang hangarin.

Deepfakes (Ang mga imaheng nabuo ng computer na na-superimpose sa iba o mayroon nang mga video) ay bahagi ng lote na ito at pinagkakatiwalaan ng mga nakakahamak na third party upang kumalat ng maling balita at panloloko.

Pinapanatili ng Nvidia ang Ai Playground online platform. Inililista nito ang mga proyektong inilulunsad ng kumpanya sa mga tuntunin ng artipisyal na katalinuhan at ang mga gumagamit ng internet ay may pagkakataon na maglunsad ng mga demo.

DesdeLinux

GauGAN: Ginagawa ng NVIDIA AI ang mga sketch sa photorealistic landscapes

Konsepto ng GAN

Ganyan ba ito gumagana GauGAN

Iwanan ang iyong puna Ikansela ang tugon