GauGAN: NVIDIA AI zamienia szkice w fotorealistyczne krajobrazy

Zrzut ekranu-demo-NVIDIA-GauGAN-AI

Kontynuujemy informacje o Konferencji Technologicznej GPU po ogłoszeniu komputera jednopokładowego Nvidia Jetson Nano 99 dolarów przeznaczonych na wdrażanie aplikacji w sztucznej inteligencji dla programistów, badaczy i hobbystów.

W tym samym GTC 2019 Nvidia, globalny dostawca procesorów i układów graficznych ujawnił twórcę obrazu animowanego przez sztuczną inteligencję. Oprogramowanie o nazwie GauGAN przez jej projektantów, przedstawia przegląd możliwości oferowanych przez platformy sieci neuronowych Nvidii.

Ta AI opiera się na wnioskach z systemu Pix2Pix wprowadzonego w zeszłym roku które mogą reprezentować wirtualne światy, powiedział Bryan Catanzaro, wiceprezes Nvidii ds. badań stosowanych w głębokim uczeniu się, ale Pix2Pix nie może malować krajobrazów, ponieważ pozostawia to artefakty w powstałym obrazie.

GauGAN jest zaprojektowany tak, aby w kilka sekund wykonać szkic i zamienić go w fotorealistyczny obraz. GauGAN oferuje trzy narzędzia: wiadro z farbą, długopis i ołówek.

Demonstracja GauGAN w bieżącej edycji Konferencji GPU Technology śledź uruchomieniew połowie poprzedniego miesiąca, ze strony, która pokazuje portrety ludzkich twarzy wygenerowane przez sztuczną inteligencję.

Warto zaznaczyć, że pod koniec ubiegłego roku firma przedstawiła już sztuczną inteligencję zdolną do generowania ludzkich twarzy niepokojącej rzeczywistości.

Koncepcja GAN

Wspólnym mianownikiem tych inicjatyw z oprogramowaniem GauGAN jest koncepcja GAN.

GAN to model generatywny, w którym dwie sieci konkurują ze sobą w scenariuszu teorii gier.

Pierwsza sieć to generator, generuje próbkę (na przykład obraz), podczas gdy jego przeciwnik, dyskryminator, próbuje wykryć, czy próbka jest prawdziwa, czy też jest wynikiem działania generatora.

Uczenie się można modelować jako grę o sumie zerowej. Te programy komputerowe konkurują ze sobą miliony razy, aby poprawić umiejętności obrazowania dopóki nie będą mieć możliwości tworzenia pełnych obrazów.

Mówiąc najprościej, GAN oznacza, że ​​dwie sieci działają przeciwko sobie.

Najpierw podawane są nieprzetworzone dane, które są dekomponowane. Z tego tszczur stworzyć obraz. Lnastępnie wyślij go do innej sieci że ma tylko prawdziwe zdjęcia lub obrazy w swojej bazie danych. Ta druga sieć dokona oceny obrazu i poinformuje pierwszą.

Jeśli obraz nie wygląda tak, jak oczekiwany wynik, pierwszy algorytm wznawia proces. Jeśli dojdzie do dopasowania, zostaniesz poinformowany, że jesteś na dobrej drodze i ostatecznie zrozumiesz, czym jest dobry wizerunek.

Czy tak to działa GauGAN

Po dostatecznym przeszkoleniu możesz tworzyć obrazy w łańcuchu. Według danych opublikowanych przez Nvidię, dyskryminator działający w tle oprogramowania GauGAN posiada bazę danych zawierającą milion obrazów przyrody.

GauGAN może zaoferować potężne narzędzie do tworzenia wirtualnych światów. Nawet w tej ograniczonej wersji demonstracyjnej jest jasne, że oprogramowanie zbudowane wokół tych umiejętności spodoba się każdemu, od projektantów gier wideo, przez architektów, po zwykłych graczy.

Dzięki sztucznej inteligencji, która rozumie, jak wygląda prawdziwy świat, ci specjaliści mogliby lepiej prototypować swoje pomysły i wprowadzać szybkie zmiany na syntetycznej scenie.

Firma nie planuje udostępnić go komercyjnie, ale może wkrótce uruchomić publiczną wersję próbną, aby umożliwić każdemu korzystanie z oprogramowania.

Poprzez demo oprogramowania GauGAN, Nvidia podkreśla zalety użytkowania technologii opartych na GAN, Ale trzeba powiedzieć, że ten zestaw technik może być również używany do złowrogich celów.

Deepfakes (obrazy generowane komputerowo nałożone na inne lub istniejące filmy) są częścią tej partii i złośliwe strony trzecie ufają im w rozpowszechnianiu fałszywych wiadomości i oszustw.

Nvidia utrzymuje platformę internetową AI Playground. Wymienia projekty, które firma podejmuje w zakresie sztucznej inteligencji, a internauci mają możliwość uruchomienia demonstracji.


Komentarz, zostaw swój

Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.

  1.   Marcela powiedział

    Fajnie