GauGAN: NVIDIA AI biến các bản phác thảo thành phong cảnh chân thực

NVIDIA-GauGAN-AI-demo-ảnh chụp màn hình

Chúng tôi tiếp tục với tin tức về Hội nghị Công nghệ GPU sau khi công bố máy tính một tầng Nvidia Jetson Nano 99 đô la dành riêng cho việc triển khai các ứng dụng trong trí tuệ nhân tạo cho các nhà phát triển, nhà nghiên cứu và những người yêu thích.

Trong cùng GTC 2019 này, Nvidia, nhà cung cấp bộ vi xử lý và chip đồ họa toàn cầu tiết lộ một nhà sản xuất hình ảnh hoạt hình bằng trí tuệ nhân tạo. Phần mềm được gọi là Gaugan bởi các nhà thiết kế của nó, cung cấp một cái nhìn tổng quan về các khả năng được cung cấp bởi các nền tảng mạng thần kinh của Nvidia.

AI này được xây dựng dựa trên những bài học từ hệ thống Pix2Pix được giới thiệu vào năm ngoái Bryan Catanzaro, phó chủ tịch nghiên cứu học sâu ứng dụng của Nvidia cho biết có thể đại diện cho thế giới ảo, nhưng Pix2Pix không thể vẽ phong cảnh vì làm như vậy để lại các hiện vật trong hình ảnh kết quả.

GauGAN được thiết kế để tạo một bản phác thảo và biến nó thành một hình ảnh chân thực trong vài giây. GauGAN cung cấp ba công cụ: thùng sơn, bút và bút chì.

Cuộc biểu tình GauGAN trong phiên bản hiện tại của Hội nghị Công nghệ GPU theo dõi sự ra mắt, vào giữa tháng trước, từ một trang web hiển thị chân dung khuôn mặt người do trí tuệ nhân tạo tạo ra.

Cần lưu ý rằng, vào cuối năm trước, công ty đã trình làng một trí tuệ nhân tạo có khả năng tạo ra khuôn mặt người của một thực tế đáng lo ngại.

Khái niệm GAN

Mẫu số chung của những sáng kiến ​​này với phần mềm GauGAN là khái niệm GAN.

GAN là một mô hình chung trong đó hai mạng cạnh tranh trong một kịch bản lý thuyết trò chơi.

Mạng đầu tiên là máy phát, tạo một mẫu (ví dụ: một hình ảnh), trong khi đối thủ của nó, kẻ phân biệt, cố gắng phát hiện xem một mẫu là có thật hay là kết quả của bộ tạo.

Việc học có thể được mô phỏng như một trò chơi có tổng bằng không. Các chương trình máy tính này cạnh tranh hàng triệu lần để cải thiện kỹ năng chụp ảnh của bạn cho đến khi họ có khả năng tạo ra những hình ảnh hoàn chỉnh.

Nói một cách đơn giản, GAN có nghĩa là hai mạng hoạt động chống lại nhau.

Lần đầu tiên nó được cung cấp dữ liệu thô được phân tách. Từ những điều này, tchuột tạo ra một hình ảnh. Lsau đó gửi nó đến một mạng khác rằng, nó chỉ có ảnh thực hoặc ảnh trong cơ sở dữ liệu của nó. Mạng thứ hai này sẽ đánh giá hình ảnh và sẽ thông báo cho mạng thứ nhất.

Nếu hình ảnh không giống như kết quả mong đợi, thuật toán đầu tiên sẽ tiếp tục quá trình. Nếu có sự trùng khớp, bạn được thông báo rằng bạn đang đi đúng hướng và bạn sẽ hiểu thế nào là một hình ảnh tốt.

Nó vận hành như vậy sao Gaugan

Một khi bạn được đào tạo đầy đủ, bạn có thể sản xuất hình ảnh trên dây chuyền. Theo dữ liệu do Nvidia công bố, bộ phân biệt chạy trên nền của phần mềm GauGAN có cơ sở dữ liệu gồm hàng triệu hình ảnh về thiên nhiên.

GauGAN có thể cung cấp một công cụ mạnh mẽ để tạo thế giới ảo. Ngay cả trong bản demo giới hạn này, rõ ràng là phần mềm được xây dựng dựa trên các kỹ năng này nó sẽ thu hút tất cả mọi người từ nhà thiết kế trò chơi điện tử đến kiến ​​trúc sư cho đến những người chơi bình thường.

Với trí thông minh nhân tạo hiểu được thế giới thực trông như thế nào, những chuyên gia này có thể tạo mẫu tốt hơn cho ý tưởng của họ và thực hiện các thay đổi nhanh chóng cho một cảnh tổng hợp.

Công ty không có kế hoạch phát hành thương mại, nhưng có thể sớm tung ra bản thử nghiệm công khai để cho phép mọi người sử dụng phần mềm.

Thông qua bản demo phần mềm GauGAN, Nvidia nêu bật những mặt tích cực của việc sử dụng công nghệ dựa trên GAN, Nhưng phải nói rằng bộ kỹ thuật này cũng có thể được sử dụng cho những mục đích nham hiểm.

Deepfakes (hình ảnh do máy tính tạo chồng lên các video khác hoặc video hiện có) là một phần của đợt này và được các bên thứ ba độc hại tin tưởng để truyền bá tin tức sai lệch và trò lừa bịp.

Nvidia duy trì nền tảng trực tuyến AI Playground. Nó liệt kê các dự án mà công ty đang triển khai về trí tuệ nhân tạo và người dùng internet có cơ hội khởi chạy các bản demo.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

  1.   Marcela dijo

    Quê gen