Kopilot, asisten AI GitHub menerima kritik keras dari komunitas open source

Beberapa hari yang lalu kami berbagi di sini di blog berita Kopilot, yang merupakan wizard kecerdasan buatan untuk menulis kode GitHub dan yang pada dasarnya saya hadirkan sebagai alat bantu untuk programmer.

Meskipun Kopilot berbeda dari sistem penyelesaian kode tradisional karena kemampuan untuk membentuk blok kode yang cukup kompleks, hingga fungsi yang sudah jadi disintesis dengan mempertimbangkan konteks saat ini. Sebagai Kopilot adalah fungsi AI yang telah dipelajari melalui beberapa juta baris kode dan itu mengenali apa yang Anda rencanakan berdasarkan definisi suatu fungsi, dll.

Sementara Kopilot mewakili penghemat waktu yang hebat karena mempelajari jutaan baris kode, yang mulai menimbulkan kekhawatiran bahwa alat tersebut dapat menghindari persyaratan lisensi sumber terbuka dan melanggar undang-undang hak cipta.

Armin Ronacher, pengembang terkemuka di komunitas open source, dia adalah salah satu pengembang yang merasa frustrasi dengan cara Copilot dibangun, saat dia menyebutkan bahwa dia bereksperimen dengan alat dan memposting tangkapan layar di Twitter di mana menyebutkan bahwa aneh baginya bahwa Kopilot, alat kecerdasan buatan yang dikomersialkan, dapat menghasilkan kode berhak cipta.

Mengingat ini, beberapa pengembang mulai khawatir dengan menggunakan kode publik untuk melatih kecerdasan buatan alat tersebut. Satu kekhawatiran adalah bahwa jika Copilot mereproduksi potongan kode yang ada cukup besar, itu dapat melanggar hak cipta atau mencuci kode sumber terbuka untuk penggunaan komersial tanpa lisensi yang tepat (pada dasarnya pedang bermata dua).

Selain itu, ditunjukkan bahwa alat tersebut juga dapat menyertakan informasi pribadi diterbitkan oleh pengembang dan dalam satu kasus, mereplikasi kode yang dikutip secara luas dari game PC Quake III Arena 1999, termasuk komentar dari pengembang John Carmack.

Cole Garry, juru bicara Github, menolak berkomentar dan puas merujuk ke FAQ perusahaan yang ada di situs web Copilot, yang mengakui bahwa alat tersebut dapat menghasilkan cuplikan teks dari data pelatihan Anda.

Ini terjadi sekitar 0.1% dari waktu, menurut GitHub, biasanya ketika pengguna tidak memberikan konteks yang cukup di sekitar permintaan mereka atau ketika masalah memiliki solusi sepele.

“Kami sedang dalam proses menerapkan sistem pelacakan asal untuk mendeteksi kejadian langka pengulangan kode di semua data pelatihan, untuk membantu Anda membuat keputusan yang baik secara real time. Mengenai saran GitHub Copilot, ”kata FAQ perusahaan.

Sementara itu, CEO GitHub Nat Friedman berpendapat bahwa pelatihan sistem pembelajaran mesin pada data publik adalah penggunaan yang sah, sementara mengakui bahwa "kekayaan intelektual dan kecerdasan buatan akan menjadi bahan diskusi politik yang menarik." di mana perusahaan akan berpartisipasi secara aktif.

Dalam salah satu tweetnya, dia menulis:

“GitHub Copilot, menurut pengakuannya sendiri, dibangun di atas tumpukan kode GPL, jadi saya tidak yakin bagaimana ini bukan bentuk pencucian uang. Kode sumber terbuka dalam karya komersial. Ungkapan "biasanya tidak mereproduksi potongan yang tepat" sangat tidak memuaskan ".

“Hak cipta tidak hanya mencakup salin dan tempel; meliputi karya turunan. GitHub Copilot dibentuk dalam kode sumber terbuka dan jumlah total semua yang Anda ketahui diambil dari kode itu. Tidak ada kemungkinan interpretasi dari istilah 'turunan' yang tidak termasuk ini,' tulisnya. “Generasi AI yang lebih tua dilatih dalam teks dan foto publik, di mana lebih sulit untuk mengklaim hak cipta, tetapi yang ini diambil dari karya-karya hebat dengan lisensi yang sangat eksplisit yang diuji oleh pengadilan, jadi saya menantikan yang tak terelakkan / kolektif / tindakan besar-besaran dalam hal ini ”.

Terakhir, kita harus menunggu tindakan yang akan dilakukan GitHub untuk mengubah cara Copilot dilatih, karena pada akhirnya, cepat atau lambat cara GitHub menghasilkan kode dapat membuat lebih dari satu pengembang bermasalah.


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Penanggung jawab data: Miguel Ángel Gatón
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.