Copilot, pembantu AI GitHub mendapat kritikan kuat dari komuniti sumber terbuka

Beberapa hari yang lalu kami berkongsi di blog berita Copilot, yang merupakan wizard kecerdasan buatan untuk menulis kod GitHub dan yang pada dasarnya saya paparkan sebagai alat bantuan untuk pengaturcara.

Walaupun Copilot berbeza dengan sistem penyelesaian kod tradisional kerana kemampuan untuk membentuk blok kod yang cukup kompleks, untuk fungsi siap pakai yang disintesis dengan mengambil kira konteks semasa. Sebagai Copilot adalah fungsi AI yang telah belajar melalui beberapa juta baris kod dan ia menyedari apa yang anda rancangkan berdasarkan definisi fungsi, dll.

Sementara itu Copilot mewakili penjimat masa yang hebat kerana pembelajarannya berjuta-juta baris kod, yang mulai menimbulkan ketakutan bahawa alat ini dapat menghindari syarat pelesenan sumber terbuka dan melanggar undang-undang hak cipta.

Armin Ronacher, pemaju terkemuka dalam komuniti sumber terbuka, dia adalah salah satu pemaju yang kecewa dengan cara Copilot dibina, ketika dia menyebut bahawa dia bereksperimen dengan alat itu dan menyiarkan tangkapan layar di Twitter di mana menyebut bahawa kelihatan aneh bagi dia bahawa Copilot, alat kecerdasan buatan yang dikomersialkan, dapat menghasilkan kod yang dilindungi hak cipta.

Dengan ini, beberapa pemaju mula merasa bimbang dengan menggunakan kod awam untuk melatih kecerdasan buatan alat tersebut. Satu masalah adalah bahawa jika Copilot menghasilkan banyak kod yang ada, ia boleh melanggar hak cipta atau kod sumber terbuka untuk penggunaan komersial tanpa lesen yang betul (pada dasarnya pedang bermata dua).

Selain itu, ditunjukkan bahawa alat ini juga dapat memasukkan maklumat peribadi diterbitkan oleh pembangun dan dalam satu kes, meniru kod yang dipetik secara meluas dari permainan PC Quake III Arena tahun 1999, termasuk komen dari pemaju John Carmack.

Cole Garry, jurucakap Github, enggan memberikan komen dan puas merujuk kepada FAQ syarikat yang ada di laman web Copilot, yang mengakui bahawa alat ini dapat menghasilkan potongan teks dari data latihan anda.

Ini berlaku kira-kira 0.1% dari waktu, menurut GitHub, biasanya ketika pengguna tidak memberikan konteks yang cukup mengenai permintaan mereka atau ketika masalah tersebut memiliki solusi sepele.

"Kami sedang dalam proses menerapkan sistem pelacakan asal untuk mengesan kejadian kod yang jarang diulang dalam semua data latihan, untuk membantu Anda membuat keputusan yang baik dalam waktu nyata. Mengenai cadangan GitHub Copilot, ”kata FAQ syarikat.

Sementara itu, Ketua Pegawai Eksekutif GitHub Nat Friedman berpendapat bahawa sistem pembelajaran mesin latihan pada data awam adalah penggunaan yang sah, sementara mengakui bahawa "harta intelek dan kecerdasan buatan akan menjadi subjek perbincangan politik yang menarik." Di mana syarikat itu akan mengambil bahagian secara aktif.

Dalam salah satu tweetnya, dia menulis:

"GitHub Copilot, dengan pengakuannya sendiri, dibina di atas kod GPL, jadi saya tidak pasti bagaimana ini bukan satu bentuk pengubahan wang haram. Kod sumber terbuka dalam karya komersial. Frasa "biasanya tidak menghasilkan semula potongan yang tepat" tidak begitu memuaskan ".

"Hak cipta tidak hanya merangkumi salinan dan tampal; merangkumi karya terbitan. GitHub Copilot dibina berdasarkan kod sumber terbuka dan jumlah semua yang anda tahu diambil dari kod tersebut. Tidak ada kemungkinan tafsiran istilah 'diturunkan' yang tidak termasuk ini, '' tulisnya. "Generasi AI yang lebih tua dilatih dalam teks dan foto awam, di mana lebih sukar untuk menuntut hak cipta, tetapi yang ini diambil dari karya hebat dengan lesen yang sangat eksplisit yang diuji oleh mahkamah, jadi saya menantikan yang tidak dapat dielakkan / kolektif / tindakan besar-besaran mengenai perkara ini ”.

Akhirnya, kita harus menunggu tindakan yang akan diambil oleh GitHub untuk mengubah cara latihan Copilot, kerana pada akhirnya, cepat atau lambat cara menghasilkan kod tersebut dapat menimbulkan masalah kepada lebih dari satu pengembang.


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab atas data: Miguel Ángel Gatón
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.