PolyCoder, kood furan oo soo saara AI kaas oo ka fiicnaan kara Codex 

Qore: @Laurent - Fotolia.com

Hadda, Waxaan bilownay inaan aragno kororka xalalka kala duwan ee ay bilaabayaan inay bixiyaan ee la xidhiidha abuurista code iyadoo la isticmaalayo sirdoonka macmal (AI) oo waa in goobta habaynta luqadda dabiiciga ah (NLP) ay u gogol xaarto taxane ah oo soo saarista kood AI ee luuqadaha barnaamijyada kala duwan.

Kuwaas oo ah waxaan muujin karnaa tusaale ahaan GitHub Copilot, AlphaCode iyo Codex oo aan hadda ku dari karno xal cusub oo gacanta ah cilmi-baarayaal ka tirsan Jaamacadda Carnegie Mellon yaa dhawaan la sameeyay "PolyCoder", koronto-dhaliye ku salaysan qaabka luqadda OpenAI ee GPT-2 kaas oo lagu tababaray kaydka koodka 249 GB ee 12 luqadood oo barnaamij ah.

Ku saabsan PolyCoder

Qorayaasha PolyCoder waxay sheeganayaan inuu yahay awood u leh inuu u qoro C si ka saxsan nooc kasta oo la yaqaan, oo uu ku jiro Codex.

Koodhka soo saara AI, waxay ku qori kartaa koodka isha ee luqadaha barnaamijyada kala duwan Isla markiiba fiidmeerta, waxay ballan qaadaysaa inay hoos u dhigto kharashyada horumarinta software iyada oo u oggolaanaysa horumariyeyaasha inay diiradda saaraan hawlaha soo noqnoqda ee yar yar.

PolyCoder waxaa lagu xoojiyay xog laga helay kaydka GitHub ee kala duwan, oo daboolaya 12 luqadaha barnaamijyada caanka ah: C, C #, C++, Go, Java, JavaScript, PHP, Python, Ruby, Rust, Scala, iyo TypeScript.

Xogta aan la shaandhayn ee la dhigay ayaa wadarta guud ahayd 631 GB oo xog ah iyo 38,9 milyan oo fayl ah. Kooxda ayaa sidaas tiri doortay inuu ku tababaro PolyCoder GPT-2 caqabado miisaaniyadeed awgeed. PolyCoder waxay diyaar u tahay inay noqoto il furan, cilmi-baarayaashuna waxay rajeynayaan inay dimuqraaddiyan karaan cilmi-baarista jiilka AI code-ka, taas oo ilaa hadda ay gacanta ku hayaan shirkado si fiican loo maalgeliyo.

Cilmi-baarayaashu waxay aaminsan yihiin in PolyCoder waxay u shaqeysaa si ka fiican noocyada kale ee soo saarista koodka luqadda C. Si kastaba ha ahaatee, Codex had iyo jeer wuu ka fiicnaaday luqadaha kale. "PolyCoder si aad ah ayuu uga sarreeyaa Codex iyo dhammaan noocyada kale ee luqadda C.

"Markii uu Copilot ka soo baxay GitHub xagaagii hore, waxaa caddaatay in moodooyinkan kood luqadeed ee aadka u weyn ay faa'iido u yeelan karaan caawinta horumarinta iyo kordhinta wax soo saarkooda. Laakiin ma jiro nooc xitaa u dhow qiyaastaas oo si guud loo heli karo, "cilmi-baarayaashu waxay email ugu sheegeen VentureBeat. "Sidaas darteed [PolyCoder] wuxuu ku bilaabay Vincent isagoo isku dayaya inuu ogaado waxa uu ahaa nooca ugu weyn ee lagu tababari karo server-keena shaybaadhka, kaas oo ku dhammaaday 2700 bilyan oo cabbir ah ... . si guud ayaa loo heli jiray wakhtigaas."

Marka la barbardhigo kaliya moodooyinka isha furan, PolyCoder wuxuu ka sarreeyaa qaabka la midka ah ee GPT-Neo 2.7B ee C, JavaScript, Rust, Scala, iyo TypeScript." waxay tilmaamayaan "11-ka luqadood ee kale, dhammaan moodooyinka kale ee furan, oo ay ku jiraan kuwayaga, ayaa si aad ah uga xun (qallafsanaan ka weyn) marka loo eego Codex," cilmi-baarayaasha CMU ayaa ku daray.

Tani, PolyCoder waxaa loo dhigaa sidii xal aad u xiiso badan, tan iyo markii shaybaarrada cilmi-baarista sida Elon Musk's OpenAI iyo Alphabet's DeepMind ay horumariyeen kood awood leh oo AI ah, qaar badan oo ka mid ah nidaamyada ugu guulaha badan lagama heli karo ilo furan. Shirkadaha dakhligoodu yar yahay ma helaan fursad ay ku helaan oo xaaladdani waxay xaddidaysaa cilmi-baaristooda goobta.

Tusaale ahaan, xogta tababarka ee OpenAI Codex, taas oo awood u siinaysa muuqaalka Copilot ee GitHub, lama shaacin dadweynaha, ka hortagga cilmi-baarayaasha inay hagaajiyaan qaabka AI ama ay daraaseeyaan dhinacyo gaar ah, sida isdhexgalka.

"Shirkadaha teknolojiyadda waaweyni si cad uma siidaayaan moodooyinkooda, taas oo runtii dib u dhigaysa cilmi-baarista sayniska iyo dimoqraadiyeynta moodooyinka koodhka luqadaha ee waaweyn," ayay cilmi-baarayaashu yiraahdeen. "Illaa xad, waxaan rajaynaynaa in dadaalkayaga il furan uu ku qanciyo kuwa kale inay sidaas oo kale sameeyaan. Laakiin sawirka ugu weyn ayaa ah in bulshadu awood u yeelato in ay iskood u tababaraan moodooyinkan. Qaabkayaga ayaa riixay xadka waxaad ku tababari karto hal server - wax kasta oo ka weyn wuxuu u baahan yahay barkad server ah, taasoo si weyn u kordhisa qiimaha.

Finalmente hadaad xiisaynayso inaad waxbadan ka ogaato, waxaad ka eegi kartaa faahfaahinta xiriirka soo socda.


Ka tag faalladaada

cinwaanka email aan la daabacin doonaa. Beeraha loo baahan yahay waxaa lagu calaamadeeyay la *

*

*

  1. Masuul ka ah xogta: Miguel Ángel Gatón
  2. Ujeedada xogta: Xakamaynta SPAM, maaraynta faallooyinka.
  3. Sharci: Oggolaanshahaaga
  4. Isgaarsiinta xogta: Xogta looma gudbin doono dhinacyada saddexaad marka laga reebo waajibaadka sharciga ah.
  5. Kaydinta xogta: Macluumaadka ay martigelisay Shabakadaha Occentus (EU)
  6. Xuquuqda: Waqti kasta oo aad xadidi karto, soo ceshan karto oo tirtiri karto macluumaadkaaga.