ПолиЦодер, отворени изворни код који генерише АИ који би могао надмашити Цодек 

Аутор: @Лаурент - Фотолиа.цом

Тренутно, Почели смо да видимо повећање у различита решења која почињу да нуде у односу на генерисање кода помоћу вештачке интелигенције (АИ) и то је да је поље обраде природног језика (НЛП) утрло пут за серију АИ за генерисање кода у различитим програмским језицима.

Од чега можемо истаћи на пример ГитХуб Цопилот, АлпхаЦоде и Цодек и коме сада можемо додати ново решење из руке истраживачи са Универзитета Карнеги Мелон ко недавно представљен "ПолиЦодер", генератор кода заснован на ОпенАИ-јевом ГПТ-2 језичком моделу који је обучен на бази кодова од 249 ГБ у 12 програмских језика.

О ПолиЦодер-у

Аутори ПолиЦодер-а тврде да јесте способан да напише Ц прецизније од било ког познатог модела, укључујући Цодек.

Код који генерише АИ, може писати изворни код на различитим програмским језицима Одмах на почетку, обећава смањење трошкова развоја софтвера, а истовремено омогућава програмерима да се фокусирају на мање понављајуће, креативне задатке.

ПолиЦодер је покретан подацима из различитих ГитХуб спремишта, покривајући 12 популарних програмских језика: Ц, Ц#, Ц++, Го, Јава, ЈаваСцрипт, ПХП, Питхон, Руби, Руст, Сцала и ТипеСцрипт.

Нефилтрирани скуп података је имао укупно 631 ГБ података и 38,9 милиона датотека. Тим је то рекао је одлучио да обучи ПолиЦодер са ГПТ-2 због буџетских ограничења. ПолиЦодер је доступан као отворени код, а истраживачи се надају да може демократизовати истраживање у области генерисања АИ кодова, којим су до сада доминирале добро финансиране компаније.

Истраживачи верују да је ПолиЦодер ради боље од других модела у генерисању кода у језику Ц. Међутим, Цодек га је увек надмашио у другим језицима. „ПолиЦодер драматично надмашује Цодек и све друге моделе у језику Ц.

„Када је Цопилот изашао на ГитХуб прошлог лета, постало је јасно да ови веома велики модели језичког кода могу бити веома корисни у помоћи програмерима и повећању њихове продуктивности. Али ниједан модел чак ни близу те скале није био јавно доступан“, рекли су истраживачи ВентуреБеату путем е-поште. „Тако је [ПолиЦодер] почео тако што је Винцент покушавао да открије који је највећи модел који се могао обучити на нашем лабораторијском серверу, који је на крају био 2700 милијарди параметара... и тај модел је био лигу испред других модела оријентисаних на код који смо имали . били јавно доступни у то време.”

Када упоредимо само моделе отвореног кода, ПолиЦодер надмашује ГПТ-Нео 2.7Б модел сличне величине у Ц, ЈаваСцрипт, Руст, Сцала и ТипеСцрипт." истичу „У осталих 11 језика, сви остали модели отвореног кода, укључујући и наш, су знатно гори (већа збуњеност) од Цодека“, додали су истраживачи ЦМУ.

Са овим, ПолиЦодер је позициониран као веома интересантно решење, пошто су истраживачке лабораторије као што су ОпенАИ Елона Маска и Алпхабетов ДеепМинд развиле моћну вештачку интелигенцију која генерише код, многи од најуспешнијих система нису доступни у отвореном коду. Компаније са ниским приходима немају приступ томе и ова ситуација ограничава њихова истраживања на терену.

На пример, подаци о обуци из ОпенАИ Цодек-а, који покреће ГитХуб-ову функцију Цопилот, нису објављени, што спречава истраживаче да усаврше АИ модел или да проучавају одређене његове аспекте, као што је интероперабилност.

„Велике технолошке компаније не објављују јавно своје моделе, што заиста кочи научна истраживања и демократизацију тако великих модела језичког кода“, рекли су истраживачи. „У одређеној мери, надамо се да ће наши напори отвореног кода убедити друге да учине исто. Али велика слика је да би заједница требало да буде у могућности да сама обучава ове моделе. Наш модел је померио границу онога што можете да тренирате на једном серверу – све што је веће захтева скуп сервера, што драматично повећава трошкове.”

Коначно ако сте заинтересовани да сазнате више о томе, детаље можете погледати у следећи линк.


Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. За податке одговоран: Мигуел Ангел Гатон
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.