СЕЕД РЛ, Гоогле Опен Соурце оквир за моделе вештачке интелигенције

Л Гоогле истраживачи објавили вест о развоју новог оквира који проширује обуку модела вештачке интелигенције на хиљаде машина. Резултат се зове СЕЕД РЛ (скалабилно ефикасно учење дубоког појачања).

Ово је обећавајући развој јер бих требао омогућити обуку алгоритама вештачке интелигенције за милионе слика у секунди и смањиће трошкове ове обуке за 80%, рекао је Гоогле у истраживачком раду.

Оваква врста смањења може помоћи у изједначавању услова за стартупе. који до сада нису могли да се такмиче са главним попут Гоогле-а на пољу АИ. Цена обуке софистицираних модела машинског учења у облаку је изненађујуће висока. Гоогле формализује отварање СЕЕД РЛ кода, пројекта чији је циљ оптимизација односа трошкова и учинка учења ојачања.

Учење за појачање је врло специфичан приступ случаја када агенти уче о свом окружењу кроз истраживање и оптимизују своје акције како би добили највише награда.

У »СЕЕД РЛ: Сцалабле анд Еффициент Дееп-РЛ витх Аццелератед Централ Инференце«, увели смо РЛ агент који се скалира на хиљаде машина, омогућавајући обуку са милионима сличица у секунди и значајно побољшавајући рачунску ефикасност. То се постиже новом архитектуром која искориштава предности акцелератора (ГПУ или ТПУ) централизовањем закључивања модела и увођењем брзог комуникационог слоја.

Демонстрирамо перформансе СЕЕД РЛ-а на популарним РЛ мерама, као што су Гоогле Ресеарцх Фоотбалл, Арцаде Леарнинг Енвиронмент и ДеепМинд Лаб, и показујемо да се употребом већих модела може повећати ефикасност података. Код је отворен на Гитхуб-у, заједно са примерима за покретање на Гоогле Цлоуд-у са ГПУ-ом.

СЕЕД РЛ заснован је на оквиру ТенсорФлов 2.0 y ради помоћу комбинације јединица за обраду графике и јединице за обраду тензора за централизовање закључивања о моделу. Закључивање се врши централно користећи компоненту учења која обучава модел.

Променљиве и информације о стању циљног модела чувају се локално а запажања о њима шаљу се ученику у свакој фази процеса. СЕЕД РЛ такође користи мрежну библиотеку засновану на универзалном РПЦ оквиру отвореног кода да би се смањила кашњења.

Л Гоогле истраживачи су рекли да компонента учења би СЕЕД РЛ може се проширити на хиљаде језгара, док се број актера који се понављају између мерења у околини и извршавања закључка на моделу да би се предвидела следећа радња може да се повећа на хиљаде машина.

Гоогле је проценио ефикасност СЕЕД РЛ-а упоређујући га са популарним окружењем за учење Арцаде, окружењем Гоогле Ресеарцх Фоотбалл и разним окружењима ДеепМинд Лаб. Резултати показују да су успели да реше Гоогле Ресеарцх Фоотбалл задатак док су тренирали модел на 2,4 милиона. Сличица по друго користећи 64 чипа процесорске јединице за затезање облака.

То је око 80 пута брже од претходних оквира, рекао је Гоогле.

„Ово се претвара у значајно временско убрзање, јер су акцелератори по операцији много јефтинији од ЦПУ-а, а трошкови експеримената су драстично смањени.“ Верујемо да СЕЕД РЛ и представљени резултати показују да је учење ојачавањем поново сустигло остатак дубоког учења у смислу употребе акцелератора “, пише Лассе Еспехолт, истраживачки инжењер у Гоогле Ресеарцх-у.

Са архитектуром оптимизованом за употребу у модерним акцелераторима, природно је повећати величину модела у покушају да се повећа ефикасност података.

Гоогле је рекао да је СЕЕД РЛ код отворен и доступан на Гитхуб-у, као и примери који показују како да се натера да ради на Гоогле Цлоуд-у са јединицама за обраду графике.

Коначно, за оне који су заинтересовани за овај нови оквир, могу да оду на следећу везу где могу пронаћи више информација о њему. Веза је ово. 

izvor: https://ai.googleblog.com/


Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. За податке одговоран: Мигуел Ангел Гатон
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.