НЛЛБ, Фацебоок АИ за директно превођење текста

Недавно Фацебоок представљен кроз публикацију развој догађаја НЛЛБ пројекат (Но Лангуаге Лефт Бехинд), чији је циљ стварање универзални модел машинског учења за превођење директан текст са једног језика на други, заобилазећи средњи превод на енглески.

Предложени модел покрива преко 200 језика, укључујући ретке афричке и аустралијске језике а крајњи циљ пројекта је да обезбеди средство комуникације за све људе, без обзира на језик којим говоре.

Да би помогли људима да се боље повежу данас и буду део сутрашњег метаверзума, истраживачи Мета АИ су креирали Но Лангуаге Лефт Бехинд (НЛЛБ), покушај да развију висококвалитетне могућности машинског превођења за већину светских језика.

Данас најављујемо велики напредак у НЛЛБ-у: направили смо један АИ модел под називом НЛЛБ-200., који преводи 200 различитих језика са врхунским резултатима. Многи од ових језика, као што су Камба и Лао, нису били подржани чак ни најбољим алатима за превођење који су данас доступни.

О пројекту се помиње да је намењен поједностављењу израде пројеката коришћењем предложеног модела, код апликације који се користи за тестирање и процену квалитета модела (ФЛОРЕС-200, НЛЛБ-МД, Токицити-200), код за обуку модела и кодери засновани на библиотеци ЛАСЕР3 (Агностичко софтверско представљање идиома). Коначни модел се нуди у две верзије: пуној и смањеној. Смањена верзија захтева мање ресурса и погодна је за тестирање и употребу у истраживачким пројектима.

Мање од 25 афричких језика тренутно подржавају широко коришћени алати за превођење, од којих су многи лошег квалитета. Насупрот томе, НЛЛБ-200 подржава 55 афричких језика са висококвалитетним излазом. Укупно, овај јединствени модел може да обезбеди висококвалитетне преводе за језике које говоре милијарде људи широм света. Укупно, резултати НЛЛБ-200 БЛЕУ побољшавају се у односу на претходно стање технике у просеку за 44 процента у свих 10 праваца ФЛОРЕС-101 бенцхмарк-а. За неке афричке и индијске језике, повећање је веће од 70 процената у односу на недавне системе превођења.

За разлику од других система превођења машинског учења, Фацебоок-ово решење се истиче по томе што нуди заједнички модел за свих 200 језика, који покрива све језике и не захтева посебне моделе за сваки језик.

Превод се врши директно са изворног језика на циљни језик, без средњег превода на енглески. За креирање универзалних система за превођење, предложен је додатни модел ЛИД (Лангуаге ИДентифицатион), који омогућава одређивање језика који се користи. Оне. систем може аутоматски препознати језик на коме су информације дате и превести их на језик корисника.

Превод је подржан у оба смера, између било ког од 200 подржаних језика. Да би се потврдио квалитет превода између било ког језика, припремљен је бенчмарк тест сет ФЛОРЕС-200, који је показао да је модел НЛЛБ-200, у погледу квалитета превода, у просеку 44% супериорнији у односу на системе ФЛОРЕС-70. предложено истраживање засновано на машинском учењу када се користе БЛЕУ метрике које упоређују машинско превођење са стандардним људским преводом. За ретке афричке језике и индијске дијалекте, супериорност у квалитету достиже XNUMX%. Квалитет превода можете визуелно проценити на посебно припремљеном демо сајту.

За оне који су заинтересовани за пројекат, требало би да знају да модел је доступан под лиценцом Цреативе Цоммонс БИ-НЦ 4.0, који дозвољава копирање, дистрибуцију, укључивање у ваше пројекте и стварање изведених дела, али подлеже приписивању, задржавању лиценце и коришћењу само у некомерцијалне сврхе. Алат за моделирање је лиценциран под лиценцом МИТ. Да би се стимулисао развој коришћењем НЛЛБ модела, одлучено је да се издвоји 200 долара за доделу стипендија истраживачима.

Коначно ако сте заинтересовани да сазнате више о томе у вези белешке, можете се позвати на оригинални пост У следећем линку.


Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. За податке одговоран: Мигуел Ангел Гатон
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.