Masakhane, projekt s otevřeným zdrojovým kódem, který umožňuje strojový překlad více než 2000 XNUMX afrických jazyků

masakhane

Když obvykle slyšíme o open source projektech většinou programy přicházejí na mysl nebo nástroje pro každodenní pracovní účely. Ačkoli tomu tak není, od otevřeného zdroje pokrývá mnoho dalších oblastí.

Jedním z nich je umělá inteligence, která v současné době roste neuvěřitelně exponenciálním způsobem, a to navzdory skutečnosti, že před několika lety se věřilo, že to bude něco, co se dobře vyvine o mnoho let později.

Umělá inteligence (AI) se v současné době používá pro různé případy, z nichž nejoblíbenější jsou mimo jiné pro detekci objektů, lidí, vzorů. Používá se také u překladatelů, z nichž mnohé jsou patentovány společnostmi.

Ale v tomto případě budeme hovořit o projektu s otevřeným zdrojovým kódem což od té doby vzbudilo zájem mnoha lidí je vyvinut pro splnění velké potřeby na africkém území, což je komunikace, protože se v současné době odhaduje, že v Africe existuje přibližně 2000 XNUMX jazyků.

Masakhane projekt, který musí být naplněn pro společné dobro

Projekt, o kterém budeme mluvit, je "Masakhane" což je projekt, který založili jihoafričtí vědci z oblasti IA Jade Abbott a Laura Martinus a projekt spolupracuje s výzkumníky AI a datovými vědci z celé Afriky.

Když se letos setkali na konferenci týkající se strojového učení a zpracování přirozeného jazyka (NLP), diskutovali o projektu překladu afrických jazyků do modelů strojového učení a zahájili Masakhane. Název projektu „Masakhane“ je slovo, které v Zulu znamená „dělat společně“.

Mezi jazyky, které umožňují strojový překlad v Masakhane, patří nejen rodné jazyky Afričané, ale také nigerijský dialekt Pidgin v angličtině a arabštině mluvený v severní a střední Africe. Na rozdíl od evropských jazyků nemají tyto jazyky konkrétní referenční body ani velké soubory dat.

Kromě význam mnoha příležitostí pro Afričany, jsou výhody vývojářů účastnících se v Masakhane uvedeny jako „Úspěch afrických projektů AI je výzkumníkem africké AI.“ Mohlo by to vést k uvolněným omezením.

V současné době Masakhane má v Africe přibližně 60 vývojářů (Jižní Afrika, Keňa a Nigérie), z nichž každý účastník shromažďuje údaje ve svém rodném jazyce a trénuje model.

V Keni se angličtina často používá ve školách a na jiných veřejných místech, ale v každodenním životě se pro každý kmen používají jiné jazyky, takže Siminyu cítil, že v ní existuje komunikační mezera. Byl. Proto se vývojář AI Siminyu rozhodl vstoupit do Masakhane.

Siminyu věří, že překlad afrických jazyků pomocí strojového učení povede k nárůstu využívání umělé inteligence v Africe, což pomůže lidem v Africe využívat umělou inteligenci ve svém životě. Siminyu tvrdí, že projekty napříč kontinentem, jako je Masakhane, jsou důležité pro propojení afrických vývojářů a výzkumných komunit pro dlouhodobou a udržitelnou spolupráci.

"Jazykové rozdíly jsou překážkou a odstranění jazykové bariéry umožní mnoha Afričanům podílet se na digitální ekonomice a nakonec na ekonomice umělé inteligence." „Cítím, že je odpovědností těch, kteří se účastní Masakhane, aby dostali lidi, kteří nejsou zapojeni do společnosti AI,“ řekl Siminyu.

Asistenti podle Masakhane říkají, že vývojářská komunita v Africe se rychle rozšiřuje a že výhody strojového překladu pro africké jazyky jsou značné.

Můžeme problém vyřešit. Máme odborníky, máme znalosti a inteligenci ... Myslím, že se stanou oporou, která přispěje světu. Říká africký vývojář.

Konečně, pokud se chcete o projektu dozvědět více, můžete zkontrolovat podrobnosti na jeho oficiálních webových stránkách. Odkaz je tento. 


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Odpovědný za údaje: Miguel Ángel Gatón
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.