Masakhane, et open source-projekt, der muliggør maskinoversættelse af mere end 2000 afrikanske sprog

Masakhane

Når vi normalt hører om open source-projekter i de fleste tilfælde programmer kommer til at tænke på eller hjælpeprogrammer til det daglige arbejde. Selv om det ikke er tilfældet som sådan, siden open source dækker mange flere områder.

En af dem er kunstig intelligens, der i øjeblikket vokser på en utrolig eksponentiel måde, på trods af at man for nogle år siden troede, at det ville være noget, der ville udvikle sig mange år senere.

Kunstig intelligens (AI) bruges i øjeblikket til forskellige tilfælde, hvoraf de mest populære er til påvisning af genstande, mennesker, mønstre blandt andet. Det bruges også i oversættere, hvoraf mange er patenteret af virksomheder.

Men i dette tilfælde vi vil tale om et open source-projekt hvilket har vakt mange interesse siden er udviklet til at dække et stort behov på det afrikanske område, som er kommunikation, da det i øjeblikket anslås, at der i Afrika er omkring 2000 sprog.

Masakhane et projekt, der skal opfyldes for det fælles bedste

Det projekt, vi vil tale om, er "Masakhane" som er et projekt, der blev grundlagt af sydafrikanske IA-forskere Jade Abbott og Laura Martinus og projektet samarbejder med AI-forskere og dataforskere fra hele Afrika.

Da de mødtes på en konference relateret til maskinlæring og naturlig sprogbehandling (NLP) i år, diskuterede de et projekt til oversættelse af afrikanske sprog til maskinlæringsmodeller og startede Masakhane. Navnet på projektet "Masakhane" er et ord, der betyder "at gøre sammen" i Zulu.

Sprog, der tillader maskinoversættelse på Masakhane, inkluderer ikke kun indfødte sprog Afrikanere, men også den nigerianske dialekt Pidgin på engelsk og arabisk talt i Nord- og Centralafrika. I modsætning til europæiske sprog har disse sprog ikke specifikke referencepunkter eller store datasæt.

Ud over vigtigheden af ​​flere muligheder for afrikanereer fordelene ved udviklere, der deltager i Masakhane, opført som "Succes med afrikanske AI-projekter er en afrikansk AI-forsker. Det kan føre til afslappede begrænsninger.

Aktuelt i Masakhane har omkring 60 udviklere i Afrika (Sydafrika, Kenya og Nigeria), hvoraf hver deltager indsamler data på deres modersmål og træner modellen.

I Kenya bruges engelsk ofte i skoler og andre offentlige steder, men i hverdagen bruges forskellige sprog for hver stamme, så Siminyu følte, at der var et kommunikationsgab. Var. Derfor besluttede AI-udvikler Siminyu at slutte sig til Masakhane.

Siminyu mener, at oversættelsen af ​​afrikanske sprog ved hjælp af maskinindlæring vil føre til en stigning i brugen af ​​AI i Afrika, hvilket hjælper folk i Afrika med at bruge AI i deres liv. Siminyu hævder, at projekter over hele kontinentet, som Masakhane, de er vigtige for at forbinde afrikanske udviklere og forskningsmiljøer med henblik på et langsigtet og bæredygtigt samarbejde.

”Sprogforskelle er en barriere, og fjernelse af sprogbarrieren vil give mange afrikanere mulighed for at deltage i den digitale økonomi og i sidste ende AI-økonomien. ”Jeg føler, at det er dem, der deltager i Masakhane, at få folk, der ikke er involveret i AI-samfundet,” sagde Siminyu.

Assistenterne af Masakhane siger udviklersamfundet i Afrika ekspanderer hurtigt og at fordelene ved maskinoversættelse til afrikanske sprog er betydelige.

Vi kan løse problemet. Vi har eksperter, vi har viden og intelligens ... Jeg tror, ​​de vil blive fodfæste for at bidrage til verden. Siger en afrikansk udvikler.

Endelig hvis du vil vide mere om projektet, kan du tjekke detaljerne på dets officielle hjemmeside. Linket er dette. 


Indholdet af artiklen overholder vores principper for redaktionel etik. Klik på for at rapportere en fejl her.

Vær den første til at kommentere

Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.