2000 개 이상의 아프리카 언어를 기계 번역 할 수있는 오픈 소스 프로젝트 인 Masakhane

마사카네

일반적으로 오픈 소스 프로젝트에 대해들을 때 대부분의 경우에 프로그램이 떠오른다 또는 일상 업무를위한 유틸리티. 그런 경우는 아니지만 오픈 소스 이후 더 많은 영역을 다룹니다.

그중 하나는 인공 지능으로 현재 놀라운 기하 급수적으로 성장하고 있습니다. 몇 년 전에는 그것이 몇 년 후에 잘 발전 할 것이라고 믿었음에도 불구하고 말입니다.

인공 지능 (AI)은 현재 다양한 사례에 사용되고 있습니다., 그중 가장 인기있는 것은 사물, 사람, 패턴을 감지하는 것입니다. 또한 번역사 내에서도 사용되며 그 중 대부분은 회사에서 특허를 받았습니다.

그러나이 경우 오픈 소스 프로젝트에 대해 이야기하겠습니다. 이후 많은 사람들의 관심을 불러 일으켰습니다. 아프리카 영토의 큰 필요를 충족시키기 위해 개발되었습니다., 현재 아프리카에 약 2000 개의 언어가있는 것으로 추정되기 때문에 커뮤니케이션입니다.

공동선을 위해 수행되어야하는 프로젝트, Masakhane

우리가 이야기 할 프로젝트는 "Masakhane" 남아프리카 IA 연구원 인 Jade Abbott와 Laura Martinus가 설립 한 프로젝트입니다. 이 프로젝트는 아프리카 전역의 AI 연구원 및 데이터 과학자들과 협력하고 있습니다.

올해 기계 학습 및 자연어 처리 (NLP) 관련 컨퍼런스에서 만났을 때 아프리카 언어를 기계 학습 모델로 번역하는 프로젝트에 대해 논의하고 Masakhane을 시작했습니다. 프로젝트 "Masakhane"의 이름은 줄 루어로 "함께한다"를 의미하는 단어입니다.

Masakhane에서 기계 번역을 허용하는 언어에는 모국어뿐만 아니라 아프리카 인이지만 또한 나이지리아 방언 북아프리카와 중앙 아프리카에서 사용되는 영어와 아랍어로 된 Pidgin. 유럽 ​​언어와 달리 이러한 언어에는 특정 참조 지점이나 대규모 데이터 세트가 없습니다.

플러스 아프리카 인들에게 다양한 기회의 중요성, Masakhane에 참여하는 개발자의 혜택은 "아프리카 AI 프로젝트의 성공은 아프리카 AI 연구원입니다. 완화 된 제한으로 이어질 수 있습니다.

현재 Masakhane에는 아프리카에 약 60 명의 개발자가 있습니다. (남아프리카, 케냐, 나이지리아) 각 참가자는 모국어로 데이터를 수집하고 모델을 학습시킵니다.

케냐에서는 학교 등 공공 장소에서 영어를 자주 사용하지만 일상 생활에서는 부족마다 다른 언어를 사용하고있어 의사 소통의 격차가 있다고 생각했습니다. 였다. 따라서 AI 개발자 Siminyu는 Masakhane에 합류하기로 결정했습니다.

Siminyu는 기계 학습을 사용하여 아프리카 언어를 번역하면 아프리카에서 AI 사용이 증가하여 아프리카 사람들이 삶에서 AI를 사용할 수 있도록 도울 것이라고 믿습니다. Siminyu는 Masakhane과 같은 대륙 전역의 프로젝트는 장기적이고 지속 가능한 협업을 위해 아프리카 개발자와 연구 커뮤니티를 연결하는 데 중요합니다.

“언어 차이는 장벽이며 언어 장벽을 제거하면 많은 아프리카 인이 디지털 경제에 참여하고 궁극적으로 AI 경제에 참여할 수 있습니다. Siminyu는 "AI 사회에 관여하지 않는 사람들을 얻는 것이 Masakhane에 참여하는 사람들의 책임이라고 생각합니다."

조수 작성자 Masakhane 아프리카의 개발자 커뮤니티가 빠르게 확장되고 있다고 그리고 아프리카 언어에 대한 기계 번역의 이점이 중요합니다.

우리는 문제를 해결할 수 있습니다. 전문가도 있고 지식도 있고 지능도 있고 ... 세상에 공헌하는 발판이 될 것 같아요. 아프리카 개발자가 말합니다.

마지막으로, 프로젝트에 대해 더 알고 싶다면, 자세한 내용은 공식 홈페이지에서 확인하실 수 있습니다. 링크는 이쪽입니다. 


기사의 내용은 우리의 원칙을 준수합니다. 편집 윤리. 오류를보고하려면 여기에.

코멘트를 첫번째로 올려

코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자 : Miguel Ángel Gatón
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.