Masakhane, một dự án mã nguồn mở cho phép dịch máy hơn 2000 ngôn ngữ châu Phi

masakhane

Khi chúng ta thường nghe về các dự án nguồn mở trong hầu hết các trường hợp chương trình xuất hiện trong tâm trí hoặc các tiện ích phục vụ cho công việc hàng ngày. Mặc dù nó không phải là trường hợp như vậy, kể từ nguồn mở bao gồm nhiều lĩnh vực khác.

Một trong số đó là trí tuệ nhân tạo hiện đang phát triển theo cấp số nhân đáng kinh ngạc, mặc dù thực tế là vài năm trước, người ta tin rằng nó sẽ là thứ sẽ phát triển tốt trong nhiều năm sau đó.

Trí tuệ nhân tạo (AI) hiện được sử dụng cho nhiều trường hợp khác nhau, trong đó phổ biến nhất là để phát hiện các đối tượng, con người, các mẫu trong số những thứ khác. Nó cũng được sử dụng trong các máy dịch, nhiều trong số đó đã được cấp bằng sáng chế bởi các công ty.

Nhưng trong trường hợp này chúng ta sẽ nói về một dự án nguồn mở đã thu hút sự quan tâm của nhiều người kể từ đó được phát triển để đáp ứng nhu cầu lớn trong lãnh thổ châu Phi, đó là giao tiếp vì hiện tại người ta ước tính rằng ở Châu Phi có khoảng 2000 ngôn ngữ.

Masakhane một dự án phải được hoàn thành vì lợi ích chung

Dự án mà chúng ta sẽ nói đến là "Masakhane" là một dự án được thành lập bởi các nhà nghiên cứu IA Nam Phi Jade Abbott và Laura Martinus và dự án đang hợp tác với các nhà nghiên cứu AI và các nhà khoa học dữ liệu từ khắp châu Phi.

Khi gặp nhau tại một hội nghị liên quan đến học máy và xử lý ngôn ngữ tự nhiên (NLP) năm nay, họ đã thảo luận về một dự án chuyển các ngôn ngữ châu Phi sang mô hình học máy và bắt đầu thành lập Masakhane. Tên của dự án "Masakhane" là một từ có nghĩa là "làm cùng nhau" trong tiếng Zulu.

Các ngôn ngữ cho phép dịch máy trong Masakhane không chỉ bao gồm các ngôn ngữ mẹ đẻ Người Châu Phi, nhưng cũng là phương ngữ Nigeria Pidgin bằng tiếng Anh và tiếng Ả Rập được nói ở Bắc và Trung Phi. Không giống như các ngôn ngữ châu Âu, các ngôn ngữ này không có các điểm tham chiếu cụ thể hoặc tập dữ liệu lớn.

Ngoài tầm quan trọng của nhiều cơ hội đối với người châu Phi, lợi ích của các nhà phát triển tham gia Masakhane được liệt kê là "Sự thành công của các dự án AI của người châu Phi là nhà nghiên cứu AI của người châu Phi." Nó có thể dẫn đến những hạn chế thoải mái.

Hiện tại Masakhane có khoảng 60 nhà phát triển ở Châu Phi (Nam Phi, Kenya và Nigeria) trong đó mỗi người tham gia thu thập dữ liệu bằng ngôn ngữ mẹ đẻ của họ và đào tạo mô hình.

Ở Kenya, tiếng Anh thường được sử dụng trong trường học và những nơi công cộng khác, nhưng trong cuộc sống hàng ngày, mỗi bộ tộc lại sử dụng các ngôn ngữ khác nhau, vì vậy Siminyu cảm thấy có một khoảng cách giao tiếp. Đã. Do đó, nhà phát triển AI Siminyu đã quyết định tham gia cùng Masakhane.

Siminyu tin rằng việc dịch các ngôn ngữ châu Phi sử dụng máy học sẽ dẫn đến sự phát triển trong việc sử dụng AI ở châu Phi, giúp người dân ở châu Phi sử dụng AI trong cuộc sống của họ. Siminyu lập luận rằng các dự án trên khắp lục địa, như Masakhane, chúng có vai trò quan trọng trong việc kết nối các nhà phát triển và cộng đồng nghiên cứu châu Phi để hợp tác lâu dài và bền vững.

“Sự khác biệt về ngôn ngữ là một rào cản, và việc loại bỏ rào cản ngôn ngữ sẽ cho phép nhiều người châu Phi tham gia vào nền kinh tế kỹ thuật số và cuối cùng là nền kinh tế AI. Siminyu nói: “Tôi cảm thấy rằng trách nhiệm của những người tham gia vào Masakhane là phải thu hút những người không tham gia vào xã hội AI.

Các trợ lý bởi Masakhane nói rằng cộng đồng nhà phát triển ở Châu Phi đang mở rộng nhanh chóng và lợi ích của dịch máy cho các ngôn ngữ châu Phi là rất đáng kể.

Chúng tôi có thể giải quyết vấn đề. Chúng tôi có các chuyên gia, chúng tôi có kiến ​​thức và trí tuệ… Tôi nghĩ họ sẽ trở thành chỗ đứng vững chắc để đóng góp cho thế giới. Một nhà phát triển châu Phi nói.

Cuối cùng, nếu bạn muốn biết thêm về dự án, bạn có thể kiểm tra các chi tiết trên trang web chính thức của nó. Liên kết là cái này. 


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.