OpenBytes, một dự án LSF mới nhằm mục đích làm cho dữ liệu mở sẵn có và dễ truy cập hơn

Trong Tổng kết Tư cách Thành viên Tổ chức Linux, Quỹ Linux công bố hai dự án mới lớn «OpenBytes và NextArch Foundation ».

Một trong số chúng "OpenBytes" là sản phẩm của sự hợp tác với nền tảng quản lý tập dữ liệu Graviti và tuyên bố rằng dự án hứa hẹn sẽ một 'cộng đồng dữ liệu mở' cũng như một tiêu chuẩn mới và định dạng dữ liệu chủ yếu dành cho các ứng dụng trí tuệ nhân tạo, trong khi NextArch, do Tencent dẫn đầu, chuyên tạo ra các kiến ​​trúc phát triển phần mềm hỗ trợ nhiều môi trường khác nhau.

Mục tiêu của dự án OpenBytes là để giảm rủi ro pháp lý cho các tổ chức và cá nhân quan tâm đến việc chia sẻ tập dữ liệu của họ với các dự án AI / ML khác. Người kiểm soát dữ liệu thường do dự chia sẻ tập dữ liệu của họ do lo ngại về các hạn chế cấp phép.

Theo Quỹ Linux, việc có thể đảm bảo với những người quản lý dữ liệu rằng quyền dữ liệu của họ được bảo vệ và dữ liệu của họ sẽ không bị lạm dụng sẽ giúp làm cho nhiều tập dữ liệu mở và có thể truy cập được.

“Dự án OpenBytes và cộng đồng sẽ mang lại lợi ích cho tất cả các nhà phát triển AI, học giả và các chuyên gia bằng cách giống nhau, các công ty lớn và nhỏ, vì họ cung cấp quyền truy cập vào các tập dữ liệu mở chất lượng cao hơn và làm cho các công ty
Việc triển khai AI nhanh hơn và dễ dàng hơn, ”Mike Dolan, tổng giám đốc cho biết. và phó chủ tịch cấp cao của các dự án
từ Quỹ Linux.

Những rủi ro pháp lý của trí tuệ nhân tạo và máy học có thể được nhìn thấy trong một số vụ kiện gần đây. Ví dụ, năm ngoái, IBM đã bị buộc tội vi phạm Đạo luật Bảo mật Sinh trắc học của Illinois khi sử dụng ảnh của nguyên đơn trong tập dữ liệu Các loại khuôn mặt của mình. Ngoài ra, các vụ kiện riêng biệt đã được đệ trình vào năm ngoái chống lại Amazon, Google, Microsoft và công ty nhận dạng khuôn mặt FaceFirst vì bị cáo buộc sử dụng tập dữ liệu này để đào tạo các thuật toán nhận dạng khuôn mặt của họ.

Dựa trên điều này, OpenBytes sẽ cho phép cộng đồng các nhà phát triển và nhà khoa học dữ liệu, do Graviti dẫn đầu, tạo ra các tiêu chuẩn và định dạng dữ liệu cho phép mọi người đóng góp.

Edward Cui, người sáng lập Graviti và là cựu chuyên gia máy học trong nhóm các công nghệ của Uber. . “Có được dữ liệu tốt hơn là điều cần thiết để phát triển AI. Để đạt được điều này, cần tạo ra một cộng đồng dữ liệu mở dựa trên sự hợp tác và đổi mới. Graviti tin rằng trách nhiệm xã hội của chúng ta là thực hiện vai trò của mình.

Khi tạo một tiêu chuẩn và định dạng dữ liệu mở, Dự án OpenBytes có thể giảm thiểu rủi ro trách nhiệm pháp lý cho những người đóng góp dữ liệu. Chủ sở hữu các tập dữ liệu thường miễn cưỡng chia sẻ chúng công khai do họ thiếu kiến ​​thức về các giấy phép dữ liệu khác nhau. Nếu các nhà cung cấp dữ liệu hiểu rằng quyền sở hữu dữ liệu của bạn được bảo vệ tốt và sẽ không bị lạm dụng, thì sẽ có nhiều dữ liệu mở hơn sẽ có thể truy cập được.

Dự án OpenBytes cũng sẽ tạo ra một định dạng tiêu chuẩn cho dữ liệu được xuất bản, chia sẻ và trao đổi trên nền tảng mở của bạn. Một định dạng thống nhất sẽ giúp các nhà cung cấp dữ liệu và người tiêu dùng dễ dàng tìm thấy dữ liệu liên quan mà họ cần và tạo điều kiện hợp tác. Các tính năng OpenBytes này sẽ giúp dữ liệu chất lượng cao có sẵn và dễ truy cập hơn, điều này có giá trị đối với toàn bộ cộng đồng AI và sẽ tiết kiệm tài nguyên khi thu thập dữ liệu lặp lại.

Mike Dolan, Giám đốc điều hành và phó chủ tịch cấp cao của các dự án cho Linux Foundation.

Cuối cùng, nếu bạn quan tâm có thể biết thêm về nó, bạn có thể tham khảo chi tiết Trong liên kết sau đây.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.