OpenBytes,一个新的 LSF 项目,旨在使开放数据更加可用和可访问

在 Linux 基金会会员峰会期间, Linux 基金会 推出两大新项目«OpenBytes 和 NextArch 基金会 »。

其中之一 “OpenBytes”是与 Graviti 数据集管理平台合作的产物 并表示该项目有望成为 “开放数据社区”以及新标准 和数据格式主要用于人工智能应用,而由腾讯牵头的 NextArch 则致力于创建支持各种环境的软件开发架构。

目标 OpenBytes 项目 是为了降低有兴趣共享其数据集的组织和个人的法律风险 与其他 AI / ML 项目。 由于担心许可限制,数据控制者通常不愿共享他们的数据集。

根据 Linux 基金会的说法,能够向数据管理员保证他们的数据权利受到保护并且他们的数据不会被滥用将有助于使更多的数据集开放和访问。

“OpenBytes 项目和社区将通过以下方式使所有 AI 开发人员、学者和专业人士受益 大小公司都一样,因为它们提供对更高质量的开放数据集的访问并使公司
AI 部署更快、更容易,”总经理 Mike Dolan 说。 和项目高级副总裁
来自 Linux 基金会。

人工智能和机器学习的法律风险可以在最近的几起诉讼中看到。 例如,去年,IBM 被指控违反了《伊利诺伊州生物识别隐私法》,因为它在其 Variety of Faces 数据集中使用了原告的照片。 此外,去年针对亚马逊、谷歌、微软和面部识别公司 FaceFirst 分别提起诉讼,指控他们使用该数据集来训练他们的面部识别算法。

基于此,OpenBytes 将使由 Graviti 领导的开发人员和数据科学家社区能够创建允许每个人都做出贡献的标准和数据格式。

“长期以来,由于普遍缺乏来自现实世界用例的高质量数据,数十个人工智能项目一直受到阻碍,” Graviti 创始人、前高级机器学习小组的机器学习专家 Edward Cui 说。优步的技术。 . “获取更好的数据对于人工智能发展的推进至关重要。 为此,迫切需要创建一个基于协作和创新的开放数据社区。 Graviti 相信发挥我们的作用是我们的社会责任。

在创建开放数据格式和标准时, OpenBytes 项目可以降低数据贡献者的责任风险。 由于缺乏对不同数据许可的了解,数据集的所有者通常不愿意公开共享它们。 如果数据提供者了解您的数据所有权受到良好保护且不会被滥用,则将可以访问更多开放数据。

OpenBytes 项目 还将为发布、共享和交换数据创建标准格式 在您的开放平台上。 统一的格式将帮助数据提供者和消费者轻松找到他们需要的相关数据并促进协作。 这些 OpenBytes 功能将使高质量数据更容易获得和访问,这对整个 AI 社区都很有价值,并将节省重复数据收集的资源。

“OpenBytes 项目和社区将使大小公司的所有 AI 开发人员(无论是学术还是专业)受益,因为它可以访问更多高质量的开放数据集并使 AI 实施更加快速和轻松,”首席执行官 Mike Dolan 说。 Linux 基金会项目高级副总裁。

最后,如果你有兴趣了解更多,可以咨询详情 在下面的链接中。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责数据:MiguelÁngelGatón
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。