您的位置:首页 > IT科技 >

Linux 基金会促进数据集共享和软件开发技术

时间:2021-11-04 12:34:00 来源:

在本周的Linux 基金会会员峰会上,Linux 基金会——一个成立于 2000 年的非营利性技术联盟,旨在标准化 Linux 并支持其发展——宣布了新项目:OpenBytes 项目和 NextArch 基金会。OpenBytes 是一个“开放数据社区”,也是一种主要针对人工智能应用的新数据标准和格式,而由腾讯牵头的 NextArch 则致力于构建支持各种环境的软件开发架构。

开放字节

由于缺乏许可证知识,数据集持有者通常不愿意公开共享他们的数据集。在普林斯顿最近的一项研究中,合著者发现许可的不透明性——以及衍生数据集和 AI 模型的创建——会带来严重的道德问题,尤其是在计算机视觉领域。

OpenBytes 是一项多组织工作,负责创建开放数据标准、结构和格式,目标是在 Linux 基金会的治理下降低数据贡献者的责任风险。发布、共享和交换的数据格式将在项目的未来平台上可用,表面上可以帮助数据科学家找到他们需要的数据并简化协作。

Linux 基金会高级副总裁 Mike Dolan 认为,如果数据贡献者明白他们的数据所有权受到良好保护并且他们的数据不会被滥用,那么更多数据将变得可访问。他还认为像 OpenBytes 这样的举措可以在重复的数据收集任务上节省大量的资本和人力资源。根据 CrowdFlower 的一项调查,数据科学家将 60% 的时间用于清理和组织数据,19% 的时间用于实际收集数据集。

“OpenBytes 项目和社区将使所有 AI 开发人员,无论是学术界的还是专业的,以及大小企业的,都可以通过访问更多高质量的开放数据集并使 AI 部署更快更容易,”Dolan 在一份声明中说。

自动驾驶汽车公司Motional(现代和 Aptiv 的合资企业)、Predibase、Zilliz、Jina AI 和 ElectrifAi 都是 OpenBytes 的早期成员。

下一个拱门

对于 NextArch,它旨在充当开源开发人员和贡献者的“中立之家”,以构建可以支持微服务之间兼容性的架构。“微服务”是指一种能够快速、频繁、可靠地交付大型复杂应用程序的架构。

云原生计算、人工智能、物联网 (IoT) 和边缘计算刺激了企业增长和数字投资。根据市场研究,2020 年数字化转型市场价值 3361.4 亿美元,预计 2021 年至 2028 年将以 23.6% 的复合年增长率增长。但缺乏通用架构正阻碍开发者充分实现这些技术。承诺,Linux 基金会执行董事 Jim Zemlin 断言。

“今天的开发人员必须在不同的技术基础设施和解决各种问题的适当工具之间做出看似不可能的决定,”泽姆林在一份新闻稿中说。“每种工具都会带来开发人员没有时间去了解的学习成本和复杂性,但人们期望他们能跟上加速开发和创新的步伐。”

企业普遍看到新兴技术、下一代平台和客户渠道的巨大价值。德勤报告称,数字技术的实施可以帮助加快实现财务回报、劳动力多元化和环境目标等组织目标的进度,最高可达 22%。但现有的阻碍因素往往会阻止公司充分实现这些好处。根据Tech Pro 的一项调查,管理层和用户的支持、对员工进行新技术培训、制定治理政策和程序以及确保具备正确的 IT 技能来支持数字技术仍然是数字转型实施的挑战。

为此,NextArch 旨在通过“基础设施抽象解决方案”,特别是新的框架、设计和方法来改善数据存储、异构硬件、工程生产力、电信等。该项目将寻求自动化操作和流程,以“增加 [软件] 团队的自主权”,并为企业创建工具以解决数字化转型中的产品化和商业化问题。

“NextArch ......明白解决我们这个时代最大的技术挑战需要建立一个开源生态系统并促进合作,”多兰在一份声明中说。“这是一项使命重大的重要工作,只能在开源社区中完成。我们很高兴支持这个社区并帮助建立开放的治理实践,使整个生态系统的开发人员受益。”

免责声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,并不代表本站赞同其观点和对其真实性负责。如有侵权行为,请第一时间联系我们修改或删除,多谢。

Copyright © 2021 山西商业网 All Rights Reserved