哈佛法学院图书馆启动机构数据计划
今天,哈佛法学院图书馆推出了机构数据计划 (IDI)。这项开创性的研究项目旨在与图书馆、博物馆、政府机构和各种组织合作,将其藏品数字化并将其发布为可访问数据。此类数据有望支持众多应用,特别是在训练高级 AI 模型方面。
该计划的重点领域
IDI 的初期工作将集中于增强哈佛图书馆已数字化的 100 万本公共领域图书的收藏。此外,它还将与波士顿公共图书馆合作,将数百万页历史报纸转换为可用的数据格式。虽然 IDI 的主要重点是长篇文本,但它打算探索涵盖各种数据类型的合作伙伴关系,包括科学和生物医学数据集。
支持和资金
该计划得到了行业领导者微软和 OpenAI 的支持,表明其目标得到了强有力的机构支持。展望未来,IDI 旨在通过与慈善组织和行业利益相关者的合作来获得持续的资金。
主要利益相关者的声明
微软副总裁兼副法律顾问 Burton Davis 评论了该举措的意义:
“微软很自豪能够支持机构数据计划的建立,该计划将致力于为所有 AI 建设者提供更多获取知识和高质量数据的渠道。我们致力于实现广泛的数据访问,并赋能更具包容性的 AI 生态系统。自 2020 年以来,我们一直致力于缩小数据鸿沟,确保每个组织都能获取创新和取得更多成就所需的数据,这对于发展充满活力、竞争力强的 AI 经济至关重要。”
微软的观点强调了围绕开放数据进行协作的重要性。2020 年,该公司发起了开放数据运动,为致力于开发 AI 技术的组织提供获取重要数据资源的便利。
OpenAI 知识产权和内容主管 Tom Rubin 也分享了他对 IDI 的看法:
“长期以来,学术机构一直是人工智能研究和进步的关键合作伙伴,哈佛大学的机构数据计划就是一个很好的例子。公共领域在知识和创造力的传播中发挥着至关重要的作用,OpenAI 很高兴支持这项工作。我们受到了 Zittrain 教授在这个重要项目中的领导作用的启发,并渴望看到它的影响。”
结论
通过提供对大量数据集的开放访问,机构数据计划将在推动人工智能技术发展和确保更多人能够享受其优势方面发挥重要作用。
欲了解更多信息,请访问来源。
发表回复