(2017年8月16日)美国数字公共图书馆正在从OAI存储库开始快速,大规模数据收获的开源工具。该工具使用一个火花分布式处理引擎加速和放大收集操作,并对收获数据进行复杂分析。它是帮助DPLA改进内部工作流程,并为集线器提供更好的服务。这Spark Oai Harvester自由地提供。
完整的公告是这里。
(2017年8月16日)美国数字公共图书馆正在从OAI存储库开始快速,大规模数据收获的开源工具。该工具使用一个火花分布式处理引擎加速和放大收集操作,并对收获数据进行复杂分析。它是帮助DPLA改进内部工作流程,并为集线器提供更好的服务。这Spark Oai Harvester自由地提供。
完整的公告是这里。