新工具可供矿山世界最大的数字存储库

（2013年4月22日Bloomington，Ind。和Urbana，Ill。）本周哈蒂古研究中心（HTRC）宣布提供哈伊特劳斯特数字图书馆的数据挖掘和分析工具，这是来自世界各地70多个研究图书馆的数字文本集合。新工具提供了对Hathitrust内容的大规模分析的急需入口点。

“我们在印第安纳大学和伊利诺伊大学的所有人都在去年一直致力于这一版本，可以为实现哈伊特劳斯特语料库的第一轮共享计算工具感到自豪，”Beth Plane说，教授说IU信息学院信息学院和赫斯特的联合主任。“我们现在准备分享此框架分析（非消费）研究。”

印第安纳大学和伊利诺伊大学是HTRC的创始合作伙伴。新的基础设施发布遵循2012年HTRC Uncum的HTRC行政管理团队的积极开发路径，HTRC开发人员，研究人员和图书管理员的聚会。用户现在可以在大规模收集中应用复杂的计算研究方法，利用图书馆随着时间的推移制作的元数据。

在HTRC第二阶段（2013年9月至2013年3月），HTRC技术工作组创建了在2012年Uncamp事件中预览的测试版的生产版本。他们现在正在努力向社区测试人员开放资源，他们是HTRC用户组社区的一部分。（对于订阅详细信息，请参阅：https://list.indiana.edu/sympa/subscript/htrc-usergroup-l.的）

“这代表了了解新知识如何从世界上最大的数字图书馆收藏中获取新知识的一项重要一步，”伊利诺伊大学图书馆和信息科学研究生院教授的笔记J. Stephen Downie。HTRC的联合主任。

提供分析点的HTRC服务堆栈基于全新的技术架构。此框架利用现有的分析工具，如夏季（Seasr.org.），Digital Library软件如Blacklight（projectBlacklight.org.）和面向服务的体系结构应用界面。目前的生产阶段包括一个HTRC沙箱，对学者开放，用于评估HTRC服务堆栈作为其实验的一部分。

“这是制定哈伊特古代数字收集的重要阶梯，以创造新奖学金的价值来源，”加州数字图书馆的哈丁委员会议员和执行董事的成员。

相关文章