(2014年11月17日,法明顿山)认识到数据分析对数字人文领域的好处,Gale,圣智学习的一部分,将提供其内容盖尔数字集合供学术研究人员进行数据挖掘和文本分析。数据挖掘和文本分析——通过识别实体、关系和行动的软件抓取文本或数据集的过程——帮助研究人员在不同的数据中得出新的结论,并正在成为一个重要的学术研究领域。
Gale将根据客户要求提供内容,并以一种成本效益高的方式使用数据挖掘和文本分析。大部分的内容盖尔数字集合,包括基本的研究数据库十八世纪馆藏在线和19世纪馆藏在线,以及盖尔大量的报纸档案和其他收藏的内容也将公开。除了内容之外,盖尔还在数字档案中提供新的文本分析工具,以帮助那些在其机构中可能没有编程经验或数字人文学科的研究人员。“术语聚类”和“术语频率”工具将从内容中对文本和术语进行分类和索引,生成可视化的信息显示,帮助研究人员轻松识别单词和短语之间的关系。
新闻稿如下在这里链接到关于数据挖掘的网络广播。