(2020年9月22日)过去的文件是国家图书馆的全文本搜索网站,包含来自新西兰和太平洋地区的150多份报纸,以及杂志、期刊和政府报告。
由于数据的公布,人们现在可以访问从阿尔伯特兰公报到维多利亚时代的78份新西兰报纸的数据,这些报纸都是1900年以前出版的。数据本身由每个问题的METS/ALTO XML文件组成。XML文件位于Papers Past的后面,允许您在文章中定位关键字。
这项工作从2015年就开始了,所以这一切终于发生了,这真是太棒了,就像Greig Roulston,这个项目背后的主要工作人员,在图书馆结束工作一样。
您现在可以从数据集的页面在网站上。
更多细节可以在原帖中找到在这里.