(2015年1月27日)从牛津大学博德利图书馆和密歇根大学图书馆领导的合作计划的一部分,1473-1700年的25000多篇早期英语课文已经在网上公布给公众。
从莎士比亚和弥尔顿到鲜为人知的关于巫术、烹饪和剑术的书籍,这个丰富的数据集包含完全可搜索的文本文件,可以在线阅读或以各种格式下载。
本电子文本语料库由早期英语书籍在线文本创建合作伙伴关系(EEBO-TCP),大学、资助者和学位论文全文数据库,一家全球研究中心的信息公司。此前,这些文本仅向参与合作的大学图书馆的用户提供,但数据于1月1日发布到公共领域。
我们正在向那些通常无法阅读的人开放这些精彩的书籍。博德莱恩图书馆(Bodleian Libraries)数字馆藏负责人迈克尔·波帕姆(Michael Popham)说,我很想看看人们会用它们做什么。
全世界的公众、教师和研究人员现在都可以查阅英国印刷前两个世纪出版的数千份英文文本的抄本。语料库包括乔叟和培根等文学巨擘的重要作品,但也包含许多罕见和鲜为人知的材料,这些材料以前只有那些能够在大学图书馆获得特别收藏的人才能获得。
纯文本文件是一个独特的资源,供公众浏览有趣的话题和标题,从巫术和顺势疗法到诗歌和食谱。除了浏览和阅读这些早期英语书籍的纯文本版本外,EEBO-TCP用户还可以搜索整个语料库,其中包含200多万页和近十亿个单词。文本采用可扩展标记语言(XML)进行编码,允许个人在整个作品集、个人书籍甚至特定文本部分(如舞台指示或目录)中搜索关键字和主题。
阅读非常详细的公告在这里.