(19月19日)随着中国古代角色很复杂,中国经典的数字化是挑战性的。在整个历史中,一个汉字可能有几种变体和书面形式。通过光学字符识别数字化中国古籍(OCR)不仅可以促进机器阅读,而且还为许多古老的书籍提供了新的生命。
阿里巴巴·达摩学院(Damo)是阿里巴巴全球研究所的新项目开始与加利福尼亚大学,四川大学,中国国家图书馆,中国国家图书馆和浙江图书馆的阿里巴巴基金会与阿里巴巴基金会一起向阿里巴巴基金会数字化。该计划旨在数字化和聚合古代汉语图书,并将扫描的图像转换为开放访问的文本。亚博电子游戏app这样,中国和国外的图书馆可以共同努力,使他们的古代汉语自由地提供给世界。
可以找到更多信息这里。