露丝·a·佩格尔著
(2016年2月5日)2015年12月初,麻省理工学院技术评论提供了一篇新论文的摘要,该论文使用维基百科的数据对世界上最具影响力的大学进行排名。一个月后,访问公布了摘要另一篇介绍维基百科的论文也使用了维基百科的数据对大学进行排名。在这之间,SCImago和它的研究伙伴提供大学排名网站介绍了谷歌引文排名前2000所大学的第一版。
这篇文章介绍了两个维基百科排名。虽然这两篇文章是技术性的,但它们对我们来说很重要,因为它们提供了衡量大学和考虑大学排名的替代方法。谷歌Scholar (GS)排名使用Webometrics平台,在露丝的排名9.由于这些文章提供了与现有世界排名的比较,本文提供了亚洲和我个人观察的比较表。
维基百科世界大学排名(WRWU)
Lages, Patt和Shepelyansky (Lages 2015)引入了WRWU(维基百科世界大学排名)来衡量影响的大学。他们用2013年版的维基百科与ARWU 2013.他们发现世界前100所大学中有60%的大学是相同的。这篇文章非常技术性,下面引用的声明来自Jose Lages教授的一封澄清邮件。《麻省理工技术评论》的文章简化了数学和结果,我将进一步简化它,以关注对我们来说最重要的东西。
在我们之前的文章中,我们注意到对英语语言研究的偏见。我们的文献计量学家继续篡改来自Web of Science和SCOPUS的数据,以减少这种和其他偏见。由其他学者和研究者决定WOS和SCOPUS的出版内容。维基百科的内容来自大众。维基百科有多种语言版本。例如,大约有400万篇英语文章,150万篇德语文章和100万篇法语文章。我查看了2013年的Web of Science和Scopus,发现超过200万篇英语文章,其中约1%是德语或法语文章。
WRWU的独特之处在于它包含了来自多种语言的结果。拉格斯和他的团队使用了三种类似谷歌算法的算法,从24种语言版本的维基百科中提取出前100名。印度、泰国和马来西亚等亚洲国家的维基百科也被收录在内,因此这些国家的代表性很好。另一方面,香港的代表人数不足,因为它与中国大陆和维基百科的中文版一起,尽管香港的许多顶尖大学都是以英语为基础的。
WRWU基于这些算法包括三个独立的指标。大学的名字会被手工核对,纯研究机构的名字会被删除。
网页排名(WPRWU)根据传入链接对大学网站进行排名。使用PageRank算法,“如果其他重要的文章指向某篇文章,那么这篇文章就会变得更加重要。”这个排名把最常被引用的文章排在最前面。”
CheiRank算法(WCRWU基于外发链路。使用这种算法,“如果一篇文章指向了其他重要的文章,那么它就会变得更加重要。”这个排名是最具传播/交流性的文章。”
2drinks (W2RWU)基于传入和传出链接
这篇文章列出了世界上各指标排名前十的大学。表17.1在这三项指标中,亚洲大学排名前十,并且与亚洲大学排名重叠。来自日本、中国、新加坡、马来西亚、泰国和印度的23所大学进入了WPRWU前200名。26个国家进入了WCRWU的前200名,将香港和朝鲜加入了该名单。还有20个在W2RWU的名单上。这些大学的名字很多都是陌生的私立大学,包括朝鲜的金日成大学(Kim Il-song University)。超过1000所大学的额外数据集可在独立的网站.
两位作者用形容词“有影响力的”来描述他们的名单,并强调维基百科对多个世纪和文化的覆盖。世界排名前100位的大学中,WPRWU和ARWU的重叠比例为62%,美国大学的数量从ARWU的58所下降到WPRWU的38所。德国大学排名第二。
历史悠久的大学在WRWU中也表现不错。1925年排名的19所大学中有13所(休斯大学)位于前20名之内。表17.2将已有90年历史的休斯排名与WRWU、Wikiometrics和ARWU进行了比较。作者“相信维基百科的排名提供了对世界大学的可靠的数学统计评估,可以看作是一个新的独立的排名互补已经存在的方法。”
我们检查了WOS和SCOPUS中基础数据创建的许多衍生指标。Katz和Rokach(2016)提出了“维基计量学,即从维基百科中派生出的指标和指标。”他们认为维基百科代表了“现实世界,因为它的规模、结构、编辑政策和受欢迎程度。”他们对维基百科的信任建立在[我的笔记]:
- 超出现有百科全书的规模和范围[相当于当前两年的英文传统学术论文]
- 及时更新[不延误同行评审过程]
- 标签和元数据[由人群产生]
- 群众的智慧——衡量受欢迎程度和重要性的标准
他们使用2013年12月维基百科上的维基计量与2011年ARWU、泰晤士高等教育和Webometrics(卡茨,表4,第11页)的排名进行了比较。他们查询DBpedia从维基百科中提取关于“大学”一词的数据,然后只包括上述三种排名中的两种,结果是389所大学。相关性显示,维基百科世界顶尖大学与其他三所大学之间存在显著的统计关系。注意,在这次比较之后,THE改变了它的底层数据,但没有改变它的权重。还需要注意的是,在整个数据集中,有8所亚洲大学进入前200名,53所亚洲大学进入前200名。
维基百科使用维基百科的三个功能来计算排名:链接、页面浏览量和Infobox元数据。作者将他们的方法应用于大学和期刊的排名,但我们只涉及大学。
链接:类似于上面传入的链接,但不同的方法
整体页面浏览量在固定的时间段内
信息框数据确定大学、教员和校友。它计算了一所大学的所有成员,无论他们的附属机构是否“学术”。看到Figure17.1查询机构和个人Infobox的示例。
表17.3将维基百科中的亚洲大学与其他数据库进行了比较。前20名的重叠部分是The和ARWU的65%和Webometrics的50%。数据以提取的形式呈现,没有大小或主题的控制。
这个排名是“一个测试在排名网站中包含GSC数据是否合适的实验”,但“在第一次迭代中存在许多缺陷”。
方法:
1.只选择机构概况
谷歌创建机构档案的基础上,教师建立自己的谷歌档案,使用“规范化名称”为自己和他们的大学,并使用机构的电子邮件地址。我查看了我自己的谷歌学者简介,其中列出了夏威夷大学作为我的从属机构,与埃默里大学的电子邮件,“文章”的列表是大部分(我不知道多少是“大部分”)准确的,缺少的文章(包括文章来自访问)和非文章和重复条目,但这并不重要,因为,
2.只收集每所大学排名前10的公开资料。这是考虑到a大小独立比较。根据Webometrics,更多的个人资料可能会被添加。
3.第一作者被排除在外,剩下9个简介。如果一个作者有多个简介,数据库只包括“最好的”。
4.“数字仅在收集时有效。”
5.因为谷歌指标是由算法自动导出的,所以每个作者都有责任设置自己的配置文件,使它们保持最新。监督名单以防止虚假进入是各机构的责任。在我所熟悉的一所大学里,一位顶尖的教员已经不在了,而亚洲教员在个人简介中展示自己名字的方式也不一致——是西方的还是东方的
显示包括排名、机构、国家和被引次数。
在计算大小时,没有按主题或多个作者的细分计数进行规范化。没有提到日期范围。排名前十的大学中有七所来自美国,另外三所来自英国。第一所亚洲大学是排名第40位的新加坡国立大学,第一所欧洲大陆大学是排名第51位的瑞典隆德大学。看到表17.4对比两个商业引文来源,WOS和SCOPUS的亚洲顶级大学名单。根据Isidro F. Aguillo的说法,“我们有很多基于GSC的排名:根据国家,根据拥有100英镑的人,当然,这只是机构的试验。以后还会有更多版本,可能会定期推出。”
结论:
这些排名以及其他可选择的指标鼓励我们思考排名的目的以及什么对谁来说是重要的。维基百科的排名并没有衡量学术成果。相反,两位作者讨论的是影响力、受欢迎程度和重要性,衡量标准是大众,而不是学者。基于维基百科的排名不按主题或规模进行过滤。结果是社会科学领域的大学和历史信息相关的较老的大学被更多地纳入其中。WRWU之所以有吸引力,是因为它整合了维基百科24种语言版本的大学。学者总是受欢迎,因为它有更多的引用。然而,它取决于机构和作者为自己提供稳定的、消除歧义的条目。这两篇文章的作者不确定他们是否会更新他们的结果。Webometrics承认,它将继续在现有的大学排名网站平台上测试谷歌学者引用和其他学者指标。 Comparing the three, we see that the world universities at the very top do not change based on methodology. Are scholarly output and Nobel Prize winners (as in ARWU, for example) or inclusion of international students and faculty (THE) the only ways to define the very best? Do we move with the times and integrate the input of the crowd and consider influence and popularity as a measurement of importance in the real world?
看到附录17.1用于比较三个排名,包括与声誉排名的比较。
关于本文中讨论的排名的背景信息,请参见:
露丝的排名5——《泰晤士报高等教育》
露丝的排名第六——ARWU
露丝的排名9- - - - - -计量学
露丝的排名十煽动
露丝的排名14-SciVal
作者的电子邮件:
Aguillo, Isidoro F.,邮件收到2016年2月3日
Katz, G. email收到2016年1月13日,包括数据集的副本
Lages, J. email收到2016年1月24日
参考文献
休斯,智慧(1925)。美国研究生院的一项研究。牛津大学。俄亥俄州排名转载于H.W. Magoun(1966)。关于研究生教育质量的卡特报告:根据该报告编制的机构和部门排名。高等教育学报, 37(9)页484。
Katz, G和Rokach, L.(2016年1月8日)。维基百科:基于维基百科的排名系统。2016年1月28日http://arxiv.org/abs/1601.01058
Lages, J, Patt, A Shepelyansky, D.L.(2015年11月29日。维基百科世界大学排名。Arxiv(将发表在欧洲物理杂志)1月28日访问http://arxiv.org/abs/1511.09021
《麻省理工科技评论》(2015年12月7日):维基百科挖掘算法揭示了世界上最有影响力的大学。http://www.technologyreview.com/view/544266/wikipedia-mining-algorithm-reveals-worlds-most-influential-universities/
大学排名网站(2015年12月)。谷歌引文排名前2000的大学。第一版,afhb.com访问2106年1月22日http://www.webometrics.info/en/node/169
露丝的排名
露丝的排名和新闻更新列表在这里.
*露丝·a·佩格尔(Ruth A. Pagell)目前是夏威夷大学图书馆与信息科学项目的兼职教师。在加入UH之前,她是新加坡管理大学李嘉诚图书馆的创始图书管理员。她在图书管理的各个方面都有广泛的写作和演讲,包括为ACCESS撰写文章- - - - - -https://orcid.org/0000-0003-3238-9674.