2024年3月18日发(作者:)
2015年11月
NOV.20l5
情报探索
Information Researeh
第11期(总217期)
No.11(Serial No.217)
五大学术搜索引擎比较水
谢 奇 李立立 毕玉侠
(1.沈阳药科大学图书馆 辽宁沈阳 110015)(2.沈阳奥新全民口腔医院 辽宁沈阳110013)
摘要:对Google、微软、百度、好搜和超星百链云五大学术搜索的信息来源、检索功能、检索结果及个性化服务进行了对比
分析,指出各自的优点和缺点,以期为用户在学术搜索工具的选择和使用上提供指导和帮助。
关键词:Google学术搜索;微软学术搜索;百度学术搜索;360好搜学术搜索;超星百链云;文献检索
中图分类号:G254.928 文献标识码:A doi:10.3969 ̄.issn.1005—8095.2015.11.010
Comparison of Five Major Academic Search Engines
Xie Qi Li Lili Bi Yuxia
(1.Shenyang Pharmaceutical University Library,Shenyang Liaoning 1 10015)
(2.Shenyang Aoxin Q&M Stomatology Hospital,Shenyang Liaoning 1 10013)
Abstract:The paper compares and analyzes five major academic search engines of Google Scholar,Microsoft Academic Search,
Baidu Scholar,Haosou Scholar and Super Star Bailianyun,from aspects of information source,retrieval function,retrieval resuh and
personalized service,and points out their own advantages and disadvantages,SO as to provide guidance and help for user’s selecting
and using of academic search engines.
Keywords:Google Scholar;Microsoft Academic Search;Baidu Scholar;Haosou Scholar;Super Star Bailianyun;document retrieval
1 五大搜索引擎简介
Google Scholar(简称GS,http://scholar.google.
合索引,完成图书、期刊、学位论文、会议论文等各种
类型学术资源的一站式检索,使广大用户通过网络
便可以检索、查找和获取海量信息资源。同时它也是
套资源共建共享解决方案,授权用户可以非常方
一
con)是Google公司专门为科研人员准备的一种学
术搜索引擎。2004年l1月发布了第一个Beta版,
2006年1月扩展到中文学术文献领域。
微软学术搜索(简称MAS。http://academic.re—
search.microsoft.tom)是微软研究院开发的免费学术
搜索引擎。2009年11月正式发布了第一个全学科
版本,目前还不支持中文文献检索[”。
便地获取到全文文献¨4]。
2五大搜索引擎对比分析
2.1信息来源
GS的收录范围:主要来自学术著作出版商、专
百度学术搜索(简称百度学术,http://xueshu.
baidu.con)是百度公司旗下的提供海量中英文文献
检索的学术资源搜索平台,涵盖了各学科的期刊、会
议和学位论文,2014年6月初上线[2]。
业性社团、预印本、各大学及其他学术组织的经同行
评论的文章、论文、图书、摘要和文章,还有技术报
告、专利文献以及美国联邦和各州的地方法院、上诉
法院和最高法院的法律意见书全文等。具体来源主
要有3个部分,首先是学术性商业数据库;第二部分
是出版社的网站:第三部分来自于“.gov”“.org”和“.
360好搜学术搜索(简称好搜学术,http://
xueshu.haosou.con)是360公司推出的免费学术搜
索服务,于2014年8月发布。它汇聚了海量中英文
学术期刊论文,2015年360公司将其搜索服务整体
独立为好搜品牌 。
edu”的信息.包括高校校园网、政府、机构及任何提
供学术文献的网站等 ]。
微软学术搜索的收录范围:包括全部学科领域,
共分为l5个不同的学科和超过200个二级学科。包
括期刊出版物、会议论文集、报告、白皮书、预印本和
各种其他内容类型。网站上公布的数据包含87家国
外最著名的内容出版商。
超星百链云(简称百链,http://www.blyun.con)
是超星公司推出的图书馆整合门户,利用互联网搜
索引擎技术预先对海量的中外文文献元数据进行整
收稿日期:2015—05—14
本文系辽宁省科学技术厅攻关计划“医药信息咨询服务系统项目”(项目编号:2013216033)研究成果之一。
作者简介:谢奇(1981一),男,硕士,馆员,研究方向为计算机网络技术在图书馆的应用,已发表论文10余篇;毕玉侠(1973一),女,
博士,研究馆员,研究方向为医药信息、药事管理,已发表论文30余篇。
42
2015年11月 谢奇等:五大学术搜索引擎比较 第11期(总217期)
百度学术的收录范围:收录了全球70万个站点
的3.5亿学术资源,包括国内中文站点知网、维普、
万方.以及外文学术站点PubMed、Springer、IEEE
MAS目前只提供英文页面,同时也不支持中文
检索.但在输入中文作者名时会自动提示作者的英
文名字.并按照作者单位区别同名作者。MAS主界
面中不但有一框式检索入口,还提供了l5大类的详
细学科分类目录.每一个大类学科还可以进一步细
分成许多子学科。通过该学科列表,研究人员可以轻
松获得某个学科或子学科中最有影响力的论文、作
等,学科领域覆盖了自然科学、医学、农业、工业技
术、信息工程、人文科学、哲学等全部学科。
好搜学术的收录范围:收录了国内外学术站点
超过2万家,如中文学术站点知网、万方、维普,外文
学术站点aem、IEEE、springer等,共计收录中外文学
者、会议、期刊、机构和关键词等信息。
2.3检索功能
术资源总量逾2.65亿。其中,外文近1.3亿,中文超
1-35亿。
百链的收录范围:包括全国800多家图书馆内
的各种数字资源。囊括260多个中外文数据库、4.5
检索功能的强弱是评价搜索引擎质量的一个重
要指标。GS已经推出超过10年了,它几乎完全继承
了google的检索习惯和检索功能。检索功能强大。非
常便于用户检索。MAS也已经推出5年多,却几乎
亿条元数据的共享电子参考源,包括中外文图书、中
外文期刊、中外文学位论文、会议论文、专利、标准
等,其中370万中文图书书目、7800万篇中文期刊
元数据、15 478万篇外文期刊元数据,并且数据量还
在不断增加中。同时利用百链还通过文献传递平台
获取到全文,据称中文资源的传递满足率可以达到
没有继承到必应搜索引擎(bing)的高级检索功能,
尤其是近几年检索功能几乎没有改进。MAS还拥有
许多其学术搜索不具备的特色检索功能.其功能将
在后面章节加以介绍。百度学术刚刚推出将近一年.
其高级检索功能虽然还没有完全体现出来。但其检
96%,外文资源的传递满足率可以达到90%。
2.2检索界面
GS、百度学术、好搜学术和百链都提供简体中文
版界面,首页简单明了,均直接采取用户最熟悉的一
框式检索人口.用户在检索框中输入自己的检索词
点击检索或按下回车键即可完成检索。此外,GS共
支持40种语种页面。更具有国际性,百链可通过选
择全部、图书、期刊、报纸、学位论文、会议论文、专利
标准、视频、电子书等频道限制检索范围。
索能力还是非常强大,值得肯定。好搜学术和百度学
术发布时间几乎一致,但其目前连传统的网页搜索
必须具备的检索词提醒、纠错等功能都不支持,远远
落后于百度学术。百链的检索功能更接近于传统的
学术数据库,具有非常强大的限制字段检索、二次检
索以及支持众多操作符的专业检索等功能。用户非
常容易优化自己的检索策略,从而检索到自己所需
的文献。五大搜索引擎检索功能对比见表1。
表1 五大搜索引擎检索功能对比
2015年11月 情报探索 第11期(总217期)
2.4检索结果页面
定义排序、全文突出显示、被引次数、相关文献、被引
检索结果页面包含的功能越丰富,越有助于用
户准确地找到自己想要的文献。从实测结果上看,学
术搜索都将检索结果进行了结构化处理,结果格式
较为统一.均包含文献题名、作者、年代及来源等主
要信息。GS、MAS、百度学术及好搜学术还加入了自
文献等。并且可将检索结果按照标准引文格式输出,
但不支持检索结果的多选或全选.在检索结果的保
存上较为不便。百链更接近传统学术数据库,尤其是
提供原文传递的功能,非常有助于用户获取到全文。
具体检索结果页面比较见表2。
表2五大搜索引擎检索结果比较
2015年11月 谢奇等:五大学术搜索引擎比较 第11期(总217期)
需要特别指出的是,MAS的检索结果与传统学
术搜索相比,还采取了许多创新功能。它的检索结果
不仅仅是文献,而是涉及到学术的方方面面,如检索
词概念的显示、机构地图定位、期刊信息、会议信息,
同时还通过大量可视化的形式展示了很多隐藏在搜
索结果背后的具有价值的信息,如显示学科研究动
态的叠加分布图、显示全世界研究机构和人员的学
索。MAS比较开放。除了支持微软的Windows Live
ID以外.还支持Facebook、Yahoo、Google帐号登录。
GS、百度学术和百链都使用各自产品的在线统一帐
号登录,其中GS只有在帐号经过大学学校邮箱地址
验证后,才可以享受发布个人学术成果等功能。
此外MAS允许用户在线修正错误的作者、论文
及期刊等信息。以尽可能保证最新、最准确的学术信
术地图、不同文献、作者、期刊、会议、机构的发文及
被引趋势的曲线图、以作者为中心的合作关系图以
及根据合作关系图编织而成的学术关系网、显示作
者间学术遗传关系的学术家族树、不同机构所发表
论文量、排名、引用量、研究侧重、机构的h指数以及
所属学者的对比曲线图等E 。我们在使用中发现,直
接在检索框输入检索词进行检索经常不能显示出这
息。目前支持修改的数据项包括:作者的基本信息,
如姓名、所属机构、头像及个人主页等,论文的基本
信息以及全文.确认论文归属等。用户的修改经编辑
验证通过后更新在网页上。这一点创新非常值得推
广,由于学术搜索自动抓取的网络信息,难免存在各
种错误。让用户个人向提供信息的网站联系并修改
错误信息,虽能一劳永逸解决问题,但不太容易实
现,且更新缓慢。MAS允许用户修订错误内容,使问
题的解决更便捷更易于实现,但大量的数据审核将
给MAS造成较大负担。五大搜索引擎个性化功能比
较见表3
些功能,而通过点击检索结果中的超链接才可以体
验到这些功能。
2.5个性化功能
好搜学术是唯一未提供个性化功能的学术搜
表3五大搜索引擎个性化功能比较
3检索实例比较
度学术和百链检索结果完全正确,查全率和查准率
都较高,好搜学术也非常接近,而GS仅检索出7条,
但如果将未检出的文献单独通过GS检索.则大部分
都可以检出,显示GS服务器搬离后对文献的检索效
率有所影响。
表4实例检索结果数量比较 条
为便于评估检索的查全率和查准率.本文分别
使用中英文2个检索式来进行检索测试。中文以检
索沈阳药科大学谢奇发表的中文期刊论文为例,英
文以”data mining”为例(检索时间为2015年2月10
日)。检索结果如表4所示。
其中除百链外,其他检索结
果中部分包含了引文数量.好搜
学术检索结果中不但包括文献
和引文文献,还包括引证文献。
除MAS主要是英文文献外.其
他均包含中外文数据库文献。
本例中的中文文献检索.百
2015年11月 情报探索 第11期(总217期)
对于本例中的英文文献检索,GS和百度学术
检索数量最多,GS检索结果超过1000条后只显
示1000条,1000条以内按实际数量显示;但百度
学术检索结果数量较大时,返回的检索结果一般
最多在800条左右,而小于1000条检索结果时实
际返回检索结果也比较少,无法核实检索数量的
真实性。好搜学术、MAS和百链数量较少,从2015
年的数据量可以看出,它们的数据更新速度远远
落后于GS和百度学术.MAS近年来似乎停止了
数据的大幅度更新。
4结论
GS充分体现出了传统搜索引擎的实力.检索界
面及方式简单明了、检索功能强大、文献来源众多、
类型丰富、支持数十种语言、检索结果准确。同时通
过各自文献管理软件还可以实现检索结果的批量获
取。但对文献的聚类筛选、引文的管理等够方便、精
细:提供的检索方式还不够丰富,不能充分满足用户
精确检索的需求。尤其是退出中国市场后,对于中文
文献的查全率等有所欠缺。
MAS与大部分学术搜索不同,它提供给用户的
不仅仅是文献,而是包括学术研究需要的方方面面,
比如出版物、作者、会议、组织机构、研究领域等信
息,突破了学术搜索是用来“检索论文”的传统观念。
有用户对它评价:“MAS搜索的是学术,而不仅仅是
论文” 。它的优点有:以集合和可视化的方式呈现
检索结果.具有强大的数据挖掘功能:用户可以对错
误数据进行修订等。但由于MAS只有英文界面以及
主要收集英文文献。索引的学术文献信息范围和文
献类型有限、更新较慢。可视化分析没有专门的人
口,检索结果将多种信息集合放在一起导致页面拥
挤.涉及到人名的可视化分析受限于人名消歧技术
的不成熟,错误较多,影响用户体验。同时自2011年
开始数据更新量变得极少,它或许已经停止大规模
索引文献。从目前情况来看,它比较适合想要快速了
解某个学科、用户、机构、关键词等信息的用户使用,
或者可以作为英文文献检索的补充工具使用,不推
荐作为文献检索的首选。
百度学术作为中国排名第一的搜索引擎百度旗
下的新服务。对于中文文献的支持具有先天的优势。
其界面友好,数据来源众多,各语种文献量均较大,
尤其是对中文期刊文献的覆盖较为全面,检索方式
和检索功能与GS较为一致,检索结果经过规范的
结构化处理后非常整洁有序,引入了传统数据库常
用的聚类分析功能,被引次数独立显示非常醒目,同
时还有国内用户最为关注的8种期刊索引或核心目
录的收录情况。百度学术的不足之处主要有:文献类
型较少;检索功能有待加强,支持字段和检索运算符
较少,缺乏二次检索和组合检索等功能;检索结果不
准确,分类混乱,只能显示几百条数据;检索结果整
理功能较弱等。百度学术目前可以作为检索中文文
献的首选,在检索结果预期只有数百条的情况下也
可以作为外文文献检索的首选。
好搜学术目前还刚刚处于起步阶段,检索结果
不仅包含了常见的文献题录、参考文献,还包括引证
文献、相似文献等。但存在检索功能少:检索结果还
不太准确,还需要进一步细分等欠缺。目前不建议将
好搜学术作为文献检索的首选.但可以作为GS和百
度学术的补充。
百链和上述4种具有互联网基因的免费服务明
显不同,它本身是一套需要付费的商业化系统,更类
似于一款联邦检索系统.本文将它与前4种一起比
较,主要是为了提供一种差异化服务的参考。百链收
录范围较广,检索结果准确有效,数据更新较快,最
突出的特点是几乎所有的文献都可以获取到全文.
且文献传递服务效率及成功率都较传统图书馆高,
但收录的范围小于互联网学术搜索,题录信息不够
全面。百链可以作为普通用户低成本高效率获取原
文的途径,也可以作为机构用户文献保障的一种有
效方式。
参考文献
[1] 赵蓉英,陈烨.学术搜索引擎Google Scholar和Mi—
crosoft Academic Search的比较研究[J].情报科学,2014(2):
3-6.
[2]百度学术搜索[EB/OL ̄.[2015—04—101.http://
baike.baidu.corn/view/5844732.htm.
[3]好搜学术[EB/OL].[2015—04—10].http://xueshu.
haosou.corn.
[4]刘晓坤,任俊革,李维云.Google学术搜索与百链云
图书馆文献检索比较研究[J].大学图书情报学刊,2013,31
(4):43—46.
『5] 陈家翠,谷玉荣.GooSe学术搜索检索性能的分析
及评价[J].情报理论与实践,2007,30(5):653—655.
『61 许剑颖.微软学术搜索初探[J].情报探索,2012
(12):96—100.
[7]Microsoft Academic Search-more than just fancy[OL/
EB].[2015—04—10 3.http://blog.sina.COB.cn/s/blog_61eae3e
301O0mb ̄.htm1.
发布者:admin,转转请注明出处:http://www.yc00.com/web/1710765565a1811792.html
评论列表(0条)