06385网络信息检索与利用 缩印版大纲

06385网络信息检索与利用 缩印版大纲

2023年7月9日发(作者:)

(20分)填空题 b.com),汉语词典(http:H. Hartig, O. Kowalski, and W. //www .erols.com)Kuhnhauser, ―The BirliX security

等已进入了因特网。

architecture,‖ Journal of Computer

Security, vol. 2, no. 1, pp. 5–21, 2 文献检索中常用符号

1993.的文献类型是 学位论为了准确表达检索内容,缩短上网文 ;(含图书、期刊、学时间,经常需用一些检索符号。

位论文、专利、标准) (1)布尔逻辑符 它是一种最基Future Libraries:dreams,madness & 本的计算机检索传统技术,主要有reality. Crawford,Walt and Michael 逻辑或,用―OR‖或―+‖表示,如Gorman. Chicago:American Library A+ B表示检索包含有A或B、AAssociation,1995文献类型是 和B的文献信息。 逻辑与,用―AN学位论文 (;含图书、期刊、D‖或―*‖表示,如A* B表示检学位论文、专利、标准) 索包含有A和B的文献信息。逻辑检索表达式 (金融危机+经济危非,用―NOT‖或―‖表示。

机)*(企业+公司)*(对策+应对策略(2) 用―?‖表示;如comp+措施)运用了 逻辑与 uter?,可检索到compu

信息检索技术; ter、computers、c如果要查找某一个精确的词组,需omputerize、com要用到 “” 符号(“”?puterization。。

*())。 (3)+/ - 号 加+/- 号表(40分)结合自己的专业兴趣选定示该词必须/不能出现在被检文献一研究课题,列出课题名称,进行信息中。

分析,并进行检索: (4)―‖或() 表示输入的所有检索馆藏书目的情况 检索词为一个整体概念(术语),如检索万方数据库的情况 中南工学院,若不加―‖或()将检检索网络文献信息的情况 索到含有这五个字中的任意一个字我选择第三个 的所有信息,在天网上将查到40网络文献信息检索 0 余条信息,加上―‖或()后,就随着信息技术的飞速发展,信息已只查到3条。

成为人类社会不可缺少的一种资3 已知某站点浏览获取动态信息

源。因特网是全世界最大的信息宝互联网上的各站点经常发布新闻及库,是人类进行科学研究、商务活有关消息。若已知某WWW 地址,动和共享资源的重要手段。如何从就可以在地址框中键入该地址,然这个宝库中迅速、准确地查找所需后回车。开始搜索,在主页上双击情报信息,是人们普遍关注的问题。 信息栏目。中国教育与科研网(h1. 网上信息源种类 ttp://www .edu.c网上文献信息种类繁多,按文献信n)、中国信息网(http://息加工层次,可以分为五类: www .chinainfo.g(1)网上报刊 由于网上文献信ov.cn.) 等,他们经常在网息传送速度快,越来越多的出版商上发表消息。您可以将您常用站点注重在网上发行报刊。 放入您的书签中,以防忘记,同时据统计现已有数百种报纸,近千种便于今后使用。如果您不知某重要期刊,其中很多是免费的。 网址,可使用WWW 搜索引擎。

(2)动态信息 各级政府机构、4 WWW 搜索引擎

高等院校、团体、公司在网上发布搜索引擎是一些在Web 中主动的消息、政策法规、会议消息、研搜索信息并将其自动索引的Web

究成果、产品目录、出版目录、广网站,其索引内容存储于可供检索告等。用户还可以通过Outlo的大型数据库中。搜索引擎建立的ok 设置所爱好的新闻热线。在新索引与目录服务不同,前者搜集网闻热线上不仅能获得动态信息,而页上的单词,后者搜集网页作者简且还能发表自己的看法,与网友进短的特定描述内容。许多搜索引擎行交谈。 索引它搜到的每张网页的每一个单(3)馆藏书目数据库 网上有包词,而另一些搜索引擎则可能只索括美国图书馆在内的6000 多引网页的前二百个至五百个单词。所著名公共图书馆、大学图书馆。 以网站管理员的角度来讲,搜索引(4)网上文献数据库 如我们常擎就是用于检索的软件;而从普通用的Dialog(http:/用户的角度来讲,搜索引擎就是提/www .dialogwe供查询、搜索的网站,或称查询站b.com)、OCLC(http:点、导航站点,即因特网上具有检/www .oclc.org)、索功能的网页的总称。目前网上中等网络系统以及中情所的数据库检文检索引擎在检索信息的准确性、索系统(http://www .c功能完备性以及信息网络度等方面hinainfo.gov.c均存在较大差异。

n) 。 5搜索引擎的类型

(5)参考工具书 如大不列颠百搜索引擎依其检索方式可以分为两科全书(http://www .e种基本类型:一种是全文检索搜索

引擎,;另一种是目录式分类搜索引一,具有较强的实践性的特点。该擎,全文搜索引擎和目录式分类搜课程与其他课程密切相关,在整个索引擎都提供了一个文字输入框和课程体系中处于重要地位。

按钮。检索者可以在文字输入框中 因特网信息的无限、无序、优键入要检索的字、词或短语,再点劣混杂、缺乏统一的组织与控制的击按钮,搜索引擎便会自动搜索,特点,给人们查找和利用信息造成并将检索结果传回给检索者。按钮了一定的不便。能够在因特网中准的名称,有不同的叫法,有―开始‖、确、及时、有效地查找并获取所需―查找‖、―搜索‖、―查询‖、―Sta要的信息,对本专业的学生是一项rt‖、―Search‖、―Go‖、非常重要的技能。这也是开设本课―Find‖、―Getit‖、―Su程的重要意义。

bmit‖等称呼。 全文搜索引擎二、课程目标和基本要求

能把网站的每一页都抓进去,能够通过本课程的学习,使学生能够:

对每个网站的每篇文章的每个词进了解因特网信息资源的特点、种类、行搜索。全文搜索引擎所检索到的信息利用价值及评价、鉴选标准;

结果,不是网站名、网址和内容提了解并掌握因特网信息检索的基础要,而是与在输入框中所键入的关知识

键词相关的一个个网页的地址,和了解并掌握各类型常用网络信息检小段文字。在这段文字中,也许没索工具的功能、特点和评价、使用有所键入的那个关键词,但在该网和检索方法;

页中一定有所键入的那个关键词,了解并掌握学术研究性信息、公共或者相关的词汇。 当遇到一个网站信息及各类专门信息的网上检索平时,目录式分类搜索引擎并不像全台及查找方法。

文搜索引擎那样,将网站上的全部三、与本专业其他课程的关系

信息都抓进去,而是首先把该网站本课程是网络传播专业的基本技能划归来某个类目,再记录一些摘要,课程。在学习本课程之前,学生应对该网站作概述性介绍。目录式分具备计算机和网络的基本知识,因类搜索引擎所检索到的结果是与在此要求本课程的先期课程为《计算输入框中所键入的关键词相关的站机应用基础》。学习本课程之后,使名、网址和内容提要。 学生掌握因特网信息检索的方法, 可以对其他课程的学习起到促进作具体要求及说明附后。 用。

(15分)运用搜索引擎、万方数据

等查找本专业的核心期刊,并列举第二部分 考核内容与考核目标

出5种。 第一章 因特网信息资源

《上海科技翻译》、《外语教学与研一、学习目的和要求

究》、《外国语》、《外语界》、《川外通过本章的学习,考生应掌握因特学报》、《现代外语》、《解放军外语网信息资源的种类和特点,了解因学院学报》、《中国翻译》、《外语教特网信息资源的评价方法。

学》、《中国外语》、《当代语言学》 二、考核知识点与考核目标

(一)因特网上的信息资源(次重(15分)推荐1-2个你经常使用的点)

网站,并对其优缺点进行评价。 网上有什么样的信息:政府信息、GOOGLE 科研信息、教育信息、文化信息、优点:搜索引擎领域的巨人谷歌是休闲娱乐信息。

全球最大的英文搜索网站,但上回网上不太可能有的信息:如有并企答的答案是GOOGLE 的工作人员业公司的战略、发展规划,商业、给的,答案专业,很仔细,也有相关的贸易秘密;商业性库和大多数有版链接,搜索的资料也很全面。搜索权的印刷资料等。

效率高,节省时间。 因特网上信息资源的特点及信息利缺点:属于全球搜索引擎,搜索出用价值

来的结果很多都用不着。广告很多。 因特网信息的特点:无限性和广泛百度 性,多样性,共享性,新颖性,无优点:中国使用最多的搜索网站,序性。

搜索出来的问题很多,速度快,内因特网信息的优越性:价廉,新颖、容多,最简单,最便捷,最易于使深入,广泛直接交流,非正式和自用的,能很方便的和其他用户交流由发表园地。

和学习。

缺点:垃圾内容多 1、识记:网上有什么样的信息;网 上不太可能有的信息;因特网上信课程名称:网络信息检索与利用 息资源的特点和优越性。

课程代码:6385 2、理解:初步认识因特网信息资源 和学习网络信息检索的意义;因特第一部分 课程性质与目标 网信息资源与传统信息的区别。

一、课程性质与特点

本课程是高等教育自学考试网络传(二)因特网上信息资源的种类(重播业的(独立本科段)专业课程之点) 因特网上信息资源的主要类型有以下五种:

(1)Web 信息资源

指建立在超文本、超媒体技术的基础上,集文本、图形、图象、声音为一体,并以直观的图形用户界面展现和提供信息的网络资源形式。

(2)Telnet 信息资源

指借助远程登录(remote login),在网络通信协议Telnet(telecommunication network

protocol)的支持下,在远程计算机上登录,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问、使用远程计算机中对外开放的资源。

(3)FTP 信息资源

FTP(file transfer protocol) 是因特网使用的文件传输协议。该协议的主要功能是完成一个系统到另一个完整的文件拷贝。即在因特网的联网计算机之间传输文件。

(4)用户服务组信息资源

由一组对某一特定兴趣的网络用户组成的电子论坛。如新闻组(usenet

newsgroup)、邮件列表(mailing

list)、专题讨论组(discussion

group)、兴趣组(interest group)、辩论会(conference)等等。

(5)RSS信息资源

RSS是一种用于共享新闻和其他Web内容的数据交换规范,是将用户订阅的内容传送给他们的通令协同格式。

1、识记:万维网信息资源、Telnet 信息资源、FTP 信息资源、用户服务组信息资源、RSS 信息资源的定义

2、理解:因特网信息资源的五种类型目前的应用情况。

3、应用:分别对因特网信息资源的五种类型进行举列说明。

(三)因特网信息资源的评价(次重点)

1、对因特网信息资源进行评价的意义。

2、因特网信息资源的评价标准

(1)目的

(2)范围

(3)内容:准确性、权威性、新颖性、独特性、可靠性、图形和多媒体设计、信息的展示与设计、可操件性。

3、评价方法

(1)定性评价

按照一定的评价标准对被评站点的各方面特征、质量作出主观评判。一般有问卷调查、专家评议等方式。

(2)定量评价

是利用数量分析方法,对调查统计数据进行分析,进而做出较系统、客观的评判。

定量评价主要从以下途径进行:从网页的URL中得到信息;查看网站首页描述;从超级链接中获取信息;参考他人评价。

1、识记:因特网信息资源的评价标准和评价方法,定性评价和定量评价的定义。

2、理解:对因特网信息资源进行评价的意义。

3、应用:任选一网站,对其信息资源进行评价。

第二章 因特网信息检索概论

一、学习目的和要求

通过本章的学习,考生应了解因特网信息检索的主要特点,了解因特网信息检索的各种方法和工具,掌据因特网信息检索工具的工作原理,学会如何对因特网检索工具的性能进行正确的评价。

二、考核知识点与考核目标

(一)因特网信息检索的特点(次重点)

与传统信息检索方式相比,因特网信息检索的主要特点是:

检索范围大

检索效率高

检索工具强大

信息冗余大

1、识记:因特网信息检索的特点

2、理解:比较因特网信息检索与传统信息检索方式。

(二)因特网信息资源检索的方法和工具(重点)

因特网信息检索的方法主要有两种:基于浏览的检索方式和基于关键词的方式。

1、基于浏览的检索方式

包括不依靠任何检索工具的浏览和借助检索工具的浏览。

(1)不依靠任何检索工具的浏览

顺链而行:此为在因特网上发现和检索信息最原始的方法,即在日常的网上漫游过程中,随机地发现一些有用的信息。

收藏网址:个人用户在上网浏览的过程中将一些常用的站点地址记录下来,组织成目录以备今后之需。

不依靠任何检索工具的浏览方式,适合以下几类信息检索的目的:延伸已有信息范围;跟踪新信息;网上信息调研;好奇心驱使;消遣性浏览;享受浏览经验。

(2)借助检索工具的浏览

借助以Yahoo为代表的网络资源目录。

(3)基于浏览的检索方式的特点

优点:能够针对具体任务或问题找到相关信息;方便对检索到的结果信息进行筛选;在检索过程中,能够使用不太明确的信息需求得以清晰化;有时能获取一些意外信息;容易使用突破本学科领域的界限,获取跨学科、跨得业信息;利于多媒体信息的检索。

缺点:用户获取信息的偶然性大;检全率较差;易出现信息迷航。

2、基于关键词的检索方式

(1)基于关键词的检索的工具:最具代表性的是搜索引擎,如google。

(2)基于关键词检索的特点

优点:检索简单易得,利于上手;检索到的信息较新,时效性好;可以达到较高的检全率;符合检索语言的文献保障原则和用户保障原则。

缺点:关键词语言难以反映词间的相关关系;分散主题,影响查准率;自动标引无法完全解决标引不一致的问题。

(3)常用的关键词高级检索功能

主要的功能有:布尔逻辑检索、截词检索、位置检索、加权检索、词组检索、范畴检索(限制检索)、概念检索、模糊检索、深入检索

①布尔逻辑检索(boolean logic)

所谓布尔逻辑(又称布尔代数),是指使用AND、OR或NOT 等运算符查找含有某种词语特定组配形式的那些网页(记录)。

逻辑―与‖

用AND(或+)表示。A AND B

(A+B) ,网页记录中必须同时包含A、B两个词。

逻辑―或‖

用OR表示。A OR B ,表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。

逻辑―非‖

用NOT (或-)表示。A NOT B

(A-B),表示被检索文献在含有检索词A而不含有检索词B时才能被命中。

②截词检索

检索时输入检索词的局部(词干)进行非准确性检索匹配。主要用于西文检索工具。

③位置检索(靠词检索)

运算符NEAR 可以容许两个词相距一定的距离,有时还可以由用户来规定它们之间的距离。

④词组检索

词组检索是一个词组(通常用双引号―‖括起)当作一个独立运算单元,进行严格匹配,以提高检索的精度和准确度,它也是一般数据库检索中常用的方法。

⑤范畴检索

是指将检索限制在记录的一个特定部分或几个部分的能力。

一些有用、经常遇到的范畴下:

Title(网页标题)

Links(链接)

Date

URL

图像和其他媒体

特殊检索功能

1、识记:因特网信息检索的主要方法和工具及其各自的特点,主要的关键词高级检索功的定义。

2、理解:如何提高关键词检索的效果。

3、应用:举例比较因特网信息检索不同方法的优缺点;举例说明关键词高级检索功能的使用方式。

因特网信息检索工具的工作原理(重点)

网络信息检索工具的原理

(1)网页抓取

(2)文档分析

(3)建立索引

(4)文档表示

(5)归类和聚类

理解:因特网信息检索工具的工作原理。

(四) 因特网检索工具的性能评价(次重点)

网上信息检索工具的评价主要从5个方面进行。

1、收录范围

从网络信息检索系统的数据量、收录项目、索引深度、新颖性及更新频率、索引建立方式、处理语言等方面进行评价。

2、检索功能

从检索方式单一还是多样;所使用的检索技术是否先进、多样;对所查信息是否有选择与限定的自由这三方面来评价。

检索效率

目前较广采用的信息检索指标是检索全率与检准率。

4、检索结果的处理和展示

5、用户界面设计

用户接口的设计是评价检索系统一个重要的因素。

1、识记:因特网检索工具性能评价的主要指标。

2、理解:如何综合评价因特网检索工具的性能。

第三章 搜索引擎

一、学习目的和要求

本章的学习偏重实践环节。通过本章的学习,考生应了解搜索引擎的发展简史,在实践过程中熟悉中外著名的搜索引擎的特性和使用方法。

二、考核知识点与考核目标

(一)搜索引擎发展简述(一般)

所有搜索引擎的祖先是1990年由蒙特利尔大学的学生Alan Emtage、Peter Deutsch等人发明的Archie,用于检索FTP文件。

1994年4月出现第一个搜索引擎--Webcrawler,同年,Lycos是搜索引擎史上又一个重要进步,是最早具有现在意义的搜索引擎,发布于1994年7月。

1995年AltaVista和Excite问世

1996年HotBot出现

1997年Northen Light 出现

1998年Google 问世。

理解:了解搜索引擎发展简史。

(二)通用搜索引擎(重点) 通用搜索引擎是相对于专业搜索引擎而言。通用搜索引擎是一种“大众资源”,试图为每个人提供所有的信息信息。通用搜索引擎使用方便,对信息查询反应迅速。

介绍国外著名搜索引擎:

Google

Alltheweb

Ask Jeeves

MSN

Lycos

AOL

Excite

Altavista

Go

介绍国内著名搜索引擎:

百度

中国搜索

3721

天网

对各个搜索引擎从以下3个方面来进行详细介绍:

(1)数据库规模与范围。例如:Google到2004年2月宣布它拥有世界上最大的搜索引擎数据库,标引了大约43亿左右的文本文档。Google的信息门类也非常介全。除普通的网页数库以外,它还拥有一个图像数据库和一个新闻数据库等。

(2)检索界面

包括搜索引擎首页的特点和结构,高级搜索的入口。

(3)检索功能

检索功能首先要了解搜索引擎是否支持布尔逻辑检索功能。以Google为例,Google支持不完全的布尔逻辑。在检索框中输入的所有检索词,Google会自动以AND逻辑连接;Google也支持OR逻辑操作,但注意在进行“或”操作时OR逻辑操作符必须大写。除布尔逻辑功能,还考察搜索引擎是否具有词组检索、截词检索和范畴检索的功能,其中范畴检索对哪些范畴进行了限制。

应用:在互联网上对著名的国内外搜索引擎进行熟悉,用检索实例掌据搜索引擎的特性和功能。

第四章 目录型网络检索工具

一、学习目的和要求

通过本章的学习,考生应了解网络资源目录的收集和维护方式,目录的结构和使用方法及网络资源目录目前使用的主要分类法,并且应熟悉和掌据几个国内外著名的网络资源目录的特性及使用方法。

二、考核知识点与考核目标

(一) 目录型网络检索工具概述(重点)

1、目录型网络检索工具原理

因特网上的目录型检索工具一般称为网络目录(Web Directory),它是由网络开发者将网络资源收集后,以某种分类法进行组织整理,并和

检索法集成一种可供分类浏览和检别再组配,形成许多组配类目,达务,主要为高等教育团体服务。

索的等级结构式目录。网络目录一到细分的目的。多用于地图检索专收录范围:覆盖了所有学术领域的般是通过引导网络用户的查询概念业工具。 经过选择的网络资源目录。目录按来帮助用户找到所需的网络信息。 照杜威十进分类法(DDC)的体系 2、目录资源的收集和分类 1、识记:目录型网络检索工具的工组织编排。

(1)收集 作原理。 检索功能:按DDC 分类浏览;按网络目录一般采用人工或半自动方2、理解:网络资源目录的收集和维主题字顺浏览;输入检索词检索。

式采集和存储网络信息。 护方法和目录结构;网络资目录所评价:目录体系庞大,用户检索容(2)分类 使用的分类法各自的特点。 易、快捷,查找的结果更相关。

网络目录通常是按网络资源的主题

性质进行分类,以某种分类体系为(二) 网络资源目录介绍(次重点) 1、理解:国内外著名搜索引擎的特依据,将信息资源分为若干领域的国外著名的网络资源目录 点及检索方式。

主题范畴,然后再细分为各学科专Yahoo! , Galaxy, VL, BUBL LINK, 2、应用:以一个检索主题分别使用题目录,最后列出具体的相关网站Dmoz, LII Yahoo! , Galaxy, VL和BUBL LINK(资源),形成一个由信息链组成的国内著名的网络资源目录 进行检索,从收录范围、分类方法、树状结构,即总目—— 专题目录雅虎中国,搜狐分类目录,新浪分目录特点、检索功能和结果显示对—— 链接—— 文本。

类目录 四者进行比较,发现其各自的特性。

目录资源的收集和分类优点是人工重点了解Yahoo! , Galaxy, VL和

方式建立的查询工具其检索信息的BUBL LINK的特点和使用方法。 (三)网络资源目录与搜索引擎的准确性较高;缺点是收集信息的效1、Yahoo! 比较(重点)

率及全面性低于自动方式。目前,1994年创建,是最早最著名的目录网络资源目录与搜索引擎适用不同部分网络资源目录利用自动功能或型网络检索工具,也是最流行的网的检索需求。

者由用户递交的方式来丰富和补充络资源目录。 网络资源目录主要适用于:用户进资源。 收录范围包括网站、Web页、新闻行较宽泛的主题浏览和检索;用户 3、网络目录结构 组、FTP等资源。在专题安排上,尚未形成很精确的检索概念时。

一个网络目录包括许多层,最高层即包括了学术资源,也包括了大量与搜索引擎比较,网络目录具有下(一级)目录页总是将因特网资源的非学术资源和许多娱乐资源。 列的特点:网络目录中的网页是由分成最大范围、最普通的主题范畴。分类特点以主题为基础。 专家人工精选得来的,故网页内容主题链接到第二层目录(另一个页具有关键词检索功能 丰富,学术性强;分类浏览方式直面),然后在第二层目录再分出子目评价:目录分类比较合理,层次深,观易用,适合多数网络用户和新手;录,一般到第四级。 类目设置好,克服单纯由搜索软件当用户检索目的不明确,检索词不4、网络资源目录分类方法 动完成分类的缺陷,增强分类的条确定时,分类浏览方式更为有效;(1)主题分类法 理性。它的分类体系和搜索模式对有较高的查准率。

一个主题充当一个类目,类目象主网络检索的发展产生了巨大的影网络资源目录的局限是:受人工标题词表一样按字顺排列,一个类目响。 引的限制,搜索范围较搜索引擎要又可分为若干细目,同位类的细目2、Galaxy 小许多;收录的网页数量和标引浓也是按字顺排列。 编制:1994年创建。最初动因是开度相对不足;难以控制主题等级类主题分类法的优点是以事物分类, 发用于电子商务的大型目录指南服目的质量。

与些事物相关的内容全部集中在一务。

起;对交叉学科的主题提示非常有目录特点:其目录链接了因特网上理解:网络资源目录与搜索引擎相利。缺点是此分类法容量小, 对网的数千个站点,它不但提供分类目比具有的优缺点。

络资源的覆盖率极为有限。 录查询,也具备一定的检索功能

(2)学科分类法 主题递交:通过表格操作向该服务第五章 元搜索引擎

以知识分类为基础、按照学科性质器提交增补主题内容的建议。 一、学习目的和要求

及从属、层次关系来组织网络资源,评价:由专家使用人工智能等最佳通过本章的学习,考生应了解元搜类目排序以字顺为标准。 技术组织信息,目录分类更加细致索引擎的概念和分类,并掌据几种学科分类法按照学科性质来组织网合理。 常用的元搜索引擎的使用方法。

络资源。比主题分类法有更大的容3、The www Virtual Library (VL) 二、考核知识点与考核目标

量,内容更有针对性,学术性,符 (一)元搜索引擎概述(重点)

合研究人员的要求。 编制:VL是老资格的Web目录,元搜索引擎的概念

(3)图书分类法 由松散的志愿者联盟来管理和维 元搜索引擎(metasearch

网上的虚拟图书馆多用图书分类护。 engine ,megasearch engine 或

法,目前采用的主要有杜威十进分收录范围:主要收集各学科专业领unified search engine) 又称为集合类法(DDC)、国际十进分类法域网络信息。 式搜索引擎。它是将多个搜索引擎(UDC)、国会图书馆分类法目录特点:参照美国国会图书馆主集成在一起,并提供一个统一的检(LCC)和中国图书馆分类法。 题词表对网页加以组织。 索界面。

图书分类法的特点是:以科学体系检索方法:主要通过目录的导引和2、元搜索引擎的分类

为基础,体系宠大,容量上占优势; 浏览,检索者最终调出不再含任何元搜索引擎按运行方式的差异可以网络用户对其了解较多;版本更新链接的文献类文本。 为桌面元搜索引擎和在线搜索引及时,能满足动态的网络信息分类;评价:该系统称得上是专业性网络擎,其中前者的代表是各类搜索软有机读版本,网络资源目录可以直信息资源目录的集大成之作。在世件,而后者按照功能又可以划分为接套用。 界范围内影响广泛,内容不得经常All-in-One式元搜索引擎和并行检(4)分面组配法 更新,具有很高的学术性。 索式元搜索引擎。

这种分类法的原理首先确定几个分4、BUBL LINK,桌面元搜索引擎

类标准,即分面,再确定每个分类/link 不是通过网上调用方式在线使用,标准中的若干特征值,即类目,每编制:源于1990年,目前发展成为而是直接在用户的计算机上运行,一分面的类目与其他分面的类目分英国一项重要的国家网络信息服相当于用户自己拥有一个元搜索引擎。

(2)All-in-One式元搜索引擎

又称搜索引擎元目录,它将主要的搜索引擎集中起来, 并按类型或按检索问题等编排组织成目录,帮助、导引用户根据检索需求来选择适用的搜索引擎。

(3)并行检索式元搜索引擎

将多个搜索引擎集成在一起,提供一个统一的检索界面;且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果。因而又被称为simultaneous unified search

index (SUSI)。

3、元搜索引擎的特色和评价

目前运营的元搜索引擎各具特色,功能各有侧重,完全理想的尚不多见。评价一个元搜索引擎主要从4个方面进行。

(1)所集成搜索引擎的数量和名称

(2)检索提问的输入及处理

(3)其他检索选项,如等侯时间、检索作业方式和其他检索参数等。

(4)检索结果的处理

4、元搜索引擎的主要缺欠

(1)常常严格限制从别的个别搜索引擎检索到的记录的数量(有时只有10项)

(2)检索式过于复杂时难以进行转移

(3)在多数情况下,对五大搜索引擎,它们只能检索其中的两三个.

5、元搜索引擎的适用性

通常在下列几种情况下比较适合使用元搜索引擎

(1)在查询极不明确时

(2)想检索的感兴趣的网站少于10个时

(3)检索只使用一个单词或词组时

(4)搜索的记录多数出现在较小的搜索引擎上时

1、识记:桌面元搜索引擎、All-in-One式元搜索引擎和并行检索式元搜索的概念

2、理解:元搜索引擎的分类、元搜索引擎的评价方式

(二) 常用的元搜索引擎(次重点)

1、常用的桌面元搜索引擎

目录国内比较流行的桌面元搜索引擎有飓风搜索通和网际狂搜,可由网上下载。

2、常用的All-in-One式元搜索引擎

比较有代表性的All-in-One式元搜索引擎有

iTools,

Hotbot,

CUSI,/cusi/

3、常用的并发式元搜索引擎

Dogpile,

Vivisimo,

MetaCrawler,

Profudfsion,

搜星,

本节所列不同类型的常用元搜索引擎,主要从以下几个方面进行分析:收录范围、检索特点、结果显示和评价。

应用:上机熟悉各类常用元搜索引擎。

第六章 多媒体信息检索

一、学习目的和要求

通过本章的学习,考生应了解图像、音频、视频等多媒体文档的检索原理和检索工具。

二、考核知识点与考核目标

(一)图像的检索(次重点)

1、图像检索的原理

(1)基于文本的图像检索技术

该技术是利用文本方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。这种技术目前在因特网图像信息检索系统中占主导地位。

用来帮助图像分析、标引的Web文档内容包括:

图像的文件名及其网址;

图像的替代文字;

图像周围的文字;

图像所在页面的标题;

图像的超链接;

图像所在网页彼此间的链接。

(2)基于内容的图像检索技术

对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术。此技术出现于20世纪90年代初期。该技术用于因特网图像信息的检索克服了基于文本的图像检索技术存在的缺陷。

2、基于文本的图像搜索引擎

(1)

容量大、速度快、无用信息和死链接较多。

检索方法:一般搜索和高级搜索。

结果显示:缩略图。

(2)AllTheWeb 多媒体搜索

一流的多媒体搜索功能,收录了图像、音频、视频等多种。

检索方法:提供一般检索和高级检索。在高级检索界中可以选择文档大小和颜色来进行限制检索。

结果显示:一次检索结果提供缩略图

还有其他比较有代表性的图像搜索引擎,如

3、基于内容的图像搜索引擎

基于内容的图像搜索引擎还处于研制阶段,目前属于真正意义上的基于内容的图像搜索引擎还不是很多,比较有代表性有:

QBIC,

VisualSEEK 的 WebSEEK,

: 8008/

识记:基于文本的图像检索技术、基于内容的图像检索技术

应用:熟悉有代表性的图像搜索引擎的使用方法。

(二)音频文件的检索(一般)

音频文件检索原理

音频检索比较简单的办法是把音频作为一种不透明的数据集合来处理,仅涉及它的文件名、文件格式和采样等外部特征。这种方法和基于文本的图像检索是相似的。

用基于外部特征方法来实现歌曲的检索,在实际应用中取得了很好的效果,但它的局限性在于,它只适合歌曲检索,而对其他类型的检索要求就无能为了,比如用户要根据一体贴曲子的旋律片断来找整曲以及其他旋律相似的曲子,这种检索方式就无法解决了。基于内容的音频检索系统可以解决这一问题。

基于内容的音频检索主要包括的检索方式有:基本属性检索、相似性、声音/感知特性检索、主观特性检索、示例检索。

基于文本的音频搜索引擎

CNET ,

Kazaa Media Desktop (MP3 only),

音乐极限,

3、基于内容的音频搜索引擎

上海交通在学音乐数据库检索系统

ThemeFinder,

应用:熟悉音频搜索引擎的使用方法。

第七章 学术信息的网上检索与获取

一、学习目的和要求

通过本章的学习,考生应了解一些综合性和专门学科的重要检索系统、检索工具和信息服务站点,并掌握其检索功能。

二、考核知识点与考核目标

(一)综合性学术信息检索系统(重点)

1、国外检索系统

(1)ISI Web of Knowledge,

该系统由美国 Thomson Scientific

创建,收录文献类型有学术期刊、技术专利、会议录、化学反应、研究基金及网站资源等。收录学科范围有自然科学、工程技术、社会科学、艺术与人文科学信息资源。

该系统的检索功能提供跨库联全检索和资源无缝整合两大功能。在检索技巧上,ISI Web of Knowledge

在大小写、运算符、通配符、括号的检索途径规则与通用规则方面基本相同。

(2)OCLC的FirstSearch检索系统

FirstSearch是由美国OCLC创建的。OCLC( Online Computer Library

Center,INC) 是一个非赢利,成员制的在线计算机图书馆服务和研究机构,也是世界上最大的文献信息服务机构之一。包括期刊论文、图书、专利、政府报告、报纸、学位论文、会议论文、视频音频等文类型。学科范围包括艺术和人文学科,工程和技术等综合性学科。目前通过该系统可检索70多个数据库,其中30多个可检索到全文。

(3)Proquest,/umi/

该系统由美国ProQuest Information

and Learning Company创建和开发。收录文类型包括期刊论文和报纸,收录学科范围广,涵盖艺术与人文、工商业、计算机与因特网、经济与贸易、教育、科学与数学等。

(4)EBSCOhost

该系统收录学科范围为综合性。文献类型包括期刊、报纸、参考工具、网络资源等。

(5)Springer Link,

收录学科主要是理工科类。收录文献类型有电子期刊、电子书、电子丛书、多媒体。

2、中文检索系统

(1)CNKI平台,

收录范围包括自然科学、工程技术、人文与社会科学等。收录文献类型有期刊、博士硕士论文、报纸、图书、会议论文。

(2)NSTL网络服务系统,

(3)CSDL,

(4)CALIS,

1、识记:主要综合性学术信息检索系统的名称。

2、应用:熟悉各种综合性学术信息检索系统的使用方法。

(二)各学科信息资源的获取(一般)

1、社会科学信息资源检索工具

(1)Social Science Information

Gateway (SOSIG),

(2)社会科学研究网 Social

Science Research Network (SSRN),

2、教育信息检索工具

(1)ERIC Web Site —— ERIC 数字图书馆

(2)The Educator’s Reference

Desk,

(3)College Net,

(4)Peterson,

3、经济学信息检索工具

(1)EconWPA,

4、工程技术信息检索工具

(1)Ei Village2,

(2)中国工程技术信息网(CETIN),

应用:熟悉各种学科资源的检索主要检索工具。

第八章 参考信息的网上检索

一、学习目的和要求

通过本章的学习,考生应了解网上参考信息源的主要类型及相关网站。

二、考核知识点与考核目标

(一)网上参考信息定义和类型(次重点)

批人名、地名、机构、事件、统计数据等一类数据、事实信息,是人们在工作研究和目常生活中经常要查考、引用的信息。

网上参考信息源的主要类型:百科知识检索网站、人物信息检索网站、地理信息检索网站、时事、新闻信息检索服务、机构信息检索网站、语词信息检索网站、统计信息检索网站。

识记:网上参考信息源的类型。

(二)各类型网上参考信息源的代表网站 (一般)

1、不列颠百科全书网站(Encycolpedia Britannica Online),

2、Marquis Who’s Who,

3、Mapblast,

4、Google news,

5、World of learning online,

6、,

7、UNESCO Institute for Statistics,

应用:上网熟悉上述主要参考信息资源网站。

第三部分 有关说明与实施要求

考核的能力层次表述

本大纲在考核目标中,按照“识记”、“理解”、“应用”三个能力层次规定其应达到能力层次要求。各能力层次为递进等级关系,后者必须建立在前者的基础上,其含义是:

识记:能知道有关的名词、概念、知识的含义,并能正确认识和表述,是低层次的要求。

理解:在识记的基础上,能全面把握基本概念、基本原理、基本方法,能掌握有关概念、原理、方法的区别与联系,是较高层次的要求。

应用:在理解的基础上,能运用基本概念、基本原理、基本方法联系学过的多个知识点分析和解决有关的理论问题和实际问题,是最高层次的要求。

教材

指定教材

符绍宏等:《因特网信息资源检索与利用》,北京:清华大学出版社,2005

年版。

参考教材

董慧等著:《网络信息资源开发与利用》,武汉:武汉大学出版社,2000年版。

自学方法指导

1、在开始阅读指定教材某一章之前,先翻阅大纲中有关这一章的考核知识点及对知识点的能力层次要求和考核目标,以便在阅读教材时做到心中有数,有的放矢。

2、阅读教材时,要逐段细读,逐句推敲,集中精力,吃透每一个知识点,对基本概念必须深记得理解,对基本理论必须彻底弄清,对基本方法必须牢固掌握。

3、在自学过程中,既要思考问题,也要做好阅读笔记,把教材中的基本概念、原理、方法等加以整理,这可从中加深对问题的认知、理解和记忆,以利于突出重点,并涵盖整个内容,可以不断提高自学能力。

4、完成书后作业和适当的辅导练习是理解、消化和巩固所学知识,培养分析问题、解决问题及提高能力的重要环节,在做练习之前,应认真阅读教材,按考核目标所要求的不同层次,掌握教材内容,在练习过程中对所学知识进行合理的回顾与发挥,注重理论联系实际和具体问题具体分析,解题时应注意培养逻辑性,针对问题围绕相关知识点进行层次(步骤)分明的论述或推导,明确各层次(步骤)间的逻辑关系。

对社会助学的要求

1、应熟知考试大纲对课程提出的总要求和各章的知识点。

2、应掌握各知识点要求达到的能力层次,并深刻理解对各知识点的考核目标。

3、辅导时,应以考试大纲为依据,指定的教材为基础,不要随意增删内容,以免与大纲脱节。

4、辅导时,应对学习方法进行指导,宜提倡“认真阅读教材,刻苦钻研教材,主动争取帮助,依靠自己学通”的方法。

5、辅导时,要注意突出重点,对考生提出的问题,不要有问即答,要积极启发引导。

6、注意对应考者能力 的培养,特别是自学能力的培养,要引导考生逐步学会独立学习,在自学过程中善于提出问题,分析问题,做出判断,解决问题。

7、要使考生了解试题的难易与能力层次高低两者不完全是一回事,在各个能力层次中会存在着不同难度的试题。

8、助学学时:本课程共4学分,建议总课时72学时,其中助学课时分配如下:

章 次

第一章

第二章

第三章

第四章

第五章

第六章

第七章

内 容

因特网信息资源

因特网信息检索概论

搜索引擎

目录型网络检索工具

元搜索引擎

多媒体信息检索

学术信息的网上检索与获取

参考信息的网上检索

学 时

6

12

12

10

10

8

8

(四)、简答题

1、简述搜索引擎的工作原理。

(五)、论述题

1、试述因特网检索工具的性能评价标准。

第八章 6

合 计 72

关于命题考试的若干规定

(包括能力层次比例、难易度比例、内容程度比例、题型、考试方法和考试时间等)

1、本大纲各章所提到的内容和考核目标都是考试内容。试题覆盖到章,适当突出重点。

2、试卷中对不同能力层次的试题比例大致是:“识记”为20%,“理解”为40%,“应用”为40%。

3、试题难易程度应合理:易、较易、较难、难比例为2:3:3:2。

4、每份试卷进中,各类考核点所占比例约为:重点占65%,次重点占25%,一般占10%。

5、试题类型一般分为:单项选择题、多项选择题、名词解释题、简答题、论述题。

6、考试采用闭卷考试,考试时间150分钟,采用百分制评分,60分合格。

六、题型示例

(一)、单项选择题

1、下列属于目录型网络检索工具的是( ).

A.

B.

C.

(二)、多项选择题

1、下列属于因特网信息资源的是( )。

A.WWW信息资源

信息资源 C.

FTP信息资源

D. 用户服务组信息资源

E.Telnet信息资源

(三)、名词解释题

1、布尔逻辑检索

发布者:admin,转转请注明出处:http://www.yc00.com/xiaochengxu/1688893366a181756.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信