知识元的元数据描述

知识元的元数据描述

2023年7月19日发(作者:)

201 7年第1 6卷第22期 知识元的元数据描述 口徐志熹 【内容摘要】元数据是数字图书馆互操作的基础,也是数据转化为知识的基础。本文提出了一种针对知识元的元数据方案,探 讨了它在知识元交换和知识元共享中的应用,为数字图书馆提供知识服务来建立基础的技术框架和结构。 【关键词】数字图书馆;知识元;元数据 【作者简介】徐志熹(1963.1~),男,四川金堂人;四川省图书馆信息技术部副研究馆员;研究方向:数字图书馆技术 一、引言 Core),而其它已有的元数据标准无论是大量的具体领域的 元数据,还是描述知识组织系统(KOS)的元数据等都不能很 好地适应对知识元的描述。因此,在以知识为基础的数字图 书馆中为知识元设计一套元数据就成了知识元加工的十分 必要的基础技术工作。 二、元数据设计规范 数字图书馆提供知识服务是一个大趋势…。知识服务 的基础是对知识的组织或加工,加工分为整理和分析两大 类,整理也就是知识的整序,而最基本的整序方法依赖于知 识的标引。知识的标引将深入到文献中的知识元 J。 知识元是文献的一个片断,基本上都会分为一小段叙 述、一个公式、一个论断、一组图、以及一个定理等,知识元作 设计元数据应该遵循一定的标准或者规范,使得设计出 为知识的基本单元,由不能再分割的框架结构表示。 元数据是描述数据的数据。描述文献的元数据有经典 的MARC和适用于网络XML标记的都柏林核心(Dublin 争的手段,很多企业在发展的过程中会聘请一些网络黑客来 攻击同行企业的网站,并窃取同行企业的商业机密,进而利 用其他企业的商业机密信息提高自身的竞争力。这种不正 当竞争的手段严重违背了市场经济发展的规律,是对其他企 业劳动成果的侵犯。电子信息工程技术所带来的商业问题 严重影响了市场经济的健康发展。 的元数据方案和其它已有的元数据标准在功能、结构、格式、 语法等多方面保持一致,便于在更大范围内实现不同的数字 图书馆或者说不同系统间的互操作和数据共享。本文将按照 质的计算机信息技术人员负责电子信息工程技术工作,以提 高工作效率。并且,供热站应加强对员工的电子信息技术教 育,开展电子信息技术应用讲座,组织电子信息工程技术专 项培训班等不断提高员工的电子信息技术水平,使企业员工 有能力正确使用电子信息工程技术。 (三)规范使用网络。规范使用网络是保证电子信息工 (三)恶作剧。部分计算机信息技术人员为了炫耀或证 明自己的计算机信息技术水平而在网络上攻击部分企业的 程技术应用安全的前提,因此,供热站应重视网络使用的规 范性。一是供热站应积极制定网络使用的相关规章制度。严 网站,盗取企业的商业机密信息,并将其公开。这种恶作剧 的行为直接损害了企业的利益,不利于企业的发展。但是, 禁故意的错误操作行为,避免员工出卖机密商业信息。并 且,供热站应认真落实网络使用的相关规章制度,为电子信 仍有部分计算机信息技术人员以此为手段,来向社会证实自 己,吸引企业的关注,并从中获得利益。 四、解决电子信息工程技术安全性问题的策略——以供 热站为例 息工程技术的安全性提供技术保障;二是供热站应加强对员 工的职业素质教育,增强员工的事业心和责任感,使员工遵 循网络使用规章制度,规范使用网络,尽可能降低电子信息 工程技术安全风险;三是供热站应积极运用网络安全技术, 安装杀毒软件,建立防火墙,即使是检测系统,排除不安全因 素,保证网络的安全性,为电子信息工程技术的应用提供安 全的网络环境。 (一)提高安全意识。在供热站工作和管理中应用电子 信息工程技术应提高工作人员和管理人员的安全意识,加强 工作人员和管理人员对电子信息工程技术安全性的深刻认 识。为此,供热站在应用电子信息工程技术的过程中应积极 宣传电子信息工程技术的安全性,并积极向工作人员和管理 人员宣传电子信息工程技术安全防范的策略,提高供热站工 作人员和管理人员的安全意识和安全管理水平。 (二)提高员工素质。员工素质直接影响着企业的发展, 【参考文献】 [1]温森浩.计算机电子信息工程技术的应用与安全[J].通 讯世界,2016,16 [2]陈永强.我国计算机电子信息工程技术的应用和安全 [J].中小企业管理与科技,2014,8 [3]史媛芳,张心全.浅析电子信息工程中计算机网络技术的 应用研究[J].中小企业管理与科技,2015,4 Industrial&Science Tribune 因此供热站在应用电子信息工程技术的过程中应不断提高 员工素质,为电子信息工程技术的应用提供人才保证。为 此,供热站应重视电子信息工程技术的应用,积极引入高素 ・54・ 201 7年第1 6卷第22期 文献 中提出的元数据设计规范进行知识元的元数据方案 设计,这里仅仅列出文中的要点。这个规范对知识元的元数 据设计也是适用的。 Title(题名) Creator(文献责任者) Subject(主题) (一)设计原则。遵循几组最基本的设计原则:简单性与 准确性原则;专指度与通用性原则;互操作性与易转换性原 Description(内容描述) Publisher(文献出版者) 则;兼容标准和可扩展性原则。 (二)元数据功能的功能分析。元数据可以实现以下功 Contributor(知识元提取者) Date(知识元创建日期) 能:支持用户发现资源;信息对象的基本内容以及属性的相 关描述;支持用户决定对信息的取舍;提供信息资源本身的 位置;保存信息资源的加工存档;保存资源被使用和被评价 的相关信息。 (三)结构和组成。元数据的结构指一个完整的元数据 标准通常由哪几部分的数据项(元素)组成,各有什么特点。 元数据的结构划分为:描述型元数据,管理型元数据,应用型 元数据。 (四)表示。元素定义方法(即元素哪些方面的属性应该 被定义)应该采用与Dublin Core一致的方法,即采用ISO/ IEC I1179标准。使用XML语言及其相关语法结构作为元 数据描述的元语言,并且以能够容纳各种元数据标准的RDF (资源描述框架)来描述元数据。 三、知识元结构分析 (一)知识元的几种分类。对于人类的知识分类来说,一 共可以分为四大类,主观知识与客观知识,专业知识和常识 知识。本文论述的知识仅指客观的专业知识,即文献中的知 识。知识元是文献的一个片断,它是知识的基本单元,它的 分类当符合客观专业知识的分类。分类有不同的视角,如从 媒体的视角,可以将知识元分为文字、图、表、公式、声音、演 示等;从形式的视角,可以将知识元划分为概念型、理论型、 方法型、事实型和数据型;从内容的视角,可以将知识元按照 知识所属学科进行分类。 (二)知识元的学科范围。学科范围就是从知识元内容 的视角来进行知识元分类得到的结果,它和文献分类法或图 书分类法是一致的,其背后是学科分类。但它仅仅是学科分 类的粗略描述,应该采用具备明确语义的学科名称来表示。 对于交叉学科,组配法也同样适用。 (三)知识元的学科范畴。范畴是最高层次的类的统称, 学科范畴就是学科类别的高层次类。一个学科范畴是指学 科的一个最大的分类。对于知识元所属的学科,标识其范畴 有助于刻画其分类学上的共性。 (四)知识表示方法。所谓知识表示就是在利用计算机可 以用接受或者是处理的形式来对知识元中的知识进行表示。 知识表示方法是知识元转化为计算机能够读懂的知识片段的 方法,它将指引计算机如何对知识元中所包含的知识进行处 理,实现从文献库到知识库的映射,即实现文献数据转化为客 观知识。传统图书馆以文献提供服务,以文献库为自动化实 现的技术核心;数字图书馆是知识系统,将以知识元提供服 务,其核心将采用先进的知识库技术。这就产生了一个无法 回避的问题和技术难点,即从文献库过渡或迁移到知识库。 四、元数据方案 (一)元素列表。下面列出本方案所采用的元素: Industrial&Science Tribune国固田 Type(类型%) Format(物理格式) Identiifer(存取标识符) Source(来源文献) Language(语言) Relation(关联) Coverage(学科范围}) Rights(权利声明) Category(学科范畴 ) Representation(知识表示方法}) 从这份清单可以看出,本方案基本采用了DC元数据方 案,但对部分元素赋予了稍有不同的语义,最后增加了两个 元素Category(学科范畴)和Representation(知识表示方法)。 带 号的元素是本方案的特性元素,即新元素或者和DC有 较大区别的元素。 (二)特性元素。 1.Type(类型)。类型是一个描述型元素,是知识元形式 的一种分类,其内容来源于知识元所有类型的一个可维护列 表。推荐类型列表如下:概念型(观念、概念、定义、名词解 释)、理论型(思想、方法论、公理、原理、定律)、方法型(方法、 步骤、技巧、规程、程序)、事实型(自然、社会存在和演变的事 实信息、问题描述、人物)、数据型(各种数据类知识和科学数 据、社会经济数据)。 2.Coverage(学科范围)。学科范围是一个描述型元素, 它应该覆盖所有学科,推荐直接使用学科名称。交叉学科的 知识元并列相关学科名称。 3.Category(学科范畴)。学科范畴是一个管理型元素, 是对学科进行大类别的划分,它和表示方法密切相关,同一 范畴的不同学科应当适用同一种表示方法。推荐下列学科 范畴:哲学、人文学科、社会科学、数学、自然科学、工程技术。 4.Representation(表示方法)。表示方法是一个应用型 元素,是知识元转化为计算机可理解的知识的方法,因此传 统人工智能中的知识表示法都可能具有应用价值,关键是这 里的知识元适合哪种人工智能知识表示法,它可能依赖知识 元类型和学科范畴。一个应用系统可以根据知识元的表示 方法直接或间接从知识库中获取到知识元所表达的知识并 将其运用于知识服务。因此知识表示方法将会成为数字图 书馆的技术核心。推荐下列表示法:阶谓词逻辑、产生式、语 义网络、框架、描述逻辑、面向对象、神经元网络、基于语言 场、基于知识体、专业语言如MathML J。 (三)规范描述。描述元数据的元素采用与Dublin Core 一致的方法,即采用ISO/IEC 11179标准,按以下10个方面 定义元素: ・55・ 201 7年第1 6卷第22期 名称(Name):元素名称 具,由于篇幅所限,这里就省略四个特性元素的RDF模式描 述了。 五、元数据应用 标识(Identiifer):元素唯一标识 版本(Version):产生该元素的元数据版本 注册机构(Registration Authority):注册元素的授权机构 语言(Language):元素说明语言 定义(Deifnition):对元素概念与内涵的说明 元数据有多方面的应用,这里简单分析几个方面。第 一,知识元标引是知识元的处理过程。先要从文献中以某种 技术抽取出知识元,然后对其内容及其他有检索意义的特征 进行分析、描述并用检索标识记录下来,生成其元数据并予 选项(Obligation):说明元素是限定必须使用的还是可选 择的(必备性) 数据类型(Datatype):元素值中所表现的数据类型 最大使用频率:元素的最大使用频次(可重复性) 注释(Comment):元素应用注释。用于说明子元素情况。 以存储。知识元的标引是知识元存取的基础,当然也是其它 知识服务的基础,因此其核心是标引出知识元的知识表示方 法,这关系到计算机能否“正确理解”知识元。第二,知识元 存取分为两个方面的问题:一是从文献库中存取知识元,这 以下就给出本方案的四个特性元素的初步的规范描述。 1.Type(类型)。 名称(Name):知识元类型 标识(Identiifer):Type 定义(Deifnition):对知识元内涵的一种分类以方便对知 识元的进一步加工 选项(Obligation):必备的 数据类型(Datatype):文字(来自于一个可维护列表) 最大使用频率(Maximum Occurrence):1 注释(Comment): 2.Coverage(学科范围)。 名称(Name):知识元的学科范围 标识(Identiifer):Coverage 定义(Definition):知识元所属的学科,包括交叉学科 选项(Obligation):可选的 数据类型(Datatype):并列文字集 最大使用频率(Maximum Occurrence):1 注释(Comment): 3.Category(学科范畴)。 名称(Name):知识元的学科范畴 标识(Identiifer):Category 定义(Definition):知识元所属学科的范畴,即大的学 科类 选项(Obligation):可选的 数据类型(Datatype):文字(来自于一个可维护列表) 最大使用频率(Maximum Occurrence):1 注释(Comment): 4.Representation(表示方法)。 名称(Name):知识表示方法 标识(Identiifer):Representation 语言(Language):汉语 定义(Definition):利用计算机能够接受并进行处理的方 式来表示知识元的方法 选项(Obligation):必备的 数据类型(Dma ̄pe):文字(来自于一个可维护列表) 最大使用频率(Maximum Occurrence):9 注释(Comment):对不同的表示方法可以进一步定义其 子元素(限于篇幅本文不作描述) (四)RDF模式描述。RDF模式正是描述元数据的工 ・56・ 依赖于知识元的元数据,可以指定Title、Creator、Subject等作 为检索点;二是从知识库中追溯知识元,这依赖于知识库中 的知识元链接,即使用Identiifer数据元素标识知识元。第 三,知识元交换和共享是数字图书馆间协作的重要内容,它 有赖于数字图书馆对知识元的元数据的共同理解,这需要一 个协议型的标准(或更大范围内的标准)。本文提出的元数 据方案可以作为此标准的一个技术上合理的参考。为了让 用户或某种虚拟角色对文献(或其中的知识元)有相同的理 解,需要有一致的描述和相同的知识表示方法。因此将知识 表示方法加入到元数据方案中具有重要意义和技术上不可 替代的作用。第四,元数据交换和共享是数字图书馆互操作 的基础。解决互操作问题主要有以下三种方法:联邦式 (Federation);集聚式(Cathering);收割式(Harvesting)。本文 提出的元数据方案可以完全支持OAI的元数据获取协议 (OAI Protocol for Metadata Harvesting,OAI—PMH) 。 六、结语 元数据方案的设计是数字图书馆的基础,尽管已有多种 元数据方案,但数字图书馆提供知识服务必然需要针对知识 元的加工处理,因此也就需要有一个针对知识元的元数据方 案。为了满足通用性、互操作、兼容性等原则,在都柏林核心 (Dublin Core)元数据方案的基础之上适当增改使其适用于 知识元,将是_个十分明智的选择。本文的工作仅仅是个开 头,对知识元的研究也还处于初级阶段。下一步的工作有: 对本方案形成规范的技术文档、进行知识元标引试验、对知 识表示方法如何与数字图书馆和知识库对接进行更深入的 研究等。 【参考文献】 [1]张晓林.走向知识服务:寻找新世纪图书情报工作的生长 点[J].中国图书馆学报,2000,26(5):32—37 [2]原小玲.基于知识元的知识标引[J].图书馆学研究, 2007,(6):45—47 [3]温有奎,徐国华.知识元链接理论[J].情报学报,2003,22 (6):665~670 [4]肖珑等.中文元数据标准框架及其应用[J].大学图书馆 学报,2001,19(5):29~35 [5]http://www.w3.org/Math [6]齐华伟,王军.OAI—PMH与数字图书馆的互操作[J].图 书馆论坛,2005,25(4):19~22 Industrial&Science Tribune 

发布者:admin,转转请注明出处:http://www.yc00.com/xiaochengxu/1689766251a284397.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信