2023年7月19日发(作者:)
项目编号文档编号
INFO-115-C01TR-REC-013
中国科学院数据应用环境建设与服务
元数据参考模型
(征求意见稿)
中国科学院数据应用环境建设与服务 项目组
2009年9月 目 录
1 2 范围........................................................................................................................................... 1 术语与定义............................................................................................................................... 1 2.1 资源........................................................................................................................... 1 2.2 数据集....................................................................................................................... 1 2.3 数据实体................................................................................................................... 1 2.4 数据模型................................................................................................................... 2 2.5 元数据....................................................................................................................... 2 2.6 元数据元素............................................................................................................... 2 2.7 元数据实例............................................................................................................... 2 2.8 元数据复合元素....................................................................................................... 2 2.9 元数据子集............................................................................................................... 2 2.10 编码体系................................................................................................................... 2 2.11 词汇编码体系........................................................................................................... 3 2.12 句法编码体系........................................................................................................... 3 2.13 数据类型................................................................................................................... 3 2.14 值域........................................................................................................................... 3 2.15 元数据注册系统....................................................................................................... 3 元数据参考模型....................................................................................................................... 3 调研分析................................................................................................................................... 4 4.1 需求调研................................................................................................................... 4 4.2 现有方案调研........................................................................................................... 5 4.3 需求分析................................................................................................................... 5 4.4 确保兼容性............................................................................................................... 6 方案制定................................................................................................................................... 6 5.1 方案制定................................................................................................................... 6 5.1.1 方案制定........................................................................................................... 6 5.1.2 意见征求和修订完善 ....................................................................................... 6 5.1.3 制定应用规范................................................................................................... 7 5.2 结构化定义............................................................................................................... 7 5.3 文档规范................................................................................................................... 9 5.3.1 正文要素......................................................................................................... 10 5.3.2 附录要素......................................................................................................... 11 5.4 元数据注册............................................................................................................. 12 系统建设................................................................................................................................. 12 6.1 设计开发................................................................................................................. 12 6.2 试用、评估和完善................................................................................................. 12 6.3 系统发布................................................................................................................. 12 应用服务................................................................................................................................. 12 7.1 扩展方案................................................................................................................. 13 7.1.1 元数据的定制................................................................................................. 13 7.1.2 元数据的扩展................................................................................................. 13 3 4 5 6 7 8 9 7.1.3 元数据应用方案的设计方法 ......................................................................... 14 7.2 元数据映射规则..................................................................................................... 18 7.2.1 元数据映射..................................................................................................... 18 7.2.2 元数据映射内容............................................................................................. 18 7.2.3 元数据映射方法............................................................................................. 19 7.2.4 映射编写规定................................................................................................. 20 一致性测试规则..................................................................................................................... 20 8.1 标签检查................................................................................................................. 20 8.2 完整性测试............................................................................................................. 21 8.3 最大出现次数测试................................................................................................. 21 8.4 标识符测试............................................................................................................. 21 8.5 数据类型测试......................................................................................................... 21 8.6 值域测试................................................................................................................. 22 8.7 模式测试................................................................................................................. 22 8.8 用户自定义的扩展元数据测试规范 ..................................................................... 22 8.8.1 排他性测试..................................................................................................... 22 8.8.2 定义测试......................................................................................................... 22 8.8.3 元数据应用方案测试 ..................................................................................... 22 评估完善................................................................................................................................. 23 9.1 应用评估................................................................................................................. 24 9.2 方案完善................................................................................................................. 24 元数据参考模型
1 范围
本规范面向数据应用环境的数据资源整合,规范化元数据研制和应用的流程模型,主要包括调研分析、方案制定、系统建设和应用服务等方面,特别是规范化了元数据的格式、语义、语法、注册、一致性测试和评估完善等,以实现元数据方案的规范化,以及基于不同元数据方案的数据之间的互相访问、内容交换和整合集成。
本规范适用于中国科学院数据应用环境建设与服务项目中各类元数据的研制和应用。
2 术语与定义
2.1 资源 具有身份标识的任何对象。
例如,数据集、服务、人员或机构等。
[GB/T 20533--2006,定义3.27]
2.2 数据集 可以识别的数据集合。
[ISO 19115,定义4.2]
本规范中,数据集指中国科学院数据应用环境建设与服务项目的主题数据库、参考数据库、专题数据库、专业数据库及其各级子库。
注:通过对诸如覆盖范围或者属性类型的限制,数据集在物理上可以是更大数据集中的一个比较小的数据组。
2.3 数据实体 包含数据内容的一个逻辑的或物理的存储单元。
例如,文本文件、关系数据库数据表、电子表格、GIS图层等。
注:一个数据集可能由一个或多个数据实体组成。
[GB/T 20533--2006,定义3.6]
1
2.4 数据模型 以反映信息结构的某种方式对数据组织描述。
[GB/T 18391.1,定义3.23]
注:数据模型指明数据的属性、结构和内在关系。
2.5 元数据 关于数据的数据。本规范中,具体指描述数据及其环境的数据。
2.6 元数据元素 元数据的基本单元。
[GB/T 19710--2005,定义4.6]
2.7 元数据实例 与某一元数据模式相符的某一具体数据资源的元数据。
[GB/T 20533--2006,定义3.8]
2.8 元数据复合元素 一组说明数据相同特性的元数据元素。
[ISO 19115,定义4.7]
注1:可以包含一个或多个元数据复合元素。
2.9 元数据子集 元数据的子集合,由相关的元数据复合元素和元素组成。
[ISO 19115,定义4.8]
2.10
编码体系 提供语境信息或句法分析规则,以帮助对元数据元素的值进行解释的受控词表或者格式规范。
[GB/T 20533--2006,定义3.14]
注:编码体系包括词汇编码体系和句法编码体系。
2
2.11 词汇编码体系 作为元数据元素值域的受控词表。
例如,汉语主题词表、世界各国和地区名称代码表等。
[GB/T 20533--2006,定义3.15]
2.12 句法编码体系 元数据元素的值在格式上遵从的正式表示法。
例如,“2000-01-01”作为日期的标准表示。
[GB/T 20533--2006,定义3.16]
2.13 数据类型 有效值域和允许对该值域内的值进行的合法操作的规定。
例如,整型、实型、布尔型、字符串、日期以及本标准中自定义的数据类型等。
注1:数据类型包括基本预定义类型和用户定义的类型。
注2:数据类型用术语标识,例如整型。
[GB/T 20533--2006,定义3.18]
2.14 值域 允许值的集合。
[GB/T 18391.1,定义3.75]
2.15 元数据注册系统 注册元数据的信息系统。
[GB/T 20533--2006,定义3.12]
3 元数据参考模型
元数据参考模型面向数据应用环境的数据资源整合,立足于元数据研制和应用等全流程的规范化,从调研分析、方案制定、系统建设和应用服务四个关键环节,规范化了元数据的结构、格式、语义、语法、注册等内容,实现了据向数据应用环境中元数据工作的规范化,以及不同元数据方案对数据互相访问、内容交换和整合集成的支持。
3
评估完善调研分析 方案制定系统建设应用服务
一致性测试
元数据参考模型
调研分析是元数据工作的起始点,直接关系到元数据成果的实用性,所以在该阶段主要完成各方需求的掌握和客观分析,为方案制定奠定基础。
方案制定则基于调研分析的结果完成方案的研制,并通过结构化定义、规范化文档实现元数据方案的规范表达,且针对数据交换和集成的需求将元数据方案注册到开放的系统中。
系统建设主要实现元数据管理系统设计开发、实用评估和完善,并最终发布后服务。
应用服务主要包括元数据服务、扩展方案和元数据映射规范,以支持灵活多样的元数据应用需求。
一致性测试则是保证系统建设和应用服务在采用元数据方案方面的一致性所应实现的功能要求,是元数据方案得以贯彻执行的保障。基于元数据方案实现的系统建设和应用服务有可能为非方案研制方承担,所以系统建设和应用服务等环节的执行过程中应通过本一致性测试,以确保符合本规范的要求。评估完善则基于系统建设和应用服务,特别是应用服务的效果,对元数据方案进行评估和完善,提升元数据方案的效用。
4 调研分析
调研分析是元数据工作的起始点,直接关系到元数据成果的可用性和实用性,所以在该阶段主要完成各方需求的掌握和客观分析,为方案制定奠定基础。
调研分析的主要内容是全面掌握需求,以及现有业界成果,并在深度分析二者的基础上给出相应元数据工作的建议方案。
4.1 需求调研 元数据研制人员与内容专家、领域用户进行深入沟通,通过与有关人员的接触、访谈,了解该工作的背景、目的、需求、目标等信息,掌握各方对数据资源元数据的需求,主要4
包括:
z 应用背景;
z 是否存在现有标准规范及其基本现状信息;
z 元数据的目的、范围与属性,如描述人、事、时、地、物,或词汇控制等属性;
z 元数据的功能定位,如资源的描述、检索、索引或管理等功能;
z 元数据预计或预期的进展安排;
z
有关人员联系信息。
4.2 现有方案调研 了解元数据需求后,应调研和分析同领域内当前元数据方案的建设情况,并对现有标准及其应用情况进行详细分析,评估其对当前需求的满足程度。在标准分析时,应从适用对象(资源类型、学科)、功能等方面综合考虑,归纳总结出其对当前需求的满足程度与不足。而应用分析则重点在于发现标准规范在用户应用时的发现、总结和反馈,辅助充分了解标准对当前需求的满足情况。同时,在研究中还应了解本学科领域其元数据的应用趋势和议题,以作为未来实施与发展的参考。
此步骤分析的成果,将有助于了解与其它同质或相似标准规范间的差异,取长补短藉此以完善需求、目标。
4.3 需求分析 融合领域现有标准规范及其应用的分析研究成果,在元数据制定工作展开前应更深入的对需求进行分析,适当扩大沟通对象范围,与领域专家、用户和系统设计人员进行深入的交互,充分了解各方面的需求,为元数据制定奠定良好基础。
深入分析阶段经过与更大范围有关人员的交互,将获得如下信息:
1. 元数据元素需求,包括元素名称、定义及著录规范;
2. 元数据元素属性,包括数据型态、必填性、多值性等;
3. 元数据元素关系;
4. 元数据元素代码表;
5. 元数据著录范例;
6. 功能需求;
7. 数据查询与呈现需求,包括不同层次的检索(如关键词查询、进阶查询)与呈现(如简要显示、详细显示);
8. 元数据管理需求,如权限控制。
5
4.4 确保兼容性 利用之前的研究发现,根据需求所发展的元数据内容应当尽可能的与现有的元数据方案在内容上兼容,支持基于此元数据方案的元数据能够在更大范围与其他元数据实现数据交换和互操作。
5 方案制定
方案制定则基于调研分析的结果完成方案的研制,并通过结构化定义、规范化文档实现元数据方案的规范表达,且针对数据交换和集成的需求将元数据方案注册到开放的系统中。
5.1 方案制定 5.1.1 方案制定 根据“调研分析”的成果,实现元数据方案制定所涉及的全部内容,至少应包括以下内容:
1. 标准制定的背景、规范性内容引用、术语等;
2. 元数据方案完整正文,主要包括:
a) 复合元素、元素及其关系等内容的详细描述和图例;
b) 元数据复合元素、元素代码表;
c) 标准规范字典表;
3. 标准规范之XML Schema或UML描述;
4. 元数据与参考规范之间的映射关系;
5. 标准规范应用方案制定的约定和方法。
5.1.2 意见征求和修订完善 元数据方案制定完成后,应当再次与领域专家、用户和系统设计人员进行深入的交流,征求上述人员对该标准规范的意见,并努力就内容及其细节等达成共识。
当存在需要对标准进行必须完善的意见时,应根据共识意见把对标准规范进行相应的修订完善,有必要时可对标准进行再次的意见征求和修订完善。
6
5.1.3 制定应用规范 为了推动标准在更大范围内的应用,提高标准的应用质量,特别是控制和保证元数据记录的质量等,应当制定系列应用指导性规范,帮助用户理解和使用标准有关的内容,包括元数据元素定义、著录原则、著录范例,以及元数据服务过程中计划供应用标准的检索元素表与参考数据等。
应用规范应同时兼顾标准管理系统的设计与实施,在元数据管理系统的设计和开发过程中为系统分析人员和设计人员等提供重要参考。
5.2 结构化定义 元数据在定义中应当包含以下几个方面的内容:
(1)适用范围说明。说明元数据所适用的特定研究对象和适用范围。
(2)词汇及其约束集合。词汇集合是表达信息对象属性的词汇(即数据元素)及其语义定义的合集,对元数据中的每一个数据复合元素、元素,都应对其名称、定义、数据类型等信息做出明确规定;而约束规则集合则定义元素(复合元素)、结构约束和句法特征的规则,诸如元素(复合元素)的可选性、可重复性、数据元素之间的关系等。常常词汇和约束集合交叉定义,通过语义定义实现对复合元素、元素的概念及其约束的声明。标准之复合元素、元素的定义应遵循如下规则:
发布者:admin,转转请注明出处:http://www.yc00.com/news/1689764021a284272.html
评论列表(0条)