2023年7月19日发(作者:)
第1 1卷第1期 201 1年3月 广东培正学院学报 JOURNAL 0F CUANGD0NG PEIZHENG COLLEGE Vo1.1l N0.1 Mar.20ll 元数据管理与应用 记暨南大学管理学院潘定教授的学术报告 12月7日下午,计算机科学与工程系邀请了 暨南大学管理学院潘定教授来我院作主题为《元数 据管理与应用》的学术报告。报告由计算机科学与 工程系谢深泉主任主持,计算机科学与工程系全体 老师及部分对数据库管理及智能商业感兴趣的学生 到场聆听了报告。 潘定教授是暨南大学管理学院信息管理与信息 系统博士生导师,商务智能研究中心副主任,西安 交通大学计算机科学与技术工学博士。1983年开 始从事计算机信息系统的研究与开发,1999年后 主要从事商务智能、数据挖掘和智能信息处理的研 究与开发,主持和参加国家自然科学基金项目3项, 主持国家和省级科技项目4项,在《软件学报》、 《模式识别与人丁智能》等国内外核心刊物和国际 会议发表学术论文30余篇、学术专著2部,第一 作者论文被SCI、EI收录23篇;研究成果曾获国 家科技进步奖1项、国家科技攻关重大成果奖2项、 中国图书奖1项、省部级科技进步奖3项、省级社 科优秀成果奖2项。 潘定教授讲座的主要内容由以下六个部分组 成:元数据的基本概念、数据仓库中的元数据、元 数据通用模型与国际规范、元数据管理策略、元数 据管理系统的建设、元数据管理的未来发展趋势展 望。 一、元数据的基本概念 随着计算机技术和GIS技术(Geographic Information System,地理信息系统)的发展,管理和 访问大型数据集的复杂性已成为数据生产者和用户 共同面临的突出问题,数据生产者需要有效的办法 来组织、管理和维护海量数据。元数据作为描述数 据的内容、质量、状况和其他特性的信息的作用已 变得越来越重要,成为信息资源的有效管理和应用 96 的重要手段。 潘教授首先以图书馆中的索书标签与书库中 的书籍的关系作为类比,引入元数据与数据间的 关系,浅显易懂,将“关于数据的数据”这样一 个晦涩、难懂的科学术语用简洁的语言作了通俗 的说明。接着指出:传统的书目数据、产品目录 等都是元数据。从元数据在数据管理、在异构系 统信息共享、在描述数据资源的静态和动态形 式、在保障数据质量工程的地位等方面的详细阐 述中,说明元数据在整个信息管理和信息系统中 的地位。在此基础上,进一步列示元数据能解决 以下方面的问题:描述(description)、资源发 现fresources discovery)、认证(authentication)、 互操作(interoperability)、数据管理(data management)、访问控制(rights management)、 数字化保藏(digital preservation)、内容分级(content rating services)。在理解这一概念时,要明确元数 据是抽象概念,当人们描述现实世界的现象时,就 会产生抽象信息,这些抽象信息便可以看做是元数 据。 二、数据仓库中的元数据 数据仓库系统包含来自各开发商的各种工具, 如数据建模工具、ETL工具、管理和维护工具、数 据分析工具。所有这些部件都产生或消费元数据, 一般采用典型的元数据分散管理模式,即单独维护 元数据,并且采用不同的格式表示元数据,从而导 致大量分布、自治、异构的元数据库共存。在工具 间共享和交换元数据需要复制元数据,但由于采用 不同的元数据表示模型,使得元数据的互操作与集 成十分复杂,在保持变化的元数据一致时更为复杂。 因此,终端用户和访问工具无法充分利用这样分散、 异构的元数据。因而必须对这些元数据进行有效的 元数据管理与应用——记暨南大学管理学院潘定教授的学术报告 管理,推进数据仓库的使用和普及。 三、元数据通用模型与国际规范 需要统一的元数据模型来描述。我们迫切需要一种 义元数据的结构和语义的通用规范,能被整个业 界接受;应以一种标准语言发布,便于各种数据仓 导人;自动的/手工的确定元数据间的关联;快速、 多样化、可视化查找元数据;元模型的可定制;数 数据仓库数据的使用及其相互问的关系,迫切 据变化的动态跟踪;元数据变更的同步;版本管理 (versioning);冲突分析、血统分析、处理分析; 六、元数据管理的未来发展趋势展望 元数据的应用及元数据管理的未来发展趋势展 统一的模型来规范描述元数据。这种模型必须能定 发布机制;安全保密机制等。 库工具和人们所理解和利用;要以一种简洁、统一 望是本次报告的重点。元数据在以下领域已经得到 的格式发布,便于各开发商在多平台上采用多种技 广泛的应用:DC、地理信息系统、远程教育系统、 术来实现。OMG推出的通用数据仓库元数据模型 (CWM)的组成结构和底层技术标准能满足这一要 求。CWM使得可以在异构环境下的各种数据仓库 工具、数据仓库平台以及数据仓库元数据存储间方 便地交换数据仓库和商务智能的元数据。CWM规 范尽可能地囊括了开发数据仓库所需要的各方面描 述信息,并且是基于目前最通用的业界标准,对于 元数据的规范化与管理都有着极其重大的意义。 四、元数据管理策略 元数据管理是构建、管理、维护和使用数据仓 库系统的核心部件。元数据管理是用来帮助我们了 解有什么信息,信息在什么地方,以及整个企业组 织如何利用信息的管理方式。简单地说,是我们如 何有效地按时管理信息管理环境。基于此,我们必 须首先了解元数据管理的主要矛盾:元数据对数据 的集成、综合、一致与在具体对元数据管理过程中 出现的用户自治之间的矛盾。因此,要有效的对元 数据进行有效的管理,必须了解元数据管理的关键 问题和管理过程中的难点工作:互操作性、更新同 步、版本管理、一致性和语义。 五、元数据管理系统的建设 计算机技术和GIS技术的发展,使得管理和访 问大型数据集的复杂性已成为数据生产者和用户共 同面临的突出问题,数据生产者需要有效的办法来 组织、管理和维护海量数据。元数据作为描述数据 的内容、质量、状况和其他特性的信息的作用已变 得越来越重要,成为信息资源的有效管理和应用的 重要手段。潘教授指出,元数据管理系统除应该具 有新建元数据、打开元数据、导人文本文件、导人 模板、打开质检信息、批处理元数据等基本功能外, 还得提供如下丰富的功能:开放式、多种的元数据 电子政务、生物多样性等,但数字图书馆应用,或 任何开放信息系统的应用领域还有待于进一步设计 方案。因此,潘教授在介绍这方面时,主要从三个 方面加以阐述:1.数据和信息质量的应用;2.语 义和业务规则应用;3.合规性应用。 合规性是来自审计学的一个概念,它将是否有 好的规范,以及是否很好地执行既有规范作为考核 的标准。具体而言,合规性考核的第一步,就是要 解决有没有好的规范的问题,即必须要有指导IT 运营的规范,这个规范还必须要合理、严密、完整, 并能够对IT运维工作提供非常具体有效的指导。 只有这样,才是好的规范,才能使IT运营做到有 法可依。第二步,在制定出好规范以后,还要对规 范的执行程度,即执行是否全面到位进行考核。只 有依据这个规范,一丝不苟地执行,IT运营工作 才能达到设定的目标,IT运营才能做到有法必依。 因此,合规性的应用要求使用者必须明确:系统中 存储什么信息?存储的信息位于何处?谁能够访问 系统?他们可以访问什么?访问是否合适? 元数据管理还可以帮助企业解决以下问题: 支持企业IT管理;减少IT冗余度;跟踪、防止IT 应用的失败、减少IT支出、促进知识管理、促进 企业的应用、满足监管者的需求。 潘教授在最后对元数据管理的前景提出了不少 设想,并用中国移动与中国电信两大企业中对元数 据管理重视程度上的区别来说明,在存在海量数据 的企业中,谁重视元数据的管理,谁就能从这些数 据中找出自己需要的信息,这是未来企业的核心竞 争力所在。 (计算机科学与工程系陈伟、巫幸兴整理) (责任编辑:汝炳荣;责任校对:廖宇飞,黄柳梅) 97
发布者:admin,转转请注明出处:http://www.yc00.com/web/1689765379a284346.html
评论列表(0条)