2023年6月30日发(作者:)
2012年第2l卷第4期 http://www.c-S-a.org.cn 计算机系统应用 一种本体编辑及可视化工具① 毅 , 张欢欢 ,-,宋良图 ,魏圆圆 ,一,朱(中国科学技术大学自动化系,合肥230026) (中国科学院合肥智能机械研究所,合肥230031) 摘要:随着本体的广泛应用,构建实用本体的重要性愈加突出。在中文领域,支持中文的本体构建工具不够 完善,迫切需要高效、符合中文习惯的本体开发工具。利用pr0 .owl API对本体进行底层操作,利用Prefuse 库实现可视化,采用MVC框架开发了一款中文本体编辑及可视化工具。’实验表明,该软件能够有效地对中文本 体进行编辑和可视化,为中文本体的构建者提供了更加适合中文的本体构建平台。 关键词:本体;prot6g6-owl API;可视化:Prefuse 1r0ol f0r Editing and Visualization Of oWL Ontologies ZHANG Huan.Huan ,-,SONG Liang.Tu ,WEI Yuan.Yuan .一,ZHU Yi , (Institute ofIntelligentMachines,ChineseAcademy ofSciences,Hefei 230031,China) (Department ofAutomation,University ofScience and Technology ofChina,Hefei 230026,China) Abstract:With the extensive application of ontology in many ifelds,it is more and more important to build practical ontologies.Howeve ̄available editing tool for Chinese ontologies is rare,so efficiem ontology development tool which is xlesigned or fChinese is needed.In this paper,we present a tool for editing nd aVisualization of Chinese ontologies on MVC mode,which reads and writes Chinese ontologies with the pmt6g ・owl API,and implements ontology visualization with prefuse library.The experiments show that the design can edit and realize he vitsualization of chinese ontologies efficiently,which provides a more convenient platform for chinese ontology researchers. Key words:ontology;prot6g6-owl API;visualization;prefuse 随着本体在知识工程、语义网(Semantic web)、系 统建模等领域的广泛应用,构建实用本体(Ontology) 发工具pr g6在处理中文时存在各种编码问题,同时无 法提供对中文本体的可视化功能。而国内至今还没有一 的重要性愈加突出。而本体的构建离不开本体开发工具 的支持,它使用户不需要了解本体语言的细节就可创建、 解析、存储和重用本体。国外对本体开发工具的研究较 早,也产生了大量的本体开发工具。Michael Denny在【I】 中指出,截至2004年为止本体开发工具有94个,从最 早的Ontolingua、OntoSaums、WebOnto到pmt6gd[2]、 oiled、OntoEdit等,现在的本体开发工具数目还在不断 的增加。然而,这些本体开发工具只是对英文提供了很 款完备的本体开发工具,为了更好的支持中文本体的开 发,因此迫切需要高效、符合中文习惯的本体开发工具。 对于本体开发工具而言,其所支持的本体描述语 言的选择非常重要,而W3C提出的OWL[3]语言具有 非常强的本体语义描述功能。现有对OWL语言操作 的接口有三个:Jena、OWLAPI、Prot6g6-OWLAPI。 其中Prot6gd.OWL API[41是本体开发工具prot6g6提供 的专门针对OWL和RDF(S)本体语言的开源Java类 好的支持,而对中文本体进行可视化、推理、解析等方 库。Prot6g6.OWLAPI提供了加载和保存OWL文件、 查询和操作OWL数据模型的接口,以及执行基于描 面或多或少存在一些问题。例如,当前较流行的本体开 ①基金项目:国家科技支撑计划(2o08BAK49BO5);中国科学院知识创新工程青年人才领域前沿项目资助 收稿时间:2ol1-o7-2 收到修改稿时间:2011-08.29 计算机系统应用 h ̄p:llwww.c-S-a.org.cn 2012年第2l卷第4期 述逻辑推理的接口。 (OWLAnonymousClass)。 本文设计了中文本体的编辑及可视化工具,它结 合中文环境下的本体特征,采用GBK编码、MVC设 计模式,利用prot6gd—OWL API对本体进行读写操作, 采用数据可视化工具Prefuse实现本体的可视化。该工 性2)OWLProperty,即本体中的属性,包含对象属 (OWLObjectProperty)、数据类型属性 3)OWLIndividual,即本体中的实例。 (OWLDatatypeProperty)。 具能更好的支持中文,完成对中文本体的编辑和可视 除此之外,OWL本体模型中还包含了本体的命名 化。 l 中文本体编辑及可视化工具的相关概念 1.1 OWL本体模型 Studer在文献[51oo提出本体ontology是共享概念 模型的明确的形式化规范说明,包含概念模型、明确 性、形式性和共享等含义。Perez在文献[61q ̄提出按分 类法来构建本体,本体包含5个基本的建模要素,分 别是类(概念)、关系、函数、公理和实例。OWL(wleb Ontology Language)是W3C提出的一种本体描述语 言,可以用来描述Web文档和应用中的内在类和关系 [71。OWL采用了面向对象的方式,通过类和属性来描 述资源,并且通过公理来描述类和属性的特性及关系。 OWL本体包括了类、属性、实例的描述嗍。 Protdgd.OWL API中的OWL本体模型是个数据结 构类图。最上层的接口是OWLModel,对owl文件的 操作均是通过先创建该owl文件的OWLModel模型, 而后通过该OwLModel进行创建类、属性和实例以及 它们之间的关系。OWL本体模型的组成元素众多,下 图只是给出了一个比较简单的结构,如图1所示。主 要组成有以下几部分: 图1 OWL本体模型 1)OWLClass,即本体中的类或者概念,其中类主 要是命名类(OWLNamedClass)和匿名类 I16研究开发Research andDevelopment 空间(NameSpace),本体的名称等。 1.2中文编码 OWL文件使用xml编写,编码使用xml的 encoding特性指定,默认编码是UTF.8。UTF.8是 Unicode的变长字符编码,用1到6个字节编码Unicode 字符。大部分的本体开发工具为节约存储空间采用基 于UTF.8编码,例如protdgd软件,这些本体开发工 具能很好的处理采用UTF-8编码的OWL文件。但是 当OWL文件中的元素是以中文命名元素名称时,如< 省级rd about=”}}&}}22825;津市”></省 级>,采用UTF.8编码的本体开发工具无法识别该中 文OWL文件,会以乱码出现,使这些本体开发工具 对中文的支持能力不尽如人意。 为正常显示以上出现编码问题的中文OWL文件, 有两种解决方案:一是将OWL文件的encoding属性 指定为GBK编码,protdgd等本体开发工具能正常显 示中文本体,解决乱码问题;二是将protdgd等本体开 发工具的编码更改为GBK,如在prot6gd安装目录下 的protege.1ax文件中加上一行:protege.ifle.encoding =GBK,这样也能正确显示中文本体。第一种解决方 案,对每个中文本体均要修改编码,而第二中解决方 案是从本体开发工具出发,根本解决编码问题。为了 更完美地处理、显示中文本体,本文采用GBK编码。 1.3可视化 本体可视化的工具主要分为两种,一种是基于 prot ̄gd的可视化插件:另一种是独立于本体领域的通 用可视化工具[91。 Prot6g ̄官网【l01上的可视化插件有21种,常用的 有OWLViz和OntoGraf。在protdgd4.1版本中集成了 OWLViz、OntoGraf两种可视化插件,以树的图示显示 本体元素间的关系。OWLViz显示了类层次结构间的 父子关系;OntoGraf展示了本体中包括类、属性、实 例等元素的图示关系。这两者在处理中文本体时遇到 了不同现象的编码问题:OWLViz无法对中文本体图 示进行布局,生成的图形堆叠在左上角;OntoGraf无 2012年第2l卷第4期 hUp://www.c-s-a.org.ca 计算机系统应用 法生成中文图示。究其本质原因,插件是基于UTF.8 层之间沟通的桥梁,将View层的修改传递到Model层 数据模型中,或把Model层的数据变化精确更新到 iew层显示中。该系统结合中文环境下的本体特征,V 采用GBK编码、MVC设计模式,能更好的支持中文, 编码,iava语言对I/0流(字符流和字节流)处理存 在的编码问题。 独立的可视化工具拥有更加强大的可视化功能和 扩展接口,如美国加利福尼亚州伯克利大学计算机科 学开发的java开源可视化工具包Prefuse[¨】。Prefuse 是一个用户界面包用来把有结构与无结构数据以具有 实现中文本体的编辑和可视化。 2.3本体编辑 本体的编辑是通过操作本体四个元素的图形化界 面来实现,四个视图分别为:类视图、对象属性视图、 交互性的可视化图形展示出来。它是一个比较强大的 数据建模显示工程,支持多种数据的建模、显示,以 及与用户的交互。它提供了表(Table)、图(Graph) 和树(Tree)作为数据的基本结构,且图和树是表的 另一种形式。在数据显示方面,它提供了大量的布局 以及视觉编码技术,并且支持动画、动态查询等。 本文的可视化系统是基于Prefuse可视化工具包 进行二次开发,实现了中文本体的可视化。运用树 (Tree)数据结构,由节点(Node)和弧(Edge)组成, 其中节点映射本体中类、实例元素,弧映射本体中的 属性元素。 2本体编辑及可视化工具的设计与实现 2.1总体架构设计 系统框架采用MVC(Mode1.View-Controller)设 计模式,分为三个部分:Model层、View层和Controller 层,如图2所示。Model层是Protdg6.OWL API中描 述的OWL本体模型,包括类(OwLC1ass)、属性 (OWLProperty)和实例(OWLIndividua1)等元素: iVew层显示和操作底层模型的图形用户界面,包含类 视图、对象属性视图、数据属性视图、实例视图和可 视化等五个视图:Controller层实现Model层和View 图2系统结构图 数据属性视图和实例视图。类视图面板分两部分,左 边部分以树的形式显示本体中包含的所有类,右边是 类属性(包括Annotation属性、父类、互斥类)编辑 区域,实现了类及其属性的“添加”和“删除”功能。对 象属性视图、数据属性视图、实例视图的布局与类视 图相似,实现了以树状结构显示本体元素及其 Annotation属性、定义域类、值域类的“添加”和“删除” 相关操作。具体实现以类的显示为例,读取文件到 OwLModel中,先获取该OWLModel模型的根节点 Thmg类(Thing类是所有类的父类);而后通过递归 调用showClassTreeOi ̄数在左侧树中显示出所有用户 自己定义的类。以下代码为递归函数showClassTree0 的部分代码。 算法showClassTree(treeRoot,extendedlterator) 输入:父节点treeRoot,包含该父节点的所有子 节点的迭代器emendedlterator 输出:树状结构 f0r(迭代器extendedIterator){ 获取该类节点node,添加到树中 Ifnode有子节点 do showClassTree(node,子节点迭代器) return树 Research andDevelopment研究开发117 计算机系统应用 http://www.e-S-a.org.cn 2012年第21卷第4期 本体编辑的图形化界面如图3所示,以“东海鱼类 本体可视化实现了从上到下、从左到右的视图显 本体”为例。用户只需要在四个面板之间进行切换即可 顺利地完成对本体的编辑,步骤清晰地构建所需要的 领域本体。 2.5本体可视化 示,并支持用户在画布上对本体的对象进行直接拖拽 编辑,从左到右的结果如图5所示,以“东海鱼类本体” 为例。用户可以从图示中清晰地看到概念的层次结构、 属性关系、实例等内容,并可以直观、简便地进行正 确性检查。 可视化视图,通过调用数据可视化工具Prefuse库 中Tree型数据结构显示出本体数据对象。Prefuse的 数据处理对象是Prot6g6.OWL API中所创建的 3中文本体开发工具比较 OWLModel本体对象。根据图4所示的映射关系,将 本体数据对象映射到Prefuse的数据对象,本体类和实 例分别映射为对应的节点(Node),对象特性映射为对 应的边(Edge)。 \ ,, 。<三二=) 三> 、\ .....一,/ \一 / 三> @: :: 一) ( 木体数掘对蒙 Profuse数据对象 图4数据对象映射图 …_■鼎嘲瞩黼踊礴瓣鞴嘲黼瓣鞴耨嘲 鞴酾碲瓣黼鞴 鞠黼瓣辎鼎 目 穗 醯嬲 “臻纛 ■—黼 嬲爨翳照 l 毒黼 捂鼙鼍毫钳幢 球蒜《 蠢 雠 }{糖掌 鼢●雄瞻鲁《 }鲁搠啦帻 啭 堍鞭 魄 g p “ 渤 :黼 i :端 i峨 # 蜉 酾 械 讯l | 霸 婚 {w ; 麟; 峨 嘲 辔嚣粤耐 图5可视化界面 118研究开发Research andDevelopment 中文本体开发工具的研究在国内的最有代表性 的是苏晓路在文献【12】中提出的LODE本体开发系 统客户端和王晓盈在文献【13】中提出的中文本体构 建及可视化研究。在文献[12】中的LODE系统中, 本体的浏览方式是将类、属性和实例以树形结构显 示,并按类、当前类的相关属性及当前类的实例的 顺序排列同一棵树中。这样的显示方式可使用户浏 览本体时,完整地看到当前类的所有相关元素,提 高了本体浏览的整体性,但此方法的在类和属性的 节点较多时,受屏幕显示范围的局限,利用鼠标编 辑会有所不便。在文献[13】中提出的中文本体构建及 可视化工具是,汉化prot6g63.4的核心功能,修改 OntoViz插件的接口解决编码问题,实现了中文本体 的构建和可视化。这样的方法可以缩短开发周期, 但是prot6g6 3.4版本的基于OWL本体建模方式仅 支持OWLI.0,不支持OWL2.0:对象属性和数据属 性在一个视图中,不利于查看和编辑。本文中提出 的本体编辑及可视化工具采用GBK编码、MVC设 计模式,利用prot6g6.OWL API对本体进行读写操 作,利用数据可视化工具Prefuse实现本体的可视化。 该工具实现了图形化编辑本体文件,用户只需要在 四个面板之间进行切换即可顺利地完成对本体的编 辑,步骤清晰地构建所需要的本体,比文献[12】中的 开发工具更优越,当不同类存在相同的属性或实例 时,不需要重复地构建属性和实例;并且,可以从 可视化图示中清晰地看到概念的层次结构、属性关 系、实例等内容,并可以直观、简便地进行正确性 检查,比文献[z3】中仅显示类之间关系的工具更完 善。因此该工具能更好的支持中文,实现中文本体 的编辑和可视化。 4结语 文中对当前较流行的本体开发工具进行了研究分 2012年第21卷第4期 http://www.c—S-a.org.cn 计算机系统应用 析,针对当前中文本体开发工具不够完善的现状,通 过Prot6g ̄.OWLAPI、数据可视化Prefuse技术,采用 Accessed Date,2005,15(06):2005. 5 Studer&Benjamins VR,Fensel D.Knowledge engineering: principles and methods.Data&knowledge engineering. MVC设计模式设计并实现了中文本体编辑及可视化 工具。它提供友好的图形化界面,可以为用户提供方 1998,25(1—2):16l—l97. 便快捷的中文本体开发平台。 由于一个完善本体的开发是一项长期而艰巨的工 程,其构建工具的性能直接影响到本体的开发效率和 6 P6rez AG Benjamins VR.Overview of knowledge sharing nd reuse components:Ontaologies and problem-solving me.otis,1999.C ̄teseer,1-15. 7 Mcguinness DL,Harmelen VF.OWL web ontology language overview.W3C RecommendatiON,2004,10:2004-2003. 质量。本体的推理技术还需要进一步的完善,利用 prot ̄g6一owl API实现语法检查、一致性检查,以及查 询等功能。随着系统功能的不断开发改进,该中文本 体编辑及可视化工具将会成为一个完善的中文本体开 发工具。 8 Wely C,Mcguitnness DL.OWL web ontology lnguage aguide.W3C recommendation,W3C(February 2004)http:/ 参考文献 1 Denny M.Ontology tools survey,revisited.Retrieved February,http://www.xm1.corn/pub/a/2004/07/14/onto.html20 04,20:2006. 2 Noy N,Fergerson Musen M.The knowledge model of /www.w3.org/TR/2004/REC-owl-guide一20040210. 9董慧,王超.本体应用可视化研究.信息系统,2009,12(32): l16--120. 10 Topic・Visualization.http://protegewiki.stanford.edu/wiki/ Visualiatizon. Protege-2000:Combining interoperability and flexibility. Knowledge Engineering and Knowledge Management Methods,Models,and Tools,2000.69-82. 1 1 Prefuse.URL:http://prefuse.org/doc/manua1. 12苏晓路,李景,孟学宪,等.LODE本体开发系统客户端的主 要功能与特点.农业网络信息,2009,8:63—65. 3钱平,郑业鲁.农业本体论研究与应用.北京:中国农业科学 技术出版社,2006.90-91. 4 Knublauch H.prot6g6-owl api programmer’S guide.ORE: hUp://pmtege.stanford.edu/pluginsdowl/api/guide.html,Last 13王晓盈,王晓璇,刘鹏.中文本体构建及可视化研究.计算机 技术与发展,2010,2,20(2):121—124. 14朱丽娟,王康元,张洁.基于SVG和Java的电力系统节点电 压可视化.继电器,2006,34(5):60-64. (上接第155页) 良好的推广前景。以西门子S7.200 PLC CPU226为中 技术,2008,9(17):185—187. 央处理单元,不仅增强了系统的稳定性及抗干扰性而 且建立了良好的人机界面,可以及时地了解系统的运 行情况,从而减少查找、排除故障的时间,提高了工 作效率。 3徐达,侯友夫,荣延平,刘良勇.新型矿用隔爆四回路智能组 合开关的研究.中国矿业,2007。16(1):87—89. 4陶学仪,尚药世.现代化矿井安全高效综采工作面供电技术. 煤炭学报,2010,35(11):1930-1934. 5郁青林,王东,汤东旭,李翠兰.基于PLC的矿用组合开关的 参考文献 l黄静波,牟龙华.矿用组合开关主控单元的设计.工况自动 化,2007,2(1):74—77. 设计.工况自动化,201l,3(3):19-21. 6赵洪瑞,孙凡李仲强,王糠基于PLC的矿用隔爆兼本质安全 型智能真空组合开关控制系统.电气防爆,2009,4(4):40-43 2李萍.矿用隔爆兼本质安全型八组合开关的研制.现代电子 Research and Development研究开发1 1 9
发布者:admin,转转请注明出处:http://www.yc00.com/xiaochengxu/1688106216a82365.html
评论列表(0条)