2024年5月9日发(作者:ppt怎么制作流程图)
蝈辑胡段
}mail:huxin@cesi.ar._cn
国家版式文档标准专题l
-Topic
on
NationalStandardsh>r
OpenFixed—layoutDotalment
I
编者按:电子会文、数字出版物、电子档案等行业长期存在文档格式不一致、访问接口多样等瓶颈问题.
尽快解决国内文档存储格式不统一、形成具有自主知识产权的核心技术、切实支持电子文件可管、可控和长期
保存成为软件产业当务之急。工信部组织制定具有完全自主知识产权的版式文档格式规范标准,不但有助于电
子文件的显示和存档并保证国家电子文件的安全.而且进一步整合国家优质的产业资源,推动我国电子文件版
式技术等软件产业的良性发展。本期‘国家版式文档标准专题’组织标准起草专家介绍标准重要技术方橐.以
覆和国际同类标准的比对分析。以飨读者。
国家版式文档格式规范(OFD)中的
技术方案
IntroductionofTechnicalSchemesin
OpenFixed—layout
DocumentFormat
■中国电子技术标准化研究院王聪李海波丛培勇
北京数科网维技术有限责任公司陈亚军
摘要概括了为电子文件管理而制定的国家版式文档格式规范的文件格式框架、页面描述、打包压缩等主要
内容,分析了其中较为重要的技术方案,包括纯粹版式描述方案、盒式模型、非接脯式模型等。
关键词版式文档文件格式框架技术方案
Abstract:Conclutionof
contents
andschemasof
Fixed-layout
Document
Format,which
is
developedforelecla'icalfile
are
management.Imponent
technicalschemes
non
contact
introducedand
analyzed,including
format
deseriptionschema,boxmodel,
model.
Keywords:Fixed-layoutDocument;document
formation
Schema;technicalscheme
1引言
版式文档是电子文件应用的一个重要门类.是
常用的基础办公软件之一.其具有原版原式的呈现
特点,即阅读显示与印刷效果一致,真实地保持了
文档产生之初的文字、图表、色彩等版式信息,具
有高保真的显示和打印效果。国家版式文档标准是
继办公软件存档格式标准之后在信息技术领域推出
的又一项重要标准,是对电子文件进行科学有效管
准,文件除资源性文件如图像和多媒体使用流行的
外置格式外,都采用XML文件来描述具体业务。这
与OOXML和ODF以及国内的UOF采用的是同一
种框架。
页面描述
页面描述是版式文档格式中的核心部分,原版
原式的呈现特点就靠页面描述文件来保证.同时这
也是版式文档中其他数据进行工作的基础。页面描
述文件主要规定了页面的图层、图元及其具体属性.
OFD的页面描述采用了自定义的页面描述。
打包压缩
OFD采用了ZIP格式作为文件架构的打包方案。
对XML文件,统一采用Deflate压缩算法:对于资源
理的基础设施之一。OFD原是开放版式文档(open
Fixed—layout
Document)的英文缩写简称.后用作指
代国家版式文档格式规范。
2
OFD的内容
文件格式框架
OFD是一种采用“文件+打包”架构的格式标
文件,可根据其格式灵活选择Deflate压缩或者不压
缩两种处理方式。
安全应用
文件的安全应用离不开加密和数字签名。因为
万方数据
暖啜圈[
I国家版式文档标准专题
●Topic
On
NationalStandardsfor
OpenFixed・layout
Document
主体文件是采用XML文件描述的.所以OFD选择
了XML
Signature作为其效字签名方案。
其他内容
版式文档格式标准还包括导览大纲,自定义标
引、信息扩展等内容。这些内容的数据都基于页面
描述.与文档的页面内容存在着各种层级的引用关
系。其共同特点都遵循下文所介绍的。非接触”引
用方案。
相应的机制忠实记录这些信息即可。这样既避免了
引入任何可能引起混乱和实现困难的排版因素,又
实现了最为忠于源文档的精确排版效果.并且这样
做省略了在阅读器端进行排版计算的时间.更有利
于版式阅读器的技术实现。
基于以上认识,本规范中对文本设的定位采用
了Delta方案。即精确记录文本图元中每个字形的绘
制位置在坐标方向的变动值,即上一个绘制点到当
前绘制点在各坐标方向上的偏移值,如图1所示。
3技术方案
3.1纯粹版式描述方案
纯粹版式描述方案又称Delta方案.是
用于描述页面中的文本图元的,文本图元由
一系列字形(字符最后也转化为字形)组
成。在标准制定过程中,存在两种文本描述
方式,一种是类PDF方式,给出文本的字
_—“
阅馥方向
—
网冈冈囡囝瓯
图1文本的Delta定位
Bou
I基
型、字号、词间距、字间距等部分排版要素,阅读
器解析文件后必须先对文本对象完成一个局部排版,
确定出每个字形的绘制位置后再进行渲染和显示。
另一种方式是在版面描述中直接给出每个字形的绘
制点或能确定绘制点的直接数据.例如绘制点的间
距变化,渲染时直接使用这些数据。
在专业图文排版系统中,影响字形最终排版位
在文件生成端。将由排版日I擎确定好的位置
简单取差值即可记录到版式文件中,Telta数组的
长度等于字形数减去1,在阅读器实现时,从文件
中读出这些偏移值简单相加就可以获得每个字形的
绘制位置。从而立即开始渲染过程。OFD文本的
这一定位方式与微软公司推出的XPS(XML
Paper
Specification)是相似的。与PDF中的文本描述方式
相比,这种方式具有两个好处:将字形位置的计算
交由更专业的上游排版软件来确定。定位效果更为
置的因素很多,例如字宽、字型样式(粗体、斜体)、
字问距和词间距、不同文种的调整间距、中文排版
中的标点压缩、英文排版中的字距调整、字形变换
和位置调整、版面中其他图文的推挤等,将这些因
素部分引入到版式文档中,则不能解决全部的排版
问题,必需辅以大量的拆分和连接:如果全部引入,
忠实于原文;二是减轻了阅读器端的计算任务,有
利于阅读器的轻量化。
3.2页面定位模式一盒式模型
版式文档技术领域的领先的Adobe公司,干
1995年推出的PDF格式已经成为ISO标准。PDF最
初是从打印领域发展起来的,其页面呈现和定位技
术模型深受打印和图形接口影响。在这一层次上,
通过虚拟打印,任何文件都可以转化为PDF。而实
际上,在这一层级上的技术模型与常用的软件所使
用的设计模型存在层次上的差异。
OFD的页面描述采用了盒式定位模型.这一模
将使得版式文档处理的业务大大复杂化,需要在内
部大量处理本来应当是由专业排版系统处理的问题,
版式软件的复杂度也因此增大,版式文档将偏离其
原定的设计目标。版式文档是为了原版原式地呈现
文件排版后的效果。引入排版因素只是为了确定绘
制的精确位置。既然字形的绘制位置在排版软件系
统中已经精确确定了.就只要在版式文档格式设计
万方数据
二二圈圈圈
国家版式文档标准专题I
-Topic
On
NadonalStandardsfor
OpenFixed-layout
Document
I
型与网页文件、办公文档的排版逻辑层相一致,相
体数据以及图元绘制“样式”等。对于需要重复引
用的字体和样式等资源命名唯一标识.然后在需要
的地方通过这些标识来引用字体和样式.是现行常
规做法。通过标识进行引用。引用方不会在被引用
方中增加任何数据,被引用方甚至不知道它是否被
引用了,这种双方不直接接触的引用方式就称为4非
比于PDF采用的变换矩阵模型,更加贴近文档数据
的源头,更有利于精确记录文档的原始排版信息.
也有利于引导新的版式文档产生方式——即不通过
虚拟打印直接生成版式文档的方式.见图2。
至|㈣
泓㈣
◆
一
◆
一
图2
接触式4。
将这一思路稍加扩展,即可将其应用到需要其
他使用引用的场合,例如注释、扩展和自定义标引等。
:囝圉
采用非接触式的优点在于切断了直接嵌入方式
造成的数据耦合,文件的各个组成模块之间既相互
联系叉相互独立,多个业务描述可以在一个文件内
OFD转换方式和图元定位模型的参考层次
同时存在,如图3。例如采用非接触引用方式将注释
和页面描述分文件后,对页面添加注释不会破坏对
页面进行的数字签名。
在盒式模型下。图元的Boundaw是一个非常
重要的概念,它规定了图元显示区域的外接矩形,
图元在绘制时超出BoundaW的部分将被裁剪掉。
使用Boundary存在以下的有利之处:首先,这一
概念跟前端软件的排版理念相似.有利于很好的承
载其排版结果,也利于其自主生成版式文件。第
二,Boundaw的使用简化了检查图元的遮盖计算
(Overlap),利于在渲染时使用多线程,因为不互
相遮盖的图元可以安排在不同的线程中进行。
另外,该属性在文本或其他图元选择时,高亮
I@孓誓⑨‰
J・・・・..曲豳‰.
l茴豳
O
图3非接触引用方案
l网圆o
f氅謦.商旷二。三二1
馘娜州
固
n回到嘲蹦・l
圈嘲l
区域拆分连接计算变得简洁。该设置对于鼠标uI位
置计算和互操作中也有较好的意义。
盒式模型的使用还使未来版式文档在向互动性
更强的应用方向——例如基于版式的电子表单——
扩充时,更好地保持技术方案的一贯性,因为大多
数表单方案都基于盒式模型的。
非接触式描述方案的关键在于对象标识的确定。
唯一标识的确定有两种:一种是为被引用的节
点命名ID,通过ID来引用内容。另一种是通过文
件的XPath来引用内容。本格式中选择了m方式,
在OFD中,所有对象的标识(1D)是在文档范围内
全局唯一的。
非接触方案有利于在版式文档中保留更多有用
的信息而不影响OFD作为一个通用版式文件的使用。
3.3数据引用・非接触式模型
OFD是用XML来描述文件内容的。通常的文
档内容中存在多种交叉引用,即文档的内容不能仅
用一棵无交叉的多叉树来表示,而需要用多棵在内
容上相互交织的逻辑多叉树来共同描述.这些树会
重复引用文档中的多种内容。例如页面的内容中可
能会插八文档形成后加入的各种注释和链接等。更
为常见的是文档中被重复利用的字体、图片等多媒
这一特性在某些特定领域例如电子公文、电子票据
和权证应用中特别有用,这些应用中要求版式文档
(下转第29页)
万方数据
呻㈣㈣_■■■■■_
。淼黧:_
国家版式文档标准专题I
Topic
oll
NafionalStandardsfor
OpenFixed-layout
Documcnt
I
3.4中文字体的问题
上述的几个字体匹配方案都依赖于字体文件本
身的一些属性。但对于中文字体来说存在下列问题:
4字体标准化建议
为了让OFD的中文字体的匹配方案能够更好地
发挥其功效,应在以下三个方面加强研究:
第一,在字体相似度测量的标准上加强研究,
找出字体匹配的合适特征,并将其标准化,形成中
文字体的匹配度量标准和体系。可考虑以下特征:
字体的设计字形外框与其实际字形的外接矩形的比
值、字体的Leading与字高的比例、字形的笔触特
征等。
第二。在Panose的架构下寻求字体族名、字体
的Family
Kind等维度的标准化取值,制定相关的技
术标准.并强制现有的字体生产商贯彻实施。
第三,提供公开源代码的字体匹配和替换算法,
促进各类软件在此向技术上的算法的趋同.从而在
不同的软件之间实现相同的字体匹配效果。
事实上.字体匹配技术并不单是版式文档领域
的事,涉及图文处理的软件都可能需要该技术,及
早开展这方面的研究和标准化工作,对于整个电子
文件产业都是极有意义的。匠
(收橹日期:2012-09-03)
首先对于方块汉字和繁简体字符集字体来说,基本
上不会在FixedWidth和Charset这两个属性上比出高
低:其次中文字体不存在同一个字体有粗体和斜体
等副本,文本斜体效果都是借助矩阵切变实现的,
而其粗体效果是借助于勾边渲染实现的.Italic、Bold
主要是针对拉丁文字字体。因此.在OFD的字体匹
配参数中只能在FamilyName和Serif这两个度量维度
上进行比较.而只有像Panow那样对FamilyKind属
性的取值进行标准化和规范化。才有可能在数以百
计的中文字体中找出你要的替代字体。
由于之前没有相应的国家或行业规范.各个字
体的族名大都跟字体名一样,这样使得中文字体在
族名(FamilyName)这一重要维度变得不可度量,
任意两个字体在这一混乱的维度上彼此距离都是差
不多相等的,而族名这一维度在字体匹配的算法中,
其重要程度仅次于编码范围(Charset)。要想在中
文字体的匹配上有较好的效果,还有许多研究和规
范化工作要做。
(上接第2l页)
带有结构化的语义信息。
3.4
方案产生的多种情况。
0FD中的冗余设计
OFD在研制时.充分考虑了不同厂商问的兼容
4结语
《电子文件管理办法》提出了对电子文件安全
性问题,比如页面描述中的转换矩阵(CTM)属性,
转换矩阵是一个非常强大的特性。可以同时表示缩
放、旋转、切变以及上述效果的叠加。但OFD同时
在图元中设计了缩放切变和旋转等属性,因此同样
一个版式呈现效果。可以用多种OFD的特性组合
保密可信可控管理的总体目标.确保我国电子文件
信息长期可控、可读、可用的关键在于电子文件的
格式,而版式文档格式标准是其中的重要组成部
分。标准文本的确定本身是一个意义重大的事件,
但意义更为重大的是标准的技术实现和真正应用。
来描述。例如文本的横向缩放。可以用文本图元的
Hsc.ale来表示,也可以用水平缩放的CTM来表示。
这种情形就是OFD中的冗余设计,生成版式文档时。
实现者可以根据自己所处的实际情景按照自己最熟
悉的方案来生成,而阅读器端则应能准确处理这些
只有通过真正的实践才能验证和发展标准,才能促
蓑黧喵存档和交换文件格式向蛀可控的方向
沉积。髓
(收藏日期:2012-07-10)
万方数据
磁圈圈[
国家版式文档格式规范(OFD)中的技术方案
作者:
作者单位:
刊名:
英文刊名:
年,卷(期):
王聪, 李海波, 丛培勇, 陈亚军
王聪,李海波,丛培勇(中国电子技术标准化研究院), 陈亚军(北京数
科网维技术有限责任公司)
信息技术与标准化
Information Technology & Standardization
2012(9)
引用本文格式:王聪.李海波.丛培勇.陈亚军
国家版式文档格式规范(OFD)中的技术方
案[期刊论文]
-
信息技术与标准化 2012(9)
发布者:admin,转转请注明出处:http://www.yc00.com/xitong/1715206050a2582271.html
评论列表(0条)