2024年4月24日发(作者:移动为什么非要送你路由器)
Office在2003版中增加了Document Imaging工具,用它可以把文字给“抠”
出来。
打开传真图片,用抓图软件SnagIt对相关的内容进行抓取,然后在“文件”菜
单中选择“复制到剪贴板”命令(也可以用其他抓图软件,当然最简单的是
Windows中自带的Print Screen键来抓取整个屏幕,然后在“画图”程序中对
不要的部分进行裁剪并保存,然后复制)。
在“开始”菜单的“Microsoft Office工具”中打开
Microsoft Office Document Imaging,在左侧窗口中单击鼠
标右键,选择“粘贴页面”,把复制的图片粘贴---到
Document Imaging中,在“工具”中选择“使用OCR识别文
本”,Document Imaging的OCR识别程序就会对图片进行
识别,完成后选择“工具”中的“将文本发送到Word”,程序
会自动打开Word文档,展现在你面前的就是从图片中“抠”
出来的文字。
提示:一般而言,识别的准确率可以达到
别不是太好。
还有其他软件:
一、汉王
感觉比紫光好,可以识别表格,新版汉王5800,还没有装。
二、清华紫光
以前7.5用过很多次,基本还可以,文科类书籍识别还不错,新版紫光9.0,
应该有提高。
三、慧视小灵鼠
号称很厉害,用手机拍得都行。
四、尚书
有表格识别,大概很中庸,用的人不多。
五、丹青
能识别繁体
六、cajviewer 6.0
不是专用识别软件,内部应该是汉王的核心。
七、Microsoft Office Document Imaging
office2003中内含,2003装过一次,发现access到入数据不顺,就改回用
2000,还没有注意到,不知道对公式识别是否有相当的作用,想想和word结合
比较强,这是应该的。
95%以上,但对英文和数字的识
八、FineReader v7.0 Professional
据说很牛的英文识别软件,是俄国人搞的,天空软件有下,汉字也有,只是没
有地方下到。
九、ABBYY
e文识别。
十、TextBridge
e文识别
巧用Office 2003实现OCR文字输入
笔记本电脑不是刚装上Office 2003吗,里面的Microsoft Office Document
Imaging不错。它是一个光学字符识别(OCR)软件,可以用扫描仪扫入纸文档
中的汉字,用它,摘录文件的速度可快多了。
○操作准备
局里只有一台比较旧的F1210扫描仪,把它连接到笔记本电脑的并口,接
通电源以后安装扫描仪驱动程序。单击“开始”-->“所有程序”--
>“Microsoft Office工具”中的“Microsoft Office Document Imaging”,
将纸文档放入扫描仪,准备将其中的汉字输入Word。
○扫描设置
打开Microsoft Office Document Imaging窗口以后,单击工具栏中的
“扫描新文档”按钮,即可看到如图1所示的对话框。首先单击其中的“扫描
仪”按钮打开选择扫描仪对话框,查看当前扫描仪的型号是否在里面。如果对
话框或下拉列表中没有当前扫描仪,就要检查驱动程序安装和电源连接是否正
确。
接下来要根据文档的特点选择扫描预设。如果是彩色纸张上的黑色或彩色
文本,或者是白色纸张上的彩色文本,可以选择“将彩色页面扫描为黑白图片”
;对常见的白色纸张上的黑色文本而言,可以选择“黑白模式”或“灰度模式”
。
Microsoft Office Document Imaging提供的扫描预设功能可以满足大多
数文档的要求。如果文档使用的字体太小,或者由于纸张等缘故导致文字不太
清楚,就得适当调整扫描预设中的分辨率。用户只要选中要调整的某种扫描预
设,单击图1中的“预设选项”按钮打开菜单,选择其中的“编辑所选预设”,
就可以看到“预设选项”对话框的“常规”选项卡。单击其中的“高级”按钮
打开如图2所示的对话框,可将默认的分辨率(DPI)值由200修改为300。当
扫描文档中的文字是彩色或具有彩色背景时,选中图2中的“自动设置对比度,
保存为单色”,让扫描的图像具有较高的对比度,这样可以获得更好的文字识
别效果。
除此之外,“预设选项”对话框还有三个选项卡。其中“页面”选项卡设
置扫描仪的幅面,常见的A4扫描仪应该选择“A4”(默认);“输出”选项卡
可以设置扫描文件的保存位置,还可以设置扫描文件的命名方式,可以根据自
己的需要进行调整;“处理”选项卡控制OCR的工作设置,一般采用其中的默
认值就可以了。
○扫描文档
文档放入扫描仪以后,根据其特点选择图1中的某一个扫描预设方式,单
击“扫描”按钮开始扫描文档。与大多数OCR软件不同,Microsoft Office
Document Imaging扫描结束即开始文字识别,完成后即可在窗口中显示结果。
该窗口分为“缩略图窗格”和“页面窗格”左右两部分。如果用户连续扫
描了多页文档,缩略图窗格显示各页的缩略图,页面窗格显示当前文档的图像。
如果用户有多页文档需要扫描和识别,可以在一页扫描结束后再次扫描下
一页,完成后会弹出一个对话框。单击“继续”按钮可以放入下一页文档,继
续进行扫描,但不识别和保存当前文档;单击“完成”按钮则停止扫描,执行
识别并保存文件。再次扫描新文档时只要将它放入扫描仪,单击图1中的“扫
描”按钮即可;单击“取消”按钮会停止扫描,不进行识别也不保存文件。
建议把“换页提示”也勾选上,这样可以一次用扫描仪扫描完诺干张纸质文件,
然后统一识别转化成word文档,提高工作效率
小提示 Microsoft Office Document Imaging具有自动旋转功能,文档放
入扫描仪时无论位置正、倒都可以,软件在扫描过程中会自动识别并旋转到正
确的方位。
○获取文本
从表面上看,页面窗格显示的是文档图像。其实不然,被识别的文本已经
被隐藏在层中了(与文档图像分离)。我们可以采取两种方法获取该层中的文
本。
如果需要某页文档中的部分文字,只要按下工具栏中的“选择”按钮,拖
动光标选中页面窗格中需要的文本,单击鼠标右键选择快捷菜单中的“复制”,
就可以将这部分文本放入剪贴板,再粘贴到汇报文档中编辑了。如果单击工具
栏中的“将文本发送到Word”按钮,软件就会自动新建一个Word文档,将所
选中的识别文字放入其中。以上操作完成后,在页面窗格中的任意位置单击鼠
标,就可以取消已经选中的文本,再次获取其它位置的文本了。(页面中既有
文字又有图片,或者既有文字也有表格边框,识别效果可能会受到影响,建议
先选中文字,再识别)
当需要某页或几页文档中的所有文本时,可以直接打开工具栏中的“将文
本发送到Word”按钮,选择添加到Word的文本范围以及输出版式和保存位置。
完成后单击“确定”按钮,即可在指定位置自动保存一个htm文档。使用“文
件”菜单下的“另存为”命令,很容易将它转存为doc文档。
小提示Microsoft Office Document Imaging
这给小王的文档编辑工作带来了很多方便。
能保留原文档的段落结构,
后记:OCR软件的种类非常多,例如紫光、尚书、汉王等等。不过
Microsoft Office Document Imaging具有良好的易用性,并和Word 2003紧
密结合,大家不妨体验一下。
发布者:admin,转转请注明出处:http://www.yc00.com/xitong/1713968616a2354677.html
评论列表(0条)