用TH-OCR识别藏文教程

用TH-OCR识别藏文教程


2024年3月4日发(作者:安卓应用市场哪个好)

用TH-OCR识别藏文教程:

1. 用 Adobe Acrobat Pro 将PDF文件转换为JPG格式。

2. 藏文印刷体识别软件

打开TH-OCR 藏文识别软件,新建工程,工程缺省字体选择“藏文”(这一步很重要不然OCR会出错)。

藏文显示字体的设置:

同文藏文输入法下载地址:/html_2/1/77/id=9265&pn=

请将文件""和""复制到C:WINDOWSFonts目录下;并在命令设置后编改字体,设置为字体。即可显示出藏文。

3. 导入JPG,从工具栏的文件/向工程中插入/图象页/

jpg文件导入后,按F2,软件自动OCR,生成TXT文件。

4. /s/

用通用藏文转码软件,对TH-OCR生成的TXT文件转码。源编码:同元,转码:UniCode。(注:微软的Microsoft Himalayan字体为UniCode ,win7以上的系统是自带字体,xp系统需下载安装。安装字体步骤见前面的同元字体安装)

/f/?from=like

转码的优酷视频教学:/v_show/id_

5.用word,打开转UniCode后的文件。

6.根据原始PDF文件,校对纠正乱码。此教程根据格鲁论坛笨者之帚/bbs/?mod=viewthread&tid=29810&extra=page%3D4

及 small2 的 帖 子/?mod=viewthread&tid=29792&extra=&page=3

整理而成,再次感恩!


发布者:admin,转转请注明出处:http://www.yc00.com/xitong/1709542702a1635717.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信