2024年3月4日发(作者:安卓应用市场哪个好)
用TH-OCR识别藏文教程:
1. 用 Adobe Acrobat Pro 将PDF文件转换为JPG格式。
2. 藏文印刷体识别软件
打开TH-OCR 藏文识别软件,新建工程,工程缺省字体选择“藏文”(这一步很重要不然OCR会出错)。
藏文显示字体的设置:
同文藏文输入法下载地址:/html_2/1/77/id=9265&pn=
请将文件""和""复制到C:WINDOWSFonts目录下;并在命令设置后编改字体,设置为字体。即可显示出藏文。
3. 导入JPG,从工具栏的文件/向工程中插入/图象页/
jpg文件导入后,按F2,软件自动OCR,生成TXT文件。
4. /s/
用通用藏文转码软件,对TH-OCR生成的TXT文件转码。源编码:同元,转码:UniCode。(注:微软的Microsoft Himalayan字体为UniCode ,win7以上的系统是自带字体,xp系统需下载安装。安装字体步骤见前面的同元字体安装)
/f/?from=like
转码的优酷视频教学:/v_show/id_
5.用word,打开转UniCode后的文件。
6.根据原始PDF文件,校对纠正乱码。此教程根据格鲁论坛笨者之帚/bbs/?mod=viewthread&tid=29810&extra=page%3D4
及 small2 的 帖 子/?mod=viewthread&tid=29792&extra=&page=3
整理而成,再次感恩!
发布者:admin,转转请注明出处:http://www.yc00.com/xitong/1709542702a1635717.html
评论列表(0条)