首页 | 本学科首页   官方微博 | 高级检索  
     检索      

《四库全书》电子版工程与中文信息技术
引用本文:张轴材.《四库全书》电子版工程与中文信息技术[J].电子出版,1999(4):3-6.
作者姓名:张轴材
摘    要:(续,接上期)(4)OCR识别速度,在PⅡ/266上,达到每秒22字。日前已经进行了两亿多汉字的识别。在工程中心,基本上是4台PⅡ/266档次的高档PC日夜运转。(5)针对OCR的后处理,专门开发了“校得快”软件(业已支持CJK+),采用多种信息和手段,让校对人员可以突破传统的模式:A.将原文字迹(图)与识别结果(编码汉字,文)一一对应,方便地进行图文对照、顺序浏览校对;B.按汉字聚类,非顺序式地阅览校对,便于发现问题;C.晚获其名内容、突出重点地扶对《最可能出错的文字);D.使用“L选跟随”,即将概率敕志的弟二候选…

关 键 词:电子版工程  中文信息技术  汉字识别
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号