《四库全书》电子版工程与中文信息技术 |
| |
引用本文: | 张轴材.《四库全书》电子版工程与中文信息技术[J].电子出版,1999(4):3-6. |
| |
作者姓名: | 张轴材 |
| |
摘 要: | (续,接上期)(4)OCR识别速度,在PⅡ/266上,达到每秒22字。日前已经进行了两亿多汉字的识别。在工程中心,基本上是4台PⅡ/266档次的高档PC日夜运转。(5)针对OCR的后处理,专门开发了“校得快”软件(业已支持CJK+),采用多种信息和手段,让校对人员可以突破传统的模式:A.将原文字迹(图)与识别结果(编码汉字,文)一一对应,方便地进行图文对照、顺序浏览校对;B.按汉字聚类,非顺序式地阅览校对,便于发现问题;C.晚获其名内容、突出重点地扶对《最可能出错的文字);D.使用“L选跟随”,即将概率敕志的弟二候选…
|
关 键 词: | 电子版工程 中文信息技术 汉字识别 |
本文献已被 CNKI 维普 等数据库收录! |
|