共查询到20条相似文献,搜索用时 15 毫秒
1.
随着计算机网络的飞速发展,信息电子化已经成为一个时代必然趋势,OCR技术可以实现对文本资料进行扫描,进而对图像文件进行分析处理,获取文字及版面相关信息,本文介绍了OCR的发展及应用现状,并对OCR技术的应用前景进行了前瞻。 相似文献
2.
3.
复杂背景下的OCR技术涉及的图象处理与模式识别技术较通用的OCR技术更为复杂。由于图像中的文字通常叠加在复杂的图像背景之上,背景成分的干扰使得现有的OCR技术难以识别出文字。本文对垃圾邮件中的图片进行实验的基础上,对复杂背景下的文本提取技术进行了研究,提出了基于灰度分级的新文本提取方法,有效实现文本字符特征的提取和切分。本文提出的方法可直接对复杂背景图象进行文本提取,并在此基础上实现对目标文本的切分。 相似文献
4.
目前国内的女书文字大多采用手写的方式保存。介绍了女书OCR技术,讨论了女书OCR的整体流程,具体包括二值化,文字分割,特征提取和文字识别等方法,最终实现了对手写女书文字的识别和存储。 相似文献
5.
专利文献代码化对于专利无纸化审查、专利分析、专利检索和专利管理都非常重要.本文提出一种以专利文献OCR校对词典和技术领域特征为基础,利用中文分词、隐马尔科夫模型为方法的专利文献OCR校对框架和专利文献OCR中文文本的拼写校对方法,降低了人力成本投入,提高了专利文献代码化效率和代码化质量.本文最后给出了实验系统和实现结果. 相似文献
6.
论述了数字图书馆时代图书馆员应具备的素质和技能:元数据、标识语言、RAID技术、OCR技术、数据库技术、用户界面设计技术、网络技术和项目管理等。 相似文献
7.
8.
现在网上发布的资料信息都是以CAJ、PDF等文件格式提供的,其中的文本不能直接编辑.文章就这一问题的解决,对OCR识别技术提取全文本的方法进行了介绍. 相似文献
9.
10.
通过实验,从识别率、支持识别的图像文件格式、支持识别的字符属性、支持输出的文件格式、用户界面友好性、图像预处理功能和用户自学习功能等方面,对2款常用中文OCR软件的性能进行对比分析,针对性地提出了7条提高OCR软件性能的具体措施。 相似文献
11.
为了对标准的印刷体进行快速准确的识别,本文应用Office中自带的MODI组件进行OCR程序的开发。经过实验,它的处理速度和识别率都令人满意,应用MODI可以简化OCR程序的开发,如果能对图像文件进行先期处理,则可以得到更高的识别率。 相似文献
12.
针对目前OCR技术在后处理阶段多采用基于词的匹配技术而无法识别单字词的问题,提出了一种基于NLP的后处理技术。该技术通过采用词法切分法和语法匹配法,能够有效地利用上下文的语法语义信息。其中词法切分法采用的是中科院计算所提供的汉语分词技术,语法切分法以北大的《现代汉语语法信息词典》为基础。实验结果表明,采用该技术能大大提高句子中的单字词识别率,从而提高全文的整体识别率。 相似文献
13.
随着计算机技术的应用普及,互联网的长足发展,大批历史文献资料开发应用的需求不断增长。文献资料的扫描(图形文件)应用,为广大读者提供了更多、更丰富,有价值的文献资料。图形文件保留了原文件的风貌,但其占用空间大,不可检索,在编辑、修改、加工等方面显露了不足。而OCR技术的成熟应用,则弥补了这一领域的不足。 相似文献
14.
基于DEA的陕西经济发展研究 总被引:1,自引:0,他引:1
运用OCR模型对陕西省13个市区的经济发展进行实证分析,定量揭示不同城市投入产出的效率差异,反映陕西区域经济发展不平衡的现状.根据模型技术效率、规模效率和冗余情况,分析非DEA有效四个市区的原因并提出对策,将不同地区经济发展的效率进行比较和排序,为制定陕西经济发展政策提供依据. 相似文献
15.
16.
17.
目的:依托委办公内网平台,搭建一套符合国家和自治区档案标准和规范的档案管理信息平台,实现档案管理规范化、信息化、档案借阅和查询网络化,全面提高广西发改委档案管理水平。方法:充分利用计算机网络技术、信息处理技术、OCR识别技术、压缩存储技术等先进技术,实现各类档案资料的海量存储、全面管理和综合利用。结果:系统具有收发文管理、归档管理、统计查询、查阅利用、系统管理等主要功能模块,满足发改委档案管理工作当前和未来发展的需要。结论:符合现代档案管理发展方向,是具有发改委特色的档案工作体系,全面提升了发改委的档案管理和利用水平。 相似文献
18.
本文把读者在查询网上信息时,经常遇到的一些网络名词术语,如浏览器、像素、OCR、abc、扩展名等逐一解剖,以其对读者有所借鉴。 相似文献
19.