首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
中文OCR与图书资料的再制作   总被引:2,自引:0,他引:2  
中文OCR是目前一项行之有效的方式,本文介绍了国内几个优秀的OCR系统,分析其功能特征,希望能对图书馆的数字化工作有所帮助。同时,针对数字图书馆建设的新要求,对今后中文OCR系统提出了几点改进意见。  相似文献   

2.
中文OCR与图书资料的再制作   总被引:2,自引:0,他引:2  
图书馆图书期刊的数字化处理是数字图书馆建设的一项重要工作,采用何种方式数字化堆积如山的馆藏资料需要考虑各方面的因素。中文OCR是目前一项行之有效的方式,本文介绍了国内几个优秀的OCR系统,分析其功能特征,希望能对图书馆的数字化工作有所帮助。同时,针对数字图书馆建设的新要求,对今后中文OCR系统提出了几点改进意见。  相似文献   

3.
图书资料的数字化处理是建设“数字图书馆”的一项重要工作,全息数字化处理技术解决了制约国内数字图书馆建设中的瓶颈问题。本对其产生背景及含义、系统组成及功能、技术特点及应用作了详尽介绍,希望会对图书馆的数字化进程有所帮助。  相似文献   

4.
中文古籍数字化的再思考   总被引:11,自引:0,他引:11  
古籍数字化工作需要将"古籍"的特点与数字技术及现代信息技术的特点相结合.本文从汉字的处理、文本的校勘、内容的整合等方面对古籍数字化工作中的重点和难点问题进行探讨.  相似文献   

5.
档案数字化过程中OCR技术的应用   总被引:1,自引:0,他引:1  
简单介绍档案数字化过程中的OCR技术,分析该技术的优势和在档案数字化工作中的独特应用,如,创新著录标引方式;实现真正的全文检索;支持双层PDF技术;拓宽档案用户利用面等.在此基础上,从OCR软件选择、参数设置、图像处理、人工校对等方面探讨提高OCR识别率的各种方法,以期使从事档案数字化工作的人员有所借鉴,提高档案数字化...  相似文献   

6.
中文OCR技术最新进展(续)丁晓青,郭繁夏清华大学电子工程系提高汉字识别率的新技术汉字识别最为重要、最为根本的指标是识别的正确率,人们研究的主要目标也都集中在如何提高汉字的识别率、降低误识率上。汉字文本的识别率主要决定于单个文字图象切分的正确和对单个...  相似文献   

7.
中文图书全面数字化的尝试   总被引:2,自引:1,他引:2  
介绍了北京化工大学图书馆在中文电子图书资源建设方面所进行的尝试和探索,对其开展的中文图书数字化工程的意义、实施过程、效益进行了阐述,并从资源整合、版权问题、硬件投入、采访策略等几个方面总结经验。  相似文献   

8.
9.
基于英国国家图书馆的Reshelp和Burney两个古旧英文报纸数字化项目,作者对文本型数字图像的OCR识别的准确度进行测试实验,结果显示整体准确度不高,且从高到低依次为字符、单词、重要单词、大写字母开头的重要单词。然后,将OCR识别周期划分为数字扫描对象的获取、数字图像的生产、数字图像的处理和文本识别等四个阶段,分析每个阶段影响准确度的因素,探讨提高准确度的具体措施。  相似文献   

10.
OCR技术在数字图书馆文档加工中的应用   总被引:3,自引:0,他引:3  
OCR技术是实现图书馆文献资源数字化基础建设的先进技术和重要手段。它可以对海量信息资源进行加工、存储、检索、传输和利用。在数字图书馆文档加工过程中应用OCR技术 ,可以快捷、准确、高效地实现文献资源数字化。  相似文献   

11.
OCR文字识别与图文库检索技术初探   总被引:1,自引:0,他引:1  
介绍献的OCR识别,并对图库检索技术作了初步探讨。  相似文献   

12.
如何有效的进行生物医学文献检索和信息挖掘,是计算机技术和生物信息技术研究领域中的一个经典课题。本文对生物医学文献中自然语言问题文档,片段,概念和RDF三元组,构建了高效的检索和问答系统。特别的,在文档检索中,我们搭建了基于顺序依赖模型,词向量,和伪相关反馈相结合的通用检索模型;同时,前k个文档被分离为句子和片段,并以此建立检索索引,并基于文档检索模型,完成片段检索;在概念挖掘中,提取生物医学的概念,列出相关的概念属于网络服务的五个数据库链接,通过得分排名得到最终的概念。在CLEF BioASQ几年的评测数据上,我们构造的检索系统都取得了不错的性能。  相似文献   

13.
试论中国少数民族的非纸本文献载体   总被引:1,自引:0,他引:1  
本文重点叙述了非纸本少数民族文献的种类及其特点。通过对“结绳记事”与“刻木记事”、贝叶文献、皮书、碑碣石刻、金属铭文的等非纸本文献载体的分析,引发对人与大自然关系的反思,从而唤起人们对于自然的关爱,为人类自身长久发展计,给当前的人类改造自然活动提出新的思路。  相似文献   

14.
王金夫 《图书情报工作》2005,49(10):107-110
鉴于在文献形态上,地方文献与特定地方空间所形成的档案在属性上有诸多类似之处,在满足地方区域性基础信息的需求方面,则具有共同的文献基本特征,借鉴采集、整理、鉴定、编研等原本属于档案工作领域的程序化方法,论述这些方法在地方文献资源建设中的具体应用,指出其对拓展图书情报部门的地方文献工作具有重要意义。  相似文献   

15.
王雪梅  刘莉  黄碧云 《情报工程》2016,2(1):008-014
目的:通过对国内有关硒与癌症发生的相关文献进行循证医学评价来了解目前相关文献的质量现状.方法:在生物医学文献数据库中以"硒"和"癌症"为主题词检索建库至2014年6月的相关文献,对检出的文献进行筛选后,利用九级证据评价标准及M量表对所纳入的文献进行评价.结果:九级评价标准:纳入的376篇文献中系统评价/Meta分析的文献为0篇,随机对照试验(RCT)文献33篇,其他343篇.M量表:33篇RCT文献评价结果中4分的文献有3篇,未见大于4分的文献.结论:九级评价结果:目前国内有关硒与癌症关系的研究中,动物研究和体外研究占多数,RCT研究相对较少,系统评价/Meta分析文献未见.M量表评价结果:目前国内有关硒与癌症发生相关文献的质量整体水平不高,在实验研究设计中存在很多问题,有待进一步提高.高质量证据的研究表明硒具有防癌治癌的作用,硒制剂能够增强一些化疗药物的疗效,并且减少化疗或放疗对人体产生的副作用.  相似文献   

16.
中国古代体育文献述论   总被引:1,自引:0,他引:1  
袁红军 《图书情报工作》2009,53(19):142-146
The paper traces back the evolution of sports literature, analyses its value,and points out that ancient sports literature is not only the necessary materials for researching the history of our civilization, but also the precious text carrier promote today’s economic and cultural development.   相似文献   

17.
Arabic documents that are available only in print continue to be ubiquitous and they can be scanned and subsequently OCR’ed to ease their retrieval. This paper explores the effect of context-based OCR correction on the effectiveness of retrieving Arabic OCR documents using different index terms. Different OCR correction techniques based on language modeling with different correction abilities were tested on real OCR and synthetic OCR degradation. Results show that the reduction of word error rates needs to pass a certain limit to get a noticeable effect on retrieval. If only moderate error reduction is available, then using short character n-gram for retrieval without error correction is not a bad strategy. Word-based correction in conjunction with language modeling had a statistically significant impact on retrieval even for character 3-grams, which are known to be among the best index terms for OCR degraded Arabic text. Further, using a sufficiently large language model for correction can minimize the need for morphologically sensitive error correction.
Kareem DarwishEmail:
  相似文献   

18.
本文论述了江苏区域图书文献联合采编中心的现状和发展过程,对图书文献联合采编中心的发展方向作了深入探讨.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号