首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 578 毫秒
1.
金鱼江  林浪  王春磊 《内江科技》2009,30(9):104-104,124
本文详细介绍了一款离线手写体汉字识别系统的设计过程,提出了如高宽比同投影相结合的切分算法、小波变换同双弹性网格相结合、基于关联规则的后处理等新的算法,一定程度上提高了系统的识别率。  相似文献   

2.
文中提出了两种联机手写笔画识别后处理的优化方案,第一种是基于回溯策略的后处理算法,通过回溯法修正误识的笔画;第二种称为多候选笔画组合算法。本文在基本识别手写笔画的基础上采用这两种后处理算法优化识别程序,实验结果表明,对笔画识别进行后处理大大提高了系统的识别率。  相似文献   

3.
科技俄语与其它语体的俄语不同,有着自己独特的词法特点.就这个问题,从词法范畴和词的形式的特点、语法意义的特点两个方面进行初步的探讨.  相似文献   

4.
许跃军 《情报科学》2008,26(6):866-871
主要论述基于Ontology(本体)的政府知识库的信息检索技术。该技术有别于传统的全文检索技术,采用基于本体的技术来分析处理用户提交的查询请求,分析自然语言形式问题中的词法、语法、语义等信息,识别出问题的类别,得到一些关键词,并进行扩展。还可根据本体中领域词汇的关系对关键词进行扩展,并赋予不同的权值。然后将问题类别和带权值的关键词序列提交给系统的检索引擎进行后继的处理。  相似文献   

5.
汉语自然语言检索中的词法分析处理   总被引:6,自引:0,他引:6  
耿骞  毛瑞 《情报科学》2004,22(4):466-469
本文对自然语言检索中的词法分析处理进行了探讨。首先讨论了基于词法分析的自然语言检索处理的类型,如加权统计法、N元法、统计学习方法,然后讨论了词法分析的方法和过程,重点对语词切分、词性标注的方法,并分析了相关的过程,特别是对基于概率统计的方法进行了介绍。最后对词法分析中存在的问题进行了探讨。  相似文献   

6.
不同的语言各有特点和形式,在词汇、语法惯用法、表达方式等方面有相同之处,也有相异之处,翻译过程是一个复杂的信息匹配、信息转换过程,语料库的应用对翻译信息的存储和再利用起了推动作用,利用语料库将译作中的文化负载词信息加以归类和管理,可使译者在翻译的效率和质量方面获益,本文重点阐述文化负载词英译过程中的释译和音译,并阐述语料库对文化负载词翻译信息存储的重要性。  相似文献   

7.
卢小平 《现代情报》2009,29(10):221-225
自动编制文摘不仅可以避免人工编制文摘的偏差,更能满足现代人对信息的快速获取需求。本文分析了自动文摘技术研究的进展,介绍了自动文摘的6种技术,即简单词频统计法、相对测度法、词组测度法、标题词法、特殊位置法和提示短语法,探讨了其存在的问题和未来的发展趋势。  相似文献   

8.
为了实现个性化的主动信息服务,网络信息挖掘(Web Mining)技术成为近年来一个新的研究课题。挖掘通常涉及输入文本的处理过程,中文分词是中文信息处理的基础,汉语文本基于单字,汉语的书面表达方式也是以汉字作为最小单位,词与词之间没有显性的分界标志,中文分词的准确与否,常常直接影响到对搜索结果的相关度排序,因此分词成为汉语文本分析处理中首要解决的问题。就中文分词技术进行讨论,并以2-gram模型为例,研究用JA-VA实现中文分词的过程。  相似文献   

9.
女书文字切分算法的设计与实现   总被引:1,自引:0,他引:1  
张振绘  刘赛 《中国科技信息》2010,(12):119-120,133
字符切分是影响文字识别的关键因素之一。在复杂背景下,字符的切分效果极大影响了识别的准确率。本文在处理复杂背景图像时采取了多种切分策略,从而提高了字符切分的准确率。在二值化中,采用了高效的大津法,实现全局动态二值化。然后对二值图像采用投影法进行粗切分,再利用连通域、改进的中点连线法进行曲线切分,以及改进的滴水算法进行粘连字符切分。实验结果表明,该方法有良好的切分效果,效率也相对较高。  相似文献   

10.
朱亚茹 《科教文汇》2008,(15):179-179
本文首先指出英语词典引入语法信息的必要性及现实意义;然后从词法方面分析了LDOCE4中的语法信息及其标注的优点与不足之处;以期吸取他山之玉的优点,编撰出一本真正具有中国特色适合中国人学习之用的英汉学习词典。  相似文献   

11.
一种基于词典的中文分词法的设计与实现   总被引:1,自引:0,他引:1  
中文分词就是把没有明显分隔标志的中文字串切分为词串,它是其他中文信息处理的基础,广泛应用于搜索引擎、自动翻译、语音合成、自动分类、自动摘要、自动校对等领域。就中文分词的基本方法作了简单阐述,并介绍了一种基于词典采用最大匹配法实现中文分词的方法。  相似文献   

12.
何喜军  马珊  武玉英 《情报科学》2018,36(11):95-100
【目的/意义】为应对线上技术供需信息超载导致的检索难、信息非结构化导致的供需文本匹配难的问题, 开展技术供需信息语义匹配研究。【方法/过程】构建技术领域本体,利用SAO结构分析提取技术供需信息中多维 语义结构特征,表征供给技术的创新特征及技术需求的问题特征。应用基于本体信息内容与语义距离相似算法, 结合词向量与熵值分析,提出技术供需多维语义结构匹配模型。【结果/结论】对线上新能源领域技术供需数据进行 测试,验证模型有效性,为提高技术供需主体信息检索效率、促进供需对接提供思路,并为考虑供需信息匹配的科 技主体推荐提供决策。  相似文献   

13.
单一掌纹特征难以全面描述手掌信息,导致识别率较低.为了提高识别率,提出了一种基于Gabor滤波的掌形、掌纹、关节融合手掌识别方法.首先对手掌图像进行预处理,然后提取手掌图像的特征,最后进行特征匹配.实验结果表明,融合多特征的方法是有效的.  相似文献   

14.
基于Lucene的信息检索的研究与应用   总被引:6,自引:0,他引:6  
快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。本文研究了Lucene和中文切分词技术,分析了Lucene的索引原理,实现了一个基于kene并支持中英文文档检索的应用实例。  相似文献   

15.
陈立华 《现代情报》2004,24(6):142-143
本文详细阐述了文献检索系统中自动标引技术的抽词词典、抽词算法及歧义切分等问题。  相似文献   

16.
基于词典的藏文自动分词系统中,紧缩格的识别较大程度上影响着切分效果。本文针对紧缩格的语法特点,在才智杰老师提出的利用紧缩格的添接规则还原藏文原文的还原法基础上,提出了识别末尾添接的字符"■"是否为再后加字,以提高识别紧缩格"■"的准确率;提出了切分紧缩格"■"后将对黏附紧缩格的藏字进行复原的算法,以避免切分中造成切分错误现象,提高了切分准确率。  相似文献   

17.
赵文娟  刘忠宝  郭慧 《情报科学》2019,37(5):108-114
【目的/意义】传统的信息检索技术主要是基于关键词匹配的信息推送,该方法容易出现漏检和误检的情 况。语义检索通过语义分析获得用户真正的检索意图,实现精准检索。【方法/过程】本文在对语义检索的原理和模 型进行描述的基础上,提出了基于本体概念树模型的词元扩展算法,通过对词元的语义相似性、语义相关性进行计 算,得出词元的语义关联度,关联度超过一定阈值的词元的集合即为扩展后的词元集。【结果/结论】该方法既考虑 了具有继承关系的词元间的语义相似性,也考虑了具有相同属性词元间的语义关联度,结论更具参考价值。  相似文献   

18.
杨静 《科技通报》2019,35(9):119-122,128
在音乐数字化领域中,音符信号承载着音乐中最重要的信息,当对音符信号进行切分识别时,音符信号的端点难以确定,无法实现精准的切分识别,为了满足音乐数字化的现实需求,提出一种基于三维时空域的音符信号切分识别方法。利用三维时空域对音符信号的端点进行判定,以音符信号的起止点作为切分点,实现对音符信号的切分;根据乐器和演唱者的声音创建HMM模型,采用维特比方法生成音符信号的时间序列;按照时间序列对HMM模型进行训练,通过训练结果实现对音符信号的切分和识别。分析仿真实验结果可知,所提方法不仅实现了音符的切分识别,并较好保存了音符信号所包含的信息。  相似文献   

19.
为了提高快递收发的效率和信息传达的实时性,该文介绍了无线射频识别技术,RFi D,及立体仓库相关技术,提出了基于R和二维码的快递公司收发平台架构,设计了基于无线射频技术的快递信息传递体系。与基于一维码的系统相比,采用无线射频识别的系统具有数据采集过程更加自动化,采集速度更快,识别率更高的优点。  相似文献   

20.
基于词频的中文文本分类研究   总被引:1,自引:0,他引:1  
姚兴山 《现代情报》2009,29(2):179-181
本文对中文文本分类系统的设计和实现进行了阐述,对分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细的介绍。将基于词频统计的方法应用于文本分类。并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,在无词表的情况下,通过统计构造单字和二字词表,对文本进行分类,并取得不错的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号