首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
描述了汉语自动分词中切分歧义的发现和歧义字段的消除,给出了基于词典的汉语词自动切分和基于统计的词类与词性歧义消除的模型和实现方法.  相似文献   

2.
文章对组合歧义消歧方法进行了深入的分析与研究,先概述了组合歧义的分布和特点,然后对现有的方法进行了分析,最后借鉴各种方法,提出决策表加学习的消歧算法。  相似文献   

3.
古汉语自动分词技术是实现古汉语文本深度处理的重要前提。经过多年探索,该领域已有了实质性进展。但是古汉语自动分词仍然面临一些关键问题:分词粒度界定、歧义消解和未登录词处理等。通过对基于词典和统计、机器学习序列标注以及深度神经网络模型等自动分词方法研究现状的梳理,指明充分利用深度学习技术是古汉语自动分词的未来发展趋势,并对古汉语自动分词的探索提出了三个方面的展望:扩充古汉语分词语料数据量、构建适应不同文本领域的分词模型、开发一体化模型。  相似文献   

4.
“N就是N”不是歧义格式,而是歧义字段。“N就是N”的两种切分结果的区别表现在格式意义不同、语表形式不同、转换方式不同、出现频率不同。因此,可以利用句法信息、语境知识、出现频率等来对此作出正确的切分。  相似文献   

5.
自动分词是中文信息处理的基本工作 ,在诸多重要领域如篇章理解、机器翻译、文本检索、文本的语音输入输出、文本校对、自动标引等领域都得到广泛的应用。本文介绍了在输入法测试系统中的自动分词的应用 ,提出了必须采用适当的分词方法配合应用系统需求的思路  相似文献   

6.
中文信息处理分词过程中对歧义切分字段和未登录词的识别问题一直困扰着我们,至今仍然没有很好的解决方案。笔者认为问题产生的根本原因在于源头上没有识别的标识,就此本文提出了CCSS(Case of Chinese Segmentation Solution)方案,寻求建立一套文本编辑软件及与之兼容的智能系统,将自动分词与人工分词相结合,在文本编辑阶段彻底解决汉语分词问题。  相似文献   

7.
在分析现有几种中文自动分词算法的优劣且能实现优势互补的基础上,提出一种多种方法融合的中文自动分词算法.利用Visual-Prolog开发基于该算法的自动分词系统,并探讨了开发过程的关键技术.实验表明,采用所述算法和技术的自动分词系统的准确率较高、分词速度较快.  相似文献   

8.
随着Internet的发展,数字化、信息化迅速增加,人们对中文信息也越来越关注,随之而来计算机自动分词的处理能力变成现代汉语信息处理的重要组成部分。衡量一个分词算法的优劣主要在于分词的正确率和速度。其中,分词的正确率尤蠢度要。我们认为歧义切分问题成为影响分词正确率的主要因素之一。  相似文献   

9.
陈丽江 《文教资料》2006,18(23):99-100
在汉语的自动分词过程中,组合型歧义和分词不一致常常交织在一起,严重影响了切分结果的质量。本文试通过对熟语料库中“v a”和“m q”结构类型的二字词进行分类,每一类确定不同的方法来消解组合型歧义,以保证分词过程中的一致性。  相似文献   

10.
文章以汉语中一个特殊的语言现象——含“交集歧义”语段的非歧义句作为切入口,考察了分词加工在留学生句子阅读过程中不同的理解。文章指出,留学生主要靠词语的熟悉度以及与心理词汇的匹配程度来激活句子的分词加工;语段前的提示信息对分词的启动效应不明显;合词连写对句子理解的干扰性很大,是理解错误的主要原因。因此,适当增加分词连写的材料,有助于留学生理解句子,同时巩固和建构词的结构和界限,为阅读合词连写材料打下基础。  相似文献   

11.
语言中的“同位”不等于“复指” ,“复指”也不等于“同位” ,只有既“同位”又“复指”的短语 ,才可称为“同位短语”或“复指短语”。在短语结构类型中应定名为“同位短语”。  相似文献   

12.
维吾尔语构词法是维吾尔语词汇学的重要组成部分,也是维吾尔语研究的一个重要组成部分。随着社会的变革和发展、新事物的不断涌现,维吾尔语的新词术语能否满足时代发展的要求,成为亟待解决的问题,我们更应该重视维吾尔语构词法的研究。本文主要分析了维吾尔语新词产生过程中运用的一些构词方法。  相似文献   

13.
比况短语论析   总被引:1,自引:0,他引:1  
关于比况短语的功能,传统的看法是“具有比况作用“,本文具体分析了比况短语的结构类型和语义类型,归纳出比况短语具有比喻性、比拟性、相似性以及测定性4种功能.  相似文献   

14.
李华 《保定师专学报》2001,14(3):104-104,110
英语名词短语结构中可以包含多个修饰语和中心词,结构关系具有可变性、不确定性,因而极易产生歧义。对歧义结构的分析有助于准确理解英文。  相似文献   

15.
模糊综合评判作为模糊数学的一种具体应用方法 ,在实践中得到了广泛的应用。本文根据模糊综合评判 (模型M(∨ ,∧ )的数学原理 ,设计并实现了此方法的FoxBASE+ 应用程序 ,并讨论了模型M (∨ ,∧ )的特点及应用范围。  相似文献   

16.
动补结构是现代汉语中特殊结构类型的动词短语,其补语部分语义指向的多样性引起众多学者的关注。徐通锵、黄正德分别从不同的语法理论体系出发,对其进行了进一步的分析。通过对两者研究的对比分析可以发现:虽然两者理论基础不同,但是研究的切入点是一致的,即对于动词的语义分析,印证了语义对于不同语法理论体系均具有重要的研究价值。当然,不同语法理论体系进行语义分析的具体方法各有特色,体现了各自不同的研究思路。  相似文献   

17.
针对汉语动宾短语和连动短语的辨识问题立论,结合汉语教学中难以界定的实例,将其相关的纠葛问题逐一阐释,剖析了若干彼此难分的情形,特别是对于那些处于中介状态的语法现象,给予了理性的界定。  相似文献   

18.
教育技术领域术语提取研究   总被引:3,自引:0,他引:3  
近年来,在教育技术领域陆续开展了多项元研究工作,这些研究的一个共同特点就是人工建立一个分类体系,然后将研究样本纳入这些分类体系,这其实就是一个文本分类过程。目前,自然语言处理领域已有较为成熟的文本自动分类技术。但是已有的研究中却没有采用该技术。这与当前缺乏教育技术领域术语词典也有关系。文章以远程教育领域为例,以《开放教育研究》杂志2002年至2006年五年的题录信息为样本,在总结教育技术领域部分术语构成规则的基础上,研制出一种规则和统计相结合的算法来提取术语。测试结果表明,本算法术语识别的准确率为66.7%,召回率为76.7%,与现有的一些术语提取算法结果相近,可以较好的帮助研究者完成术语提取工作,并为及时发现教育技术领域的新术语带来可能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号