首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
词性标注问题一直是计算语言学中的一个难点问题,对于一些词类的标注标准和方法,至今仍未统一,如兼类词、区别词,这给进一步的句法分析和语料库的共享带来了很大困难,甚至有时候会造成资源的浪费。本着实用的目的,在参考各家标注策略的基础上,本文对兼类词、区别词和状态词的标注给出了统一的标注策略。  相似文献   

2.
对外汉语教材词性标注问题研究   总被引:1,自引:0,他引:1  
本文考察了发展汉语系列教材中的7部,指出了对外汉语教材词性标注的几个要注意的问题,以求教材词性标注更加科学化。  相似文献   

3.
笔者基于条件随机场(Conditional Random Field,CRF)和支持向量机(Support Vector Machine,SVM)模型,通过增加上下文、附加成分和蒙古文字母等特征,对蒙古文句长为8到25的将近4万个句子进行了词性标注的研究。研究表明,CRF模型和SVM模型在标注蒙古文词性方面都有比较好的结果,其中在考虑上下文和特征"连写的构形附加成分"的情况下,SVM模型标注蒙古文词性的准确率可以达到99%以上。  相似文献   

4.
汉语词与英语词不同,致使汉语词典词性及功能标注显得没那么迫切,而且,即使标注也不可能与英语模式一样。尽管如此,词性及功能标注还应继续尝试,它毕竟可以给学习者带来诸多方便。  相似文献   

5.
本文提出了一种基于条件随机场模型的汉语词性标注方法。该方法能够充分利用词的上下文信息作为特征。实验表明,该方法的标注效果明显优于基于隐马尔可夫模型和最大熵马尔科夫模型的方法。  相似文献   

6.
从现代汉语语文词典“词性标注”问题入手,以《现代汉语词典》和《现代汉语规范词典》的标注结果为主要研究对象,重点选取个别特殊成分讨论。主要探讨两个问题:一是词性标注的单位;一是“们”和“者”如何定性。标注词性首先要辨别词与非词。意义整体性和成分黏着性是词的两大显著特征。在现行的汉语语法体系框架内,“们”宜区分为词缀“们”和助词“们,”从而更全面地描写“们”的特点。“者”宜区分为词缀“者”和助词“者”。其中,“者”的助词用法仅在仿古语体中出现。  相似文献   

7.
词性标注是语言研究者进行句法分析和其他研究的基础,其划分是否得当直接影响着语料库的下一步建设。本文从句法分析实际操作的角度对国内几个常用分词系统的词性标记问题进行了对比分析,着重探讨了其中一些标记给句法标注带来的问题,如习用语和简称、前接成分和后接成分。针对这些问题,本文从实用的角度,在参考多方建议的基础上,提出了相应的标注策略。  相似文献   

8.
词性标注是中文信息处理领域中的一个重要研究课题。本文首先介绍了隐马尔科夫模型的表示形式和需要解决的问题,然后论述了HMM模型参数估计的方法,并对运用Viterbi算法进行词性标注的基本原理进行了深入的研究。  相似文献   

9.
本文通过对十部对外汉语教材中生词词性标注现状展开分析考察,分析了现行教材进行词性标注的特点和做法,指出教材在词性标注方面存在的问题,如词性标注存在错误、词性标注的依据不明确等问题,讨论了特殊类别词汇的词性标注问题,如离合词、兼类词、属性词等如何标注词性以及词语和语言构式是否需要标注词性.最后提出了建立词性标注体系、优选标注语言符号等词性标注的原则和建议.  相似文献   

10.
在利用条件随机场(CRFs)进行汉语词性标注时,特征模板的选取是非常重要的一个环节,本文设计了两组特征模板,选取Bakeofl2007的CTB、NCC、PKU三种语料,使用CRF+ +0.53工具包进行了对比实验,定量分析了影响词性标注的模板参数.通过实验得出以下结论:(1)词性标注的准确率与特征窗口大小不成正比,上文对当前词的词性的影响比下文要大,当前词的词性与其紧邻的前后两个词关系紧密;(2)产生的特征数多的模板训练较难进行;(3)词性转移特征对准确率有一定的影响.  相似文献   

11.
水稻T-DNA插入突变技术研究   总被引:1,自引:0,他引:1  
随着水稻基因组全序列的测定完成,功能基因组学已成为重点研究内容.农杆菌介导的T-DNA标签法是近年发展起来的一种有效的分子生物学技术.它具有程序简便,转化效率高,大规模转化等特点.阐述了T-DNA标签法及其改进后的激活标签技术和增强子技术的特点,并介绍了T-DNA插入突变在水稻突变体库的建立中所取得的研究进展,从而表明T-DNA插入突变技术是水稻功能基因组研究的一个有效途径.  相似文献   

12.
词性自动标注是对语料在高层次上进行分析的一个重要组成部分,其结果可以用于很多自然语言处理应用程序当中。而维吾尔语和其它语言一样也存在词兼类现象。本文介绍了维吾尔语词性自动标注系统的设计思想和实现过程。该系统基于隐马尔科夫模型,采用Viterbi算法来进行词性自动标注。  相似文献   

13.
蒙古语助动词的判别涉及蒙古语词法、句法和语义问题,是蒙古语语法学较难的研究课题之一。作者对助动词在真实文本中的分布特征进行分析,描述与助动词共现词语的形态变化、词类等特征,归纳蒙古语23条常用助动词的判别规则。在此基础上,研制助动词标注软件,对现代蒙古语语料库进行标注,分析标注错误例子,改进了助动词标注软件。再测试表明,改进后的规则可以准确判别100万词级现代蒙古语语料库的绝大多数助动词。  相似文献   

14.
初等统计思想的传播主要是靠中学统计数学教学实现的 ,本文对中、英、日三国的部分高中数学教材中的统计数学部分作了比较。  相似文献   

15.
资本预算净现值法则和内含收益率法则比较分析   总被引:1,自引:0,他引:1  
作为资本预算的主要技术方法,净现值(NPV)法则和内含收益率(IRR)法则在对一些项目的评估中常常出现矛盾,净现值(NPV)法则存在着许多局限性。  相似文献   

16.
本文是有关案例教学法对《概率论与数理统计》教学提升作用的研究,列举了三个应用在教学中案例,讨论了案例与相应知识点结合的问题,为改善《概率论与数理统计》的教学效果作了一些教学创新。  相似文献   

17.
对当前的基于领域本体的语义标注方法进行了说明和分析,提出了基于领域本体概念划分的语义标注方法.该方法将领域本体中的概念分为特有概念和普通概念,先用一般的领域本体标注算法计算特征词的权值,再对普通概念特征词的权值进行调整,最后结合水稻领域进行试验.实验表明,该方法在保证查全率的基础上,提高了普通概念特征词的查准率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号