首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汉语词与英语词不同,致使汉语词典词性及功能标注显得没那么迫切,而且,即使标注也不可能与英语模式一样。尽管如此,词性及功能标注还应继续尝试,它毕竟可以给学习者带来诸多方便。  相似文献   

2.
给语文词典标注词性应根据词典的规模、义项归并的粗细确立相应的词类系统,标准要具体简单具有操作性,词性与释义、配例尽量协调一致,妥善处理兼类词及照顾不同层面。  相似文献   

3.
对外汉语教材词性标注问题研究   总被引:1,自引:0,他引:1  
本文考察了发展汉语系列教材中的7部,指出了对外汉语教材词性标注的几个要注意的问题,以求教材词性标注更加科学化。  相似文献   

4.
2005年6月出版的《现代汉语词典》第5版在继承前版的基础上,增加了词性标注,给汉语学习和汉语教学带来了极大的方便。但是,也存在一些值得商榷的问题:一、"标注词类"之说尚需斟酌;二、词类设置及划分值得商榷;三、标注体例有待规范。  相似文献   

5.
本文通过对十部对外汉语教材中生词词性标注现状展开分析考察,分析了现行教材进行词性标注的特点和做法,指出教材在词性标注方面存在的问题,如词性标注存在错误、词性标注的依据不明确等问题,讨论了特殊类别词汇的词性标注问题,如离合词、兼类词、属性词等如何标注词性以及词语和语言构式是否需要标注词性.最后提出了建立词性标注体系、优选标注语言符号等词性标注的原则和建议.  相似文献   

6.
李海波 《现代语文》2010,(7):117-118
本文在对《老屋窗口》一文进行手工分词和词性标注的基础上,归纳总结了手工分词和词性标注存在的问题,为中文信息处理中的分词与词性标注提供一定的参考价值。  相似文献   

7.
笔者基于条件随机场(Conditional Random Field,CRF)和支持向量机(Support Vector Machine,SVM)模型,通过增加上下文、附加成分和蒙古文字母等特征,对蒙古文句长为8到25的将近4万个句子进行了词性标注的研究。研究表明,CRF模型和SVM模型在标注蒙古文词性方面都有比较好的结果,其中在考虑上下文和特征"连写的构形附加成分"的情况下,SVM模型标注蒙古文词性的准确率可以达到99%以上。  相似文献   

8.
从现代汉语语文词典“词性标注”问题入手,以《现代汉语词典》和《现代汉语规范词典》的标注结果为主要研究对象,重点选取个别特殊成分讨论。主要探讨两个问题:一是词性标注的单位;一是“们”和“者”如何定性。标注词性首先要辨别词与非词。意义整体性和成分黏着性是词的两大显著特征。在现行的汉语语法体系框架内,“们”宜区分为词缀“们”和助词“们,”从而更全面地描写“们”的特点。“者”宜区分为词缀“者”和助词“者”。其中,“者”的助词用法仅在仿古语体中出现。  相似文献   

9.
词性标注是语言研究者进行句法分析和其他研究的基础,其划分是否得当直接影响着语料库的下一步建设。本文从句法分析实际操作的角度对国内几个常用分词系统的词性标记问题进行了对比分析,着重探讨了其中一些标记给句法标注带来的问题,如习用语和简称、前接成分和后接成分。针对这些问题,本文从实用的角度,在参考多方建议的基础上,提出了相应的标注策略。  相似文献   

10.
词性标注是中文信息处理领域中的一个重要研究课题。本文首先介绍了隐马尔科夫模型的表示形式和需要解决的问题,然后论述了HMM模型参数估计的方法,并对运用Viterbi算法进行词性标注的基本原理进行了深入的研究。  相似文献   

11.
在利用条件随机场(CRFs)进行汉语词性标注时,特征模板的选取是非常重要的一个环节,本文设计了两组特征模板,选取Bakeofl2007的CTB、NCC、PKU三种语料,使用CRF+ +0.53工具包进行了对比实验,定量分析了影响词性标注的模板参数.通过实验得出以下结论:(1)词性标注的准确率与特征窗口大小不成正比,上文对当前词的词性的影响比下文要大,当前词的词性与其紧邻的前后两个词关系紧密;(2)产生的特征数多的模板训练较难进行;(3)词性转移特征对准确率有一定的影响.  相似文献   

12.
对机器自动词性标注技术领域的三类主要理论方法(基于规则的方法、基于统计的方法和规则与统计相结合的方法)进行了研究分析和优缺点的对比,并在描述方式、标注依据、机器效率、鲁棒性、标注正确率和实用性等方面,对这三类方法进行认真的比较。比较结果显示规则与统计相结合的方法在各方面都占有较明显的优势,是目前最理想的标注方法。基于此类方法的自动词性标注技术可以较好地满足实际应用的要求。此外,本文还指出这类方法有待解决的三大难题。  相似文献   

13.
目前在汉语语文辞书释义方式上,由于将相对问题绝对化而形成两个“误区”:一是释词用语与被释词语词性一致要求上的“误区”;二是释义中不能“包含被释词(字)”的“误区”。  相似文献   

14.
针对传统的文本聚类容易受到噪声影响的问题,提出一个基于词性标注的文本聚类算法。该算法利用词性标注从文本中识别并抽取最能体现文本特征的关键词,再基于所抽取的关键词进行聚类操作。实验发现,相对传统的聚类算法,基于词性标注的文本聚类算法能够有效地提高聚类结果的质量。  相似文献   

15.
本文提出了一种基于条件随机场模型的汉语词性标注方法。该方法能够充分利用词的上下文信息作为特征。实验表明,该方法的标注效果明显优于基于隐马尔可夫模型和最大熵马尔科夫模型的方法。  相似文献   

16.
随着现代汉语语法理论研究的深入和词典编纂理论的发展,词性的标注问题得到了普遍的关注,不少词典开始标注词性。其中,对于词典词性标注问题,争议多存在于动词、形容词、名词之间的兼类与转类问题上。本文首先回顾词典词性标注的历史,然后从语言事实与外语教学等角度说明动转名的词性标注的必要性。  相似文献   

17.
李慧贤 《现代语文》2006,(8):112-113
<古代汉语虚词词典>(中国社会科学院语言研究所古代汉语研究室编,商务印书馆,1999年第1版,以下简称<词典>)是目前最新、也是印数最多的虚词词典,它代表了古汉语虚词研究的最高水平.  相似文献   

18.
词性标注问题一直是计算语言学中的一个难点问题,对于一些词类的标注标准和方法,至今仍未统一,如兼类词、区别词,这给进一步的句法分析和语料库的共享带来了很大困难,甚至有时候会造成资源的浪费。本着实用的目的,在参考各家标注策略的基础上,本文对兼类词、区别词和状态词的标注给出了统一的标注策略。  相似文献   

19.
第5版《现代汉语词典》在区分词与非词的基础上,对所收的词进行了词性标注,这是一件意义非凡的事情。但我们在仔细阅读该词典后,却发现了一些值得商榷的问题,如同类词词性标注不一致;词性标注不当;词性缺标;释义与词性不一致等。  相似文献   

20.
词性自动标注是对语料在高层次上进行分析的一个重要组成部分,其结果可以用于很多自然语言处理应用程序当中。而维吾尔语和其它语言一样也存在词兼类现象。本文介绍了维吾尔语词性自动标注系统的设计思想和实现过程。该系统基于隐马尔科夫模型,采用Viterbi算法来进行词性自动标注。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号