首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
论述了汉语中词、短语和短语词的概念,在此基础上讨论了中信息处理中的汉语人名的标注问题以及相关的“专名 通名”式短语词的标注问题,提出了汉语人名的标注方法。这一问题的研究,对于汉语自动切词研究具有重要作用。  相似文献   

2.
《西游记》中的语气词"罢了"和"而已"   总被引:1,自引:0,他引:1  
引言 "罢了""而已"这类双音节语气词,有人称为短语词.孙锡信先生在他的语气词研究专著<近代汉语语气词>一书中,参照吕叔湘<汉语语法分析问题>中的"短语词"概念,将"语气短语词"的概念定义为"在形式上表现为词组(短语),而在功用上相当于一个词"的"大于一个词的表语气的形式".  相似文献   

3.
本文从中文信息处理的角度来谈汉语人名的标注与拼写问题,也就是把汉语人名的标注与拼写这二者结合起来考虑,而不只是简单地谈汉语人名的词性标注或汉语人名的拼写.下面先谈汉语人名的标注问题,然后谈汉语人名的拼写问题.  相似文献   

4.
为了解汉语习得者在拼音文字和表意文字认知上的差异,促进对外汉语的汉字教学。用墨西哥汉语习得者三语被试对图画与西、英、中等五种不同书写形式进行语义相同和不同的匹配识别实验。发现:西、英、中等五种书写形式与图画的语义相同匹配时,"西语词—英语词""英语词—拼音"以及"拼音—汉语标注拼音"识别加工的正确反映时和错误率差异不显著。西、英、中等五种书写形式与图画的语义不相同匹配时,(1)在识别加工的正确反映时上,"汉语词—拼音""汉语词—汉语词标注拼音"的识别加工的正确反映时差异不显著。(2)在识别加工的错误率上,"汉语词—拼音""汉语词—汉语词标注拼音""西语词—英语词"和"拼音—汉语词标注拼音"的识别加工的错误率差异不显著。墨西哥汉语习得者对表音文字和表意文字的识别加工总体上遵循的原则是:(1)熟悉度原则;(2)从音到义原则;(3)在语义不同匹配识别中,汉字的识别还遵循着由形或由音到义的原则。  相似文献   

5.
汉语词与英语词不同,致使汉语词典词性及功能标注显得没那么迫切,而且,即使标注也不可能与英语模式一样。尽管如此,词性及功能标注还应继续尝试,它毕竟可以给学习者带来诸多方便。  相似文献   

6.
汉语词的归类是一较难的课题,直到目前为止,汉语词典给词标注词性的所见不多.仅解放后公开出版的似只有《普通话三千常用词表》一书,未公开出版的有北京大学中文系汉语专业所编的《现代汉语虚词例释》一书. 应当说汉语的词还是有类可归的,绝非象少数人所讲“词无定类”,问题在于以什么为准,分多少类.分类标准一旦解决,归类问题也就随之迎刃而解了。  相似文献   

7.
《现代汉语词典》(2005版)几个词类标注商榷   总被引:1,自引:0,他引:1  
叶秋生 《现代语文》2006,(5):115-116
<现代汉语词典>(2005版)在吸收近年来汉语语法研究成果的基础上,对现代汉语词汇作了全面的词类标注.但是,有几个词的词类标注还不够准确,如"憋气""发端""廉价"和"眼红",本文根据语言事实和语法学界公认的词类划界标准对它们进行分析,对这些词的词类标注作了补充和修订.  相似文献   

8.
近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,基于字的词位标注汉语分词方法逐渐成为分词的主要技术路线。本文简要介绍了词位标注汉语分词的基本思想,探析了基于条件随机场实现词位标注汉语分词的机理,并对采用四词位标注集,使用CRF++0.53工具包实现字串序列词位标注进行了详解。最后在Bakeoff2006的评测语料上进行了封闭测试。  相似文献   

9.
借助于统计语言模型将汉语分词转换为字序列标注并实现汉语分词已经成为近年来汉语分词的主流方法,但统计语言模型训练时间较长一直是这一方法中的最大问题.提出了一种基于三词位的字标注汉语分词方法,并在bakeoff2005提供的语料上进行了对比实验,结果表明该方法可以取得接近四词位字标注分词方法的性能,但在模型的训练时间上明显优于四词位标注方法.  相似文献   

10.
对权威汉语/汉外词典和语料库的调查发现,"快乐"的词类标注存在问题。鉴此,本文在双层词类范畴化理论指导下,基于国家语委现代汉语语料库,对"快乐"的词类标注问题进行探讨,并对汉语/汉外词典如何处理"快乐"的词类标注给出具体建议。研究发现,概括词"快乐"在现代汉语社群语言系统层面词库中兼属名词和形容词,并非仅是形容词。词典和语料库之所以出现疏漏,主要是错误地运用了"简约原则"。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号