首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 86 毫秒
1.
由于汉语词类问题的复杂性,辞书标注词性困难重重。《现代汉语词典》第5版在继承前版的基础上,增加了词性标注。但是,由于主客观因素的影响和制约,其词性标注难免还存在一些失当之处,主要有:一、词性标注不够准确;二、词性标注前后矛盾;三、兼类词词性标注不全面;四、同类词词性标注不一致。笔者抽取一些具体的词,对上述问题进行分析探讨,并提出自己的看法。  相似文献   

2.
本文通过对十部对外汉语教材中生词词性标注现状展开分析考察,分析了现行教材进行词性标注的特点和做法,指出教材在词性标注方面存在的问题,如词性标注存在错误、词性标注的依据不明确等问题,讨论了特殊类别词汇的词性标注问题,如离合词、兼类词、属性词等如何标注词性以及词语和语言构式是否需要标注词性.最后提出了建立词性标注体系、优选标注语言符号等词性标注的原则和建议.  相似文献   

3.
词性自动校对在自然语言处理领域有着广阔的应用前景。针对传统基于规则的中文分词方法的不足,利用数据挖掘思想,通过对决策表的优化提出并实现了一种基于粗糙集的兼类词自动文本校对方法。该方法能够正确标注语料中挖掘、自动获取兼类词词性标注校对规则,提高兼类词词性校对标注的准确率。  相似文献   

4.
第5版《现代汉语词典》在区分词与非词的基础上,对所收的词进行了词性标注,这是一件意义非凡的事情。但我们在仔细阅读该词典后,却发现了一些值得商榷的问题,如同类词词性标注不一致;词性标注不当;词性缺标;释义与词性不一致等。  相似文献   

5.
随着社交网络的不断发展,微博成为越来越多的人获取信息的平台。为了有效解决微博话题检测中海量短文本带来的词稀疏问题,提出结合全局向量模型(GloVe)和潜在狄利克雷分布(LDA)的GV-LDA模型。在使用LDA进行话题检测前,模型利用多义词词项的含义与词性相关的事实,在标注过并去除低频词的语料上,对全局向量模型进行训练获得词向量,对词性相同且相似度大于阈值的词进行替换以解决稀疏性问题。实验结果表明, GV-LDA模型较传统的LDA主题模型,可有效提高话题检测的准确率和召回率,并降低“主题词”处理的维度,因此GV-LDA更适合微博话题检测。  相似文献   

6.
从现代汉语语文词典“词性标注”问题入手,以《现代汉语词典》和《现代汉语规范词典》的标注结果为主要研究对象,重点选取个别特殊成分讨论。主要探讨两个问题:一是词性标注的单位;一是“们”和“者”如何定性。标注词性首先要辨别词与非词。意义整体性和成分黏着性是词的两大显著特征。在现行的汉语语法体系框架内,“们”宜区分为词缀“们”和助词“们,”从而更全面地描写“们”的特点。“者”宜区分为词缀“者”和助词“者”。其中,“者”的助词用法仅在仿古语体中出现。  相似文献   

7.
为了提高先秦文献词性标注的精确率,提出一种利用注疏文献的注音信息来进一步校正词性标注结果的方法。《春秋左传正义》中对破读字音有注释,且有较为规范的注音体例,在标注了《广韵》中多音字词性的基础上,通过比对注音,确定《左传》中某多音字的读音,进而确定词性。实验一共检查了词性标注精确率达90%的《左传》中1231个含多音字的句子,涉及到单音节词词型423个,正确校正了41个词型共92处错误。对古籍校勘及古籍信息处理有较高价值。  相似文献   

8.
频率统计是研究词性标注的方法之一,而且也是新近比较流行的一种方法。文章在现有研究的基础上,对四部辞典中有三部一致标注为形容词的17个分歧词进行了考察研究,对出现在例句语料中的分歧词做了语法标注,并运用计算机处理软件分析统计分歧词的词性,测算出比率值,以达到化解词性标注分歧的目的。  相似文献   

9.
笔者基于条件随机场(Conditional Random Field,CRF)和支持向量机(Support Vector Machine,SVM)模型,通过增加上下文、附加成分和蒙古文字母等特征,对蒙古文句长为8到25的将近4万个句子进行了词性标注的研究。研究表明,CRF模型和SVM模型在标注蒙古文词性方面都有比较好的结果,其中在考虑上下文和特征"连写的构形附加成分"的情况下,SVM模型标注蒙古文词性的准确率可以达到99%以上。  相似文献   

10.
中文自然语言处理在舆情系统信息预处理中起着重要作用。提出一种基于ICTCLAS的中文舆情语料分词方法。它通过采用层叠隐马尔科夫模型将中文分词、词性标注、歧义词处理和未登录词识别进行系统集成,形成整体的系统框架。实验结果表明,该方法能够有效识别网络舆情用语,提高了分词准确率,为进一步发现高校网络舆情奠定了基础。  相似文献   

11.
通过在共时层面上对"真心"的句法功能和组合能力进行考察,发现"真心"不仅可当名词使用,也可当形容词使用,《现代汉语词典》第5版只将其标为名词不妥,应补充其用为形容词的用例。  相似文献   

12.
名动词在汉语语法中一直被认为是一个独立的词类。《现代汉语词典》(第5版)中名动兼类词的调查表明:所谓的名动词这一概念是既不具科学性也不具实践性,甚至还容易导致词类系统的混乱。在使用大型语料库对所谓的名动词进行了专项研究后,发现大多数所谓的名动词实际上是一种语法隐喻,是词类的去范畴化和再范畴化。在现代汉语词典中应将其标注为名动兼类词。  相似文献   

13.
汉语以字为基本书写单位,且缺乏形态变化,词的兼类现象相当普遍.因此,有效对汉语进行词性标注对利用计算机来理解和生成汉语自然语言具有基础性意义.通过实例分析介绍了四种主要的标注方法并对其优劣进行了比较.  相似文献   

14.
《诗经》中“斯”有动词、代词、连词、语气词和词尾等多种词性及词义和语法功能。“名+斯”、“谓+斯”、“彼+谓+斯”结构的“斯”相当于指示代词“者”,“数+斯+名”结构的“斯”相当于指示代词“其”,“螽斯羽”等“斯”功能同连词“之”。因文字假借和语法演变,“斯”字被借作指示代词,指示代词进一步向连词、语气词和词尾发展。《诗经》中不同词性的“斯”分别和先秦汉语虚词“之”、“其”、“者”、“然”等异词同义。  相似文献   

15.
古汉语中涉及“有”的研究主要有存现句研究、“有”字句研究、“有+VP”格式研究三个方面,研究重点为“有”字句的历时演变和“有”的词义及语法属性,研究范围则基本限于传世文献。在两周金文中,“有”也是一个出现频率很高的词,共约10:2例,句法形式上全部带宾语,除了一般所见的体词性宾语外(50例),谓词性宾语(52例)比例之高是其明显特征。“有+VP”有“有+V、有+状语·V、有+V·宾语、有+V·补语、有+VP1+VP2、有+V1和V2”六种具体形式,表现出结构类型的多样化特点。而在体词性宾语中,抽象名词宾语超过其他各类宾语的总和,是其又一特点。  相似文献   

16.
为制备工艺简单且饱和磁化强度高的磁流体,本文采用化学共沉淀法制得了纳米磁性Fe3O4粒子.然后以一定比例的镝钕对铁氧体磁流体改性,选择淀粉为包覆剂制备水基稀土复合铁氧磁流体.考察了镝钕的用量、包覆剂的用量、反应温度、包覆温度等因素对产物粒径及性能的影响,并对其进行了初步的性能表征.实验总结出适宜的条件:在n(Fe):[n(Nd3+)+n(Dy3+)]=30:1,n(Fe3+):n(Fe2+)=1.70~1.75前提下,镝与钕的用量比为n(Dy3+):n(Nd3+)=4:1,25%NH3.H2O(A.R.)作为沉淀剂和pH值的调节剂,反应体系温度控制在35℃左右,调pH值至9~11;以淀粉作为包覆剂,其最佳用量是每60mL载液0.0050g,包裹温度在50℃左右,包裹最佳pH=2~3,在该条件下制得的水基稀土镝钕复合铁氧体磁流体磁性能比普通水基铁氧体的要高.  相似文献   

17.
借助于统计语言模型将汉语分词转换为字序列标注并实现汉语分词已经成为近年来汉语分词的主流方法,但统计语言模型训练时间较长一直是这一方法中的最大问题.提出了一种基于三词位的字标注汉语分词方法,并在bakeoff2005提供的语料上进行了对比实验,结果表明该方法可以取得接近四词位字标注分词方法的性能,但在模型的训练时间上明显优于四词位标注方法.  相似文献   

18.
采用液相合成出2-(1-((2-胺基苯基)亚胺基)乙基)-5-甲氧基苯酚,通过IR,H1-NMR表征其结构,进一步合成其5种金属配合物(M=Cu^2+,Mn^2+,Ni^2+,Zn^2+,CO^2+),大肠杆菌的生物活性实验表明:配体与锰形成的配合物对大肠杆菌的抑菌活性比配体强.  相似文献   

19.
现代汉语“人称代词+来+V(P)”句存在两种不同的语义,其一表示连动义,成分间关系松散;其二取整体义,框架中不宜插入其他成分,“来”语义虚化(学界称“来2”),重音在“人称代词”。本文认为,“人称代词+来2+V(P)”具有构式地位,构式义与“责任”义有关。本文以人称代词“我”为例,考察了“我来1V(P)”句大量真实语料,认为“我来2V(P)”的典型构式义为言者主动承担责任,非典型语义表示言者对行为/话语权的宣示。其中,V(P)的语义特征受到构式整体义的制约。在构式整体语义中,“来2”是起关键作用的成分。  相似文献   

20.
为了研制工艺简单且饱和磁化强度高的磁流体,本文采用化学共沉淀法通过对铁氧体磁流体改性制备了水基镝钕复合铁氧体磁流体,实验讨论了温度、镝与钕的配比及用量、表面活性剂的用量、pH值对磁流体稳定性,改变工艺流程的影响,其结果表明:(1)在n(Fe):[n(Nd3+)+n(Dy3+)]=14:1,n(Fe3+):n(Fe2+)=1.70~1.75,镝与钕的用量比为n(Nd3+):n(Dy3+)=1:1,25%NH3.H2O作为沉淀剂和pH值的调节剂,反应体系温度控制在35℃左右,调pH值至9~11;(2)以明胶作为表面活性剂,其最佳用量是每60 mL载液0.005 0 g,包裹温度在55℃左右,包裹最佳pH=4。该条件下制得黑亮的水基镝钕铁氧磁流体,其磁性能比普通水基铁氧体高。在可见光的照射和磁场的共同作用下,可以看到明亮的磁光环产生。同时,还对产品的黏度、磁化强度、表面包覆情况、稳定性等进行了相应的表征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号