首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 875 毫秒
1.
李海波 《现代语文》2010,(7):117-118
本文在对《老屋窗口》一文进行手工分词和词性标注的基础上,归纳总结了手工分词和词性标注存在的问题,为中文信息处理中的分词与词性标注提供一定的参考价值。  相似文献   

2.
词性自动校对在自然语言处理领域有着广阔的应用前景。针对传统基于规则的中文分词方法的不足,利用数据挖掘思想,通过对决策表的优化提出并实现了一种基于粗糙集的兼类词自动文本校对方法。该方法能够正确标注语料中挖掘、自动获取兼类词词性标注校对规则,提高兼类词词性校对标注的准确率。  相似文献   

3.
第5版《现代汉语词典》在区分词与非词的基础上,对所收的词进行了词性标注,这是一件意义非凡的事情。但我们在仔细阅读该词典后,却发现了一些值得商榷的问题,如同类词词性标注不一致;词性标注不当;词性缺标;释义与词性不一致等。  相似文献   

4.
近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,基于字的词位标注汉语分词方法逐渐成为分词的主要技术路线。本文简要介绍了词位标注汉语分词的基本思想,探析了基于条件随机场实现词位标注汉语分词的机理,并对采用四词位标注集,使用CRF++0.53工具包实现字串序列词位标注进行了详解。最后在Bakeoff2006的评测语料上进行了封闭测试。  相似文献   

5.
借助于统计语言模型将汉语分词转换为字序列标注并实现汉语分词已经成为近年来汉语分词的主流方法,但统计语言模型训练时间较长一直是这一方法中的最大问题.提出了一种基于三词位的字标注汉语分词方法,并在bakeoff2005提供的语料上进行了对比实验,结果表明该方法可以取得接近四词位字标注分词方法的性能,但在模型的训练时间上明显优于四词位标注方法.  相似文献   

6.
描述了汉语自动分词中切分歧义的发现和歧义字段的消除,给出了基于词典的汉语词自动切分和基于统计的词类与词性歧义消除的模型和实现方法.  相似文献   

7.
本文介绍了“计算机用现代汉语词类研究”项目的技术方案,即:先参考词库和词类词典对语料进行自动分词自动标注词性处理人工校对和调整后,再利用分词条程序将语料收入数据库,最后进行各种统计分析的方案。  相似文献   

8.
本文在语料库的基础上,通过考察、分析和统计人工分词和词性标注语料,采用语言学成果和计算机技术,对量名短语在语料库中的自动识别工作做了初步探讨。实验结果证明,利用匹配搭配词典和参考通过训练得出的搭配概率的方法,能够较好地在分词及词性标注文本上自动识别量名短语。  相似文献   

9.
本提出了一种基于规则的汉语句法分析方法.通过对已进行分词与词性标注的句子进行短语的人工标注.形成精确度较高的语料.然后提取一些规则.分析出短语的结构和功能类型,为自然语言的计算机处理提供基础研究服务.  相似文献   

10.
目前,带标注语料库因为标注质量等原因严重影响了汉语的自动分词和测评,而其中影响较大的就是语料库中分词的不一致。本文总结并分析了前人对于分词不一致的各种研究,廓清了分词不一致的概念,提出分词不一致最好按照所属类别统一处理,同一类型的词应该处理成相同的切分形式。  相似文献   

11.
电子词典辅助下的英语阅读教学   总被引:1,自引:0,他引:1  
本文介绍电子词典的产生、发展及其与印刷词典相比的优越性。在电子词典的辅助下的英语阅读教学充分显示其成功的一面.如果能将印刷词典与电子词典有机地融合使用.一定能开辟高校英语阅读教学的新天地。  相似文献   

12.
电子词典产生于20世纪末,近年来无论是在理论建设与实践运用方面都取得了很大的发展。电子词典是基于计算机技术与理论语言学而发展起来的一项新型产业。本文主要论述以下5个方面的问题:(1)电子词典的类型。(2)常用的四种电子词典特点总结。(3)电子词典的性能和结构。(4)利用电子词典辅助对外汉语阅读教学。(5)对外汉语学习型电子词典编纂构想。  相似文献   

13.
本文通过对普遍电子字典词库结构原理的讨论,得出一种新的适合于“夏汉电子字典”的特殊的变长记录词库结构。  相似文献   

14.
《简化字总表》是目前社会用字,包括出版物用字最重要的规范性标准之一,因展现了部分繁体字和简体字复杂的对应关系,也可以是一部繁简字对应字表。以《总表》为纲,字词典对繁简字音义对应关系详尽的辨析,就将简化字系统与繁体字系统联系在一起。编辑在工作中应审慎地对待繁简字的对应转换。  相似文献   

15.
潘宗乾教授编写的《汉英双解英语同义词词典》不仅对英语同义词的辨析做出了汇总,同时针对以汉语为母语的使用者的实际困难和需要,首次以汉英检索的形式呈现同义词辨析信息,从而为汉英词典和英语同义词词典的编纂提供了新的思路.本文就该词典在编纂体例,同义词的收录标准, 同义词的例证选取等方面进行了探讨,旨在寻找更科学严谨,更符合以汉语为母语的使用者需求的英语同义词词典的编纂模式.  相似文献   

16.
词汇具有系列性、群聚性的特点。尤其是近代汉语新生成的词,大多都是合成词,词的群聚性更明显。运用“词语系连法”,可对其分群归类,在训释词语的同时,探索这种方法对修订辞书的意义。  相似文献   

17.
文章概述主题搜索引擎原理,介绍了高性能的全文检索引擎—Lucene开源系统,在分析Lucene语言分析器结构的基础上,得出基于Lucene的数码产品搜索引擎的主题词典的具体构建方法,并针对词典的更新做了初步探讨,总结了基于用户查询日志的主题词典构建方法。  相似文献   

18.
作为语言圭臬的工具书,词典中的汉译具有鲜明的示范性,有缺陷的汉译或误译所起的负面作用是不言而喻的。本文将《英汉大词典》中不尽如人意的汉译粗略归类并略加评论,以就正于编者和同行专家。  相似文献   

19.
A hyper-reference is an online electronic aid that provides immediate access to adjunct information with a direct-return path to the target information. Eighty undergraduate foreign language learners participated in a comparison of hyper-reference and conventional paper dictionary use on the measures of consultation frequency, study time, efficiency, and comprehension. Hyper-reference users consulted over two times as many definitions as conventional dictionary users. Analyses of efficiency (consults per minute) found a higher consultation rate for hyper-reference users than for conventional dictionary users. The study also compared bilingual (Spanish/English) and monolingual (Spanish/simplified Spanish) dictionary use. Bilingual dictionary users consulted 25% more definitions than did monolingual dictionary users. Bilingual dictionary users completed reading in 20% less time than monolingual dictionary users. Efficiency was also higher during bilingual dictionary use than during monolingual dictionary use. Differences in comprehension were not significant. Directions for further research and development concerning electronic text and hyper-references are offered.  相似文献   

20.
本文对中国的三部和英国的一部翻译词典的简要利弊分析,认为我国翻译词典的编撰已经逐步成熟,并趋于完善,但随着翻译研究的深入开展以及我国目前的翻译研究还相对西方落后的状况,我国的翻译词典编撰工作仍然面临着艰巨的任务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号