排序方式: 共有144条查询结果,搜索用时 0 毫秒
101.
在中文切分算法设计上,好的算法一般要注重两个方面,一个是提高切分精度,另一个是提高切分速度。本文在逆向最大匹配的算法切分基础上,结合临近匹配算法在中文切分速度方面的优势,提出了一种逆向匹配快速切分算法。此算法由于使用了索引排序查找,所以在速度上比一般的全库扫描更快;在切分精度上,根据汉语语句中心语偏后的特点,采用了逆序匹配,可以更进一步提高切分精度。并通过在综合语料库中的语料上的分析,交集型歧义的自动消解上有着很好的优势。 相似文献
102.
自适应分词算法中的未登录词识别技术研究 总被引:2,自引:0,他引:2
深入研究了未登录词识别技术,并提出了一种新的未登录词识别算法,包括其中的数量词识别规则、边界单字规则、虚字辅助规则、未登录词记忆识别规则以及左右方探测法选取未登录词规则等,使得算法在不依赖大型语料库的前提下可以有效地识别多种领域中各种类型的未登录词.同时,算法通过对绝大部分的交集歧义的识别有效地解决了识别未登录词时导致的新的切分歧义的问题.在网络时文的开放性测试中,分词算法的分词准确率约为90.1%,未登录词识别的准确率、召回率分别为91.2%和94.7%. 相似文献
103.
倪鹏 《吉林广播电视大学学报》2009,(5):59-60,90
随着Internet的发展,数字化、信息化迅速增加,人们对中文信息也越来越关注,随之而来计算机自动分词的处理能力变成现代汉语信息处理的重要组成部分。衡量一个分词算法的优劣主要在于分词的正确率和速度。其中,分词的正确率尤蠢度要。我们认为歧义切分问题成为影响分词正确率的主要因素之一。 相似文献
104.
105.
樊中元 《广西师范大学学报(哲学社会科学版)》2001,37(2):50-53
误缓 指由于交集成分的存在而产生的语言成分的层次错误组合;测试证明这类现象的误组率比较高;从认知心理角度看,知觉中的知识经验干预和前靠效应是产生误组的主要原因。 相似文献
106.
浙江大学的外国留学生不少, 但我们彼此间却好像生活在两个 隔离的世界里。这里是我们中国 学生的“浙大”,同样也是留学生 的“浙大”,而这两个“浙大”却 好像是同一对象的两个不同概念, 共存却无太多实质意义上的交集。 我们之间似乎隔着无法跨越的距 离,彼此保持着疏远和观望。 浙大学生眼中的留学生是什 么样的?我们了解留学生吗?我 相似文献
107.
拥有“报纸质感+网媒酷感+移动传播渠道”的电子号外,也许是纸媒的另一片待垦疆土.
2015年对传统媒体而言可谓百感交集.一方面,媒体融合貌似如火如荼;另一方面,则是报刊跌入寒冬:《长株潭报》《上海商报》下半年黯然休刊.而2015年12月31日,更有《今日早报》《都市周报》《九江晨报》集体道别.尽管每一家停刊的报纸都在敬告读者中说着类似“新闻不死”“没有离开”之类的话,但纸媒人心里总会掠过一丝悲凉. 相似文献
108.
109.
110.