共查询到15条相似文献,搜索用时 61 毫秒
1.
针对现有基于语词的术语相似度典型算法存在的问题,提出了将WordNet和编辑距离计算应用于术语词语匹配过程,并根据术语修饰词的位置赋予特征权重的术语相似度改进算法.和已有算法相比,新的算法在三个方面有所改进.首先,在术语中心词匹配过程中引入WordNet的同义词、近义词检索功能,实现中心词之间的语义匹配;其次,将术语词语的直接匹配改进为基于编辑距离计算的模糊匹配;最后,在计算过程中充分考虑了术语修饰词与中心词之间的距离对修饰词权重分配的影响因素.针对新算法提出了具体的实现步骤,并选取基因工程领域实验数据对改进算法和现有典型算法进行对比评测.实验证明,每种改进方法在单独测试时效果优于或至少不低于Nenadic算法.基于三种改进方法的综合计算方法在计算效果方面具有明显提升. 相似文献
2.
基于句子匹配的文章自写度测评系统 总被引:1,自引:0,他引:1
化柏林 《现代图书情报技术》2007,2(11):40-44
针对人工进行不同文章中相同内容的判断存在着较大困难的局面,提出一个基于句子匹配的文章自写度测评系统。设计基于句子匹配的文章自写度测评系统的系统结构,论述句子分析器、句子匹配器与文章自写度评价器3个关键模块的详细流程,并设计相应算法。选取小规模数据进行实验,实验结果表明,基于句子匹配的文章自写度测评系统从技术上完全可行。最后分析基于句子匹配的文章自写度测评系统的难点及问题。 相似文献
3.
WCONS+:一种基于WCONS的本体集成 总被引:2,自引:0,他引:2
提出一种本体集成方法WCONS+,将本体集成过程分为准备、映射、集成和检测4个阶段,并通过集成军用飞机本体和电子对抗装备本体对这一方法进行了实验,结果初步证明该方法的有效性。 相似文献
4.
杨贺杨奕虹乔晓东李宁朱礼军 《现代图书情报技术》2010,26(6):17-24
讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。 相似文献
5.
拒绝服务攻击是一种具有较大破坏性的攻击方式,本文在对其进行分析之后,提出了一种基于网络带宽的DoS识别算法,并对一些细节加以阐述。新的算法具有简单易行,实时性高等优点。 相似文献
6.
针对目前的视频火灾检测技术容易受到复杂场景、类似火焰颜色干扰物和光照条件等影响,算法的可靠性不高,容易产生误判和漏判等问题。在全面调研前人工作的基础上,充分利用了火焰的运动特征、颜色特征、面积增长特征、圆形度特征等,先通过选择性背景更新模型提取运动目标,进而对提取的运动目标执行颜色检测,进一步滤除非火焰颜色的运动目标,然后对获得的火焰候选区域进行火焰动态特征分析,最终实现对火焰信号的准确判断。 相似文献
7.
一种基于加权关联规则的协同推荐算法 总被引:3,自引:0,他引:3
协同过滤技术不需要分析待推荐资源的内容信息,在电影、音乐、图书等非结构化数据占主流的电子商务推荐领域得到了广泛的应用,成为电子商务推荐领域的主流技术.针对基于项目的协同过滤算法不能实现"跨类型"推荐的缺点,本文提出了一种新的基于关联性评分预测的协同过滤算法IAPCF.区别于传统的算法,IAPCF算法根据项目之间的关联规则,而不是根据多用户对项目评分形成的向量间的相似度来寻找项目的最近邻居集合.该算法能较好地实现"跨类型"项目的推荐.实验结果表明,IAPCF算法具有更好的推荐精度. 相似文献
8.
9.
基于词表和N-gram算法的新词识别实验 总被引:1,自引:0,他引:1
目前未登录词问题仍然很大程度上影响着自动标引和信息检索的效率。本文提出了一种选择期刊论文的题名和摘要作为训练语料,利用N-gram算法切分和停用词典等过滤筛选非专名的新词识别方法。该方法主要分为两步:先进行N元切分,保存关键词候选集并统计词频;然后进行一系列的过滤,主要有词频阈值限定、前停后停词典过滤、相邻词比较、子父串比较、抽词词典和过滤词典的过滤,最后进行人工判别。对实验结果的测评表明这一方法是简便易行的。训练语料可以不用全文,只用题名和摘要;在新词识别上,摘要可以代替题名。 相似文献
10.
[目的/意义]微博对用户获取信息和建立社交网络具有重要作用。提出一种基于相似度和信任度融合的微博内容推荐方法,能够从用户需求出发进行个性化微博内容推荐,对提高微博服务质量、改善信息过载问题具有意义。[方法/过程]基于相似度和信任度融合算法,构建微博内容推荐模型,以新浪微博为研究对象,采用编程方式获取汽车、体育、运动健身、互联网和财经5个领域的数据,展开用户相似度与信任度计算的实验分析和比较。[结果/结论]分析结果显示该方法可以有效表示和挖掘微博内容,改善微博推荐的准确性和用户满意度。 相似文献
11.
基于模式匹配的汉语同义词自动识别 总被引:7,自引:0,他引:7
同义词的自动发现和识别在信息检索领域有着重要的研究意义和应用价值。为了提高同义词自动识别的效率,本文提出了从词典释义中使用模式匹配方法提取同义词。该方法首先对词汇的释义方式进行分析,归纳总结出在词典释义中同义词出现的模式,进而利用模式匹配方法获取同义词。实验结果表明,利用模式匹配方法来自动发现同义词具有可行性和实用性。 相似文献
12.
13.
14.
基于两字词簇的汉语快速自动分词算法 总被引:10,自引:1,他引:9
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现 相似文献
15.
中国现代图书馆专业化的一个重要源头——中华教育改进社图书馆教育组的历史考察 总被引:2,自引:1,他引:1
中华教育改进社图书馆教育组是中国图书馆界第一个全国性专业社团组织.1922-1925年,图书馆教育组及其常设机构图书馆教育研究委员会利用中华教育改进社四届年会,提出了一系列议案,并通过社员在<新教育>上发表的一批高水平论文,宣传和普及了现代图书馆理念,形成了现代图书馆学的教育学理论范式,提出了图书馆需要专家治理的主张,完成了图书馆协会和图书馆专业刊物创设的历史使命,中国现代图书馆事业的专业化由此起步. 相似文献