首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 765 毫秒
1.
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意.论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)聚类算法HTSC.对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证.该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息.  相似文献   

2.
聚类问题的关键是把相似的事物聚集在一起,因此相似度计算是进行文档聚类的首要问题.XML模式是XML文档结构的体现,对XML文档的聚类可以通过XML模式的聚类来实现.本文提出一种基于XML模式元素的文档聚类方法,通过计算XML模式元素间的相似度来对文档进行聚类,综合考虑了XML模式中元素的结构和语义信息,进一步提高了计算相似度的精度,提高聚类的准确性,并且易于提取聚簇的通用XML模式.  相似文献   

3.
在非重叠视域监控网络中的人体目标跟踪(英文)   总被引:1,自引:0,他引:1  
针对存在非重叠视野的摄像机监控网络,提出了一种基于人体外观模型和摄像机间时空信息的人体目标自适应跟踪算法. 对于人体外观模型,首先根据人体测量学理论将人体目标划分成头、躯干和腿 3 个部分,分别提取各部分的 HSV 颜色直方图特征用于构建人体外观模型,然后引入加权因子计算人体目标之间的相似度,最后采用一种基于双阈值的相似度排序算法确定人体目标的匹配关系. 对于摄像机间的时空信息,通过增量学习,不断积累目标关联信息,经统计分析逐步更新摄像机间时空信息. 实验结果验证了所提出的跟踪算法在无需摄像机标定的条件下能够实现人体目标的连续跟踪,且随着关联匹配信息的累加,算法的跟踪准确性也逐步提高.  相似文献   

4.
针对短语文本的分类、聚类、信息查询问题,提出了一种新的中文短语文本相似度计算方法.用该方法计算出的文本相似度及一个比较文本与多个被比较文本所得相似度变化趋势是合理的,因此可以满足短语文本分类/聚类和信息查询的需要.  相似文献   

5.
针对摄像头离散区域存在的光照变化、视角变化等干扰,提出一种结合Lab模型以及扩展梯度方向直方图特征的方法来改善人物外表匹配的准确率.对于描述目标全局信息的Lab模型,提出一种排序最近邻聚类算法进行颜色聚类,然后使用分块颜色匹配算法计算观察值之间的颜色相似度.对于描述目标局部信息的扩展梯度方向直方图特征,使用巴氏距离计算2个观察值之间的相似度.全局信息可以很好地描述目标外形,并且能够适应摄像头视角的变化以及目标尺度上的改变.局部信息对光照变化具有更强的鲁棒性,它能够增强模型的辨别能力.全局信息和局部信息的结合保证了所提出算法的精确度和鲁棒性.室内实验结果显示所提出的算法具有较高的正确匹配率.  相似文献   

6.
文本相似度计算是文本分类、文本聚类、自动文摘、信息抽取的基础.文本相似度计算性能直接影响到文本分类、文本聚类、自动文摘的质量.另外文本相似度还应用于诸多自然语言处理任务中,本文对文本相似度计算问题进行了深入的研究,并根据自然语言的特点提出了通过比较两个文本关键语义对来计算文本的语义相似度.  相似文献   

7.
一种基于超级链接结构的WWW模糊聚类算法   总被引:2,自引:0,他引:2  
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)矣类算法HTSC。对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息。  相似文献   

8.
利用由均匀概率空间的无穷乘积所定义的及中公式的真度概念,给出了公式间相似度的一种新定义,讨论了该相似度与文献[2]、[6]定义的相似度的大小关系及逻辑系统及中公式间的三种相似度的性质.最后讨论了由其中的一种相似度导出的这两个系统中全体公式集上的一种伪距离的重要性质.  相似文献   

9.
I.格罗斯曼和W.迈格努斯在“群和它的图象表示”中给出了群的几何图象——群的Cayley图.主要是通过正多边形和正多面体的重合运动求群的Cayley图,它适合于求点群的Cayley图.本文主要给出了由群的定义关系较复杂的有限群来直接求群的Cayley图的方法,揭示了其结构规律性和自身特点,并通过两个群元素的乘法对应于图象上的两个相继的道路合成给出了理论证明.从而丰富了“群和它的图象表示”所创立群的Cayley图的理论.最后给出了23p阶群的Cayley图.  相似文献   

10.
第13届“希望杯”高一培训题第84题为: 有两幅同一地区的,比例尺不同的长方形地图.将其中较小的一幅随意地平放在另一幅地图内.证明这两幅地图中一定有一个相同的地点是在某一个重合的点上(即:上下平贴的两张图中必有一个点是两幅地图中的同一个位置). 参考解答上只给了用相似三角形的方法寻找这个重合点,很多同学看完解答都问同一个问题:为什么?这道很难的题的命题背景很深,它牵涉到数学分析中的闭矩形域套定理.设大地图为矩形ABCD,小地图为矩形A1B1C1D1相似比为  相似文献   

11.
提出一类基于不确定度的Vague集间的相似度量.通过与现有公式的比较,阐明该类公式有较强的分辨能力,这些公式是实用的.  相似文献   

12.
跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结构等问题,在空间映射、特征选择上与单语言文本相似度计算有很大差异。为解决上述问题,采用一种基于文本加权词共现关系的跨语言文本相似度计算方法,通过平行语料库构建跨语言词共现关系模型,使用该模型进行跨语言文本映射,对不同语言的文本进行相似度计算。该模型实际反映了某种语言中某些关键词共同出现时映射成另一种语言时的关键词概率分布。实验表明,该方法对跨语言文本排序的计算更接近人工评判标准。  相似文献   

13.
在中文信息处理中,句子相似度计算是一项基础而核心的研究课题,长期以来一直是人们研究的一个热点和难点.句子相似度计算在实际中有着广泛的应用,它的研究状况直接决定着其他一些相关领域的研究进展,如信息检索的相似句子匹配、自动问答的问题匹配与答案抽取等,句子相似度计算都是非常重要的环节.本文提出了一种基于依存关系匹配的句子相似度计算方法,利用词语内在概念和词语相互依存关系计算句子之间的相似度.结果表明,该算法能显著提高返回结果的准确率.  相似文献   

14.
基于绝对真度的概念,在Gn命题逻辑系统中定义了公式间的绝对相似度和伪距离,并证明了公式绝对真度的推理规则,为近似推理提供了理论基础.  相似文献   

15.
Lucene中的相似度计算可以让用户得到与查询词相似程度最高的文本,以及文本与查询词的相似程度,因此是Lucene搜索引擎的一个很重要的部分。最后的得分通过评分公式来实现,它的性能直接影响了评分结果,因此针对评分公式算法加以改进,改进后的Lucene相似度计算评分公式更准确地为用户提供所需要的信息。  相似文献   

16.
区间直觉模糊集相似性测度及其在模式识别中的应用   总被引:13,自引:0,他引:13  
定义了区间直觉模糊集相似度的概念,并且基于Hamming距离、标准化的Hamming距离、加权的Hamming Euclidean距离、Euclidean距离、标准化的Euclidean距离、加权的Euclidean距离等,定义了一些区间直觉模糊集距离测度.然后,通过把Hamming距离和Euclidean距离以及它们的加权形式与Hausdorff度量相结合,给出了2种组合的区间直觉模糊集距离测度,即基于Hausdorff 度量的加权Hamming距离和基于Hausdorff 度量的加权Euclidean距离,并且研究了它们的性质.最后,基于上述距离测度,给出了区间直觉模糊集相似性测度,并且把它们应用于模式识别领域.  相似文献   

17.
文章讨论了积分计算出现奇点时,通过巧妙的添加新的辅助线(面),挖去奇点构造新的复连通区域的求积分方法,本质上是对相应的公式做了推广,从而使对各类积分公式的运用有更深层次的掌握,加强了对各类积分联系的理解.  相似文献   

18.
The dynamic securityregion(DSR) is definedas are-gionininjectionspacein whicha power systemwill betran-siently stable for a given fault[1].The DSRis usually de-noted asΩd(i,j,F) ,whereiandjdenote the networkstructures of pre-fault and post-fault ,respect…  相似文献   

19.
杨立波 《太原大学学报》2011,12(1):111-113,116
基于CFN的相似度计算是一种相似度计算算法、将此算法与实例机器翻译联系,通过语法,语义两个角度对句子进行观察和分析,并经过CFN标注汉语句子,从两个层面进行相似度计算,并建立实例相似度计算模型,使基于CFN的相似度的计算方法更为简便。  相似文献   

20.
提升链路预测精度是复杂网路研究的基础问题之一。传统基于局部信息相似性、基于全局信息相似性与基于随机游走相似性的链路预测都是基于单个相似性指标进行预测的,而没有充分利用这些相似性指标的综合信息。将链路预测问题看作机器学习中的二分类问题,将有连接的样本标签记为1,无连接的样本标签记为0,将基于局部信息、基于全局信息与基于随机游走相似性等15个指标作为样本特征。综合考虑以上信息,使用XGBoost算法,选取AUC作为模型评价准则,在facebook真实数据集上进行实验。结果表明,该算法在测试集上的AUC高于基于单个相似性指标链路预测的AUC。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号