首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为进一步提升图像特征点定位准确性,提高图像特征匹配的精度与算法效率,并保持良好的旋转与尺度不变性,文章提出了一种基于SIFT特征点和K-means聚类的图像匹配优化算法,在SIFT特征点基础上,利用亚像素插值和辐射聚类模型对传统算法进行优化,提取更精确的特征点,进一步根据辐射模型中距聚类中心距离比率,计算对象点与聚类中心的相似性,避免了特异点对聚类中心计算产生的突变影响,提高了聚类计算的正确性及特征点正确率.实验证明,在保证旋转不变性与尺度不变性的前提下,本算法实现了在同等距离比率下较原算法的图像匹配精度有较明显提高.  相似文献   

2.
K-中心点聚类算法对噪声和孤立点的敏感性小,比较适用于增长速度快、更新频繁的电子地图数据,但K-中心点聚类算法初始中心点的选择会直接影响算法的稳定性和准确性,容易陷入局部最优解,从而影响聚类效果。提出一种基于改进K-中心点的电子地图数据质量检查算法,通过对样本数据集进行网格划分,结合样本密度信息选取初始中心点,解决了算法依赖样本数据实际分布的问题。评估实验结果表明,改进算法较K-中心点算法正确率提升了9.56%,效率提升了56.33%。  相似文献   

3.
《柳州师专学报》2015,(6):108-110
K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择K个点作为初始聚类中心.实验证明,改进后的K-means算法聚类效果更好.  相似文献   

4.
针对k-means算法对初始聚类中心敏感的问题,提出利用人工鱼群算法去优化k均值算法,即先通过人工鱼的行为进行全局搜索,得到一个初始的全局最优划分后再进行聚类,运用云平台Hadoop的并行处理框架Mapreduce对混合算法实施并行处理,从而快速准确地处理大量数据。实验结果表明,改进后的算法在执行速度、准确性、加速比及可扩展性方面都有所提高。  相似文献   

5.
提出一种基于K-均值聚类的TSP演化算法。该算法利用K-均值聚类技术,将TSP分为一些简单的TSP问题。在寻求最短路径时,首先所有结点用其聚类中心去代替,以聚类中心为结点构造TSP演化算法;其次,对于每一聚类,可寻求其距前面的聚类和后面的聚类最近的两结点之间的最短距离,若其中的结点较多,则再次演化得到其最短路径,若结点较少,则可用warshall算法可得到最短路径;最后对获得的最短路径进行剪接操作,可得到其更优解。  相似文献   

6.
提出了一种基于核的聚类方法,增加对样本特征的优化;通过核函数,把数据样本空间映射到一个高维的特征空间;在特征空间对数据样本进行k-中心点聚类,并通过计算类内距离作为适应度准则,取其最优的结果。通过Web日志挖掘中的Web客户聚类应用比较,表明核聚类方法在性能上比经典的聚类算法有较大的改进,从而实现更为准确的聚类。  相似文献   

7.
FCM算法具有对数据集按维特征进行等划分趋势的缺陷,在聚类分析中,样本的维特征对分类的贡献可能不是均匀的。针对文[1]提出了基于普通FCM算法和聚类有效性函数相结合的算法,并通过一个Gauss随机变量来更新维特征的权值的算法收敛速度慢,一般都要要迭代上千次的缺陷,引入遗传算法,来加速算法的收敛速度.试验说明,算法很大的提高了算法的效率。  相似文献   

8.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。  相似文献   

9.
有序样本的聚类关键是建立合理的分类指标。将系统聚类法与Fisher算法相结合,引入样本一阶自相关系数描述相邻样本间的相关关系,并以此为分类指标,进行分类。最后运用离差平方和确定最优分类数及分类结果,分类结果符合实际。  相似文献   

10.
一种改进的k-means聚类算法   总被引:2,自引:0,他引:2  
针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值.  相似文献   

11.
一种基于向量空间模型的文本聚类方法   总被引:3,自引:0,他引:3  
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

12.
根据龙岩1990-2006年滑坡灾害样本和地质条件资料,运用统计方法,分析研究了龙岩市滑坡灾害的时空分布特征和滑坡与降雨、地质环境条件因子的关系.结果表明,龙岩市滑坡主要发生在3-9月,4-6月为高发期,8月滑坡数最多,频发区在连城东北部和永定南部;滑坡的季节性与降雨相吻合,与累计暴雨日相关性好,暴雨强度大,灾害的影响面广;灾害发生与当天和前10d累计降雨量关系密切,灾害强度取决于当天降雨强度和前3d累计降雨量的大小;滑坡多发生在地质环境敏感性中等偏强区域,降雨偏弱时,敏感性偏强区灾害发生概率高.  相似文献   

13.
聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法,它需要用户输入聚类数K,但这通常非常困难。聚类数的确定是决定聚类质量的关键因素。虽然有许多被用来估计最优聚类数的聚类评价指标,但对于不同的聚类算法,不同的评价指标效果差异很大。为确定针对K-means聚类算法效果最好的评价指标,采用4种典型的不同聚类结构特征的人工模拟数据以及来自UCI的真实数据集对7种评价指标的性能进行实验比较,结果表明CH指标和I指标在评估K-means算法的最佳聚类数时效果较好。  相似文献   

14.
EM算法是一种非常流行的极大似然估计方法,是一种当观测数据为不完全数据时求解最大似然估计的迭代算法,也是估计有限混合模型参数十分有效的算法.然而,EM算法是一个局部最优算法,常常容易陷入局部最优解,使得它的初始值对算法的结果有着极其重要的影响.因此采用k均值算法来初始化EM算法并将聚类结果同直接用EM算法得到的聚类结果相比较.数值试验表明经过初始化的EM算法的聚类效果要明显好于原始EM算法的效果.  相似文献   

15.
选取初始聚类中心是多数聚类算法的首要步骤,往往影响着聚类的效果。为了避免算法迭代过程中易陷入局部最优的问题,本文提出了一种基于模糊交叉网格的初始聚类中心选取方法。算法通过对数据空间网格化后,以网格交点为中心的邻近网格组成网格空间,根据数据点的隶属度统计每个网格空间的密度,再通过局部最大网格空间选取K个初始聚类中心。在真实数据集上进行实验,结果表明该方法在保证了聚类效果的同时,提高了收敛速度。  相似文献   

16.
遥感影像具有数据量大、数据结构复杂、连续、存在缺损与误差等特点,根据遥感影像的特点,提出一种基于多代表特征树的CAMFT算法.该算法通过多代表点特征树把海量空间数据进行压缩来提高效率,并且可以捕捉复杂形状聚类;算法CAMFT融人了采样思想,进一步增强了处理大型数据的能力.实验结果表明,该方法聚类精度优于K-Mean算法.  相似文献   

17.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。  相似文献   

18.
福建省滑坡灾害特征及驱动因素分析   总被引:1,自引:0,他引:1  
《莆田学院学报》2015,(5):83-88
依据福建省灾害信息网、福建省国土资源厅、福建气候公报及相关文献资料,建立福建省滑坡灾害数据库,对福建省滑坡灾害特征进行分析,得到福建省滑坡灾害群发性强、年际变化大、地区差异明显、发生频率高和强度小的特征。根据福建省滑坡灾害特征分析,采用资料分析法对滑坡灾害驱动因素进行分析,得出了对福建省滑坡灾害影响大的驱动因素为地质构造、地形坡度、降雨暴雨、地质岩性及人类地质工程活动的结论。根据各个驱动因素提出了福建省滑坡灾害防治措施,为福建省的滑坡灾害防治提供科学依据。  相似文献   

19.
目前是我国全面建成小康社会的决胜阶段,因此系统分析全国29个省市现阶段的小康水平对于下阶段的战略规划具有导向意义.通过因子分析法构建小康社会的评价体系,将各项指标划分为"经济类""社会类""文化类""生态类"四类因子.借助评价体系对全国29个省市的小康水平进行聚类分析,将其分为高层次、中等层次和较低层次小康水平,并针对各个分组的特征提出政策建议.  相似文献   

20.
探究我国体育产业研究的现状和研究主题分布,为我国体育产业的后续研究提供参考.借助Citespace可视化分析软件,对2010—2019年发表在核心期刊、CSSCI、CSCD期刊上有关体育产业的3 611篇研究文献进行分析得出:我国体育产业研究年发文量呈现出阶段性变化特征,具体为2010—2011年的"后奥运时代"阶段,2012—2014年的创新拓展阶段,2015—2019年的成熟发展阶段.我国体育产业的研究成果依据高频关键词时间划分,其演变趋势为:体育产业现状—体育产业转型—体育产业升级—新时代—产业融合发展;依据关键词聚类划分,研究主题涵盖了体育旅游、体育竞赛表演业、新时代体育产业发展、体育用品制造等4个知识群.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号