首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
对于k-means聚类算法,采用不同的权值计算方法,其聚类效果有明显差异,尤其当处理的文档数目较大时,这种效果差异可能会影响聚类准确性与合理性。通过实验,用不同的权值计算方法对文本进行聚类分析,并用熵值作为聚类效果的评价标准,对相关权值计算方法进行了研究和比较。  相似文献   

2.
基于k-means聚类算法的专利地图制作方法研究   总被引:3,自引:1,他引:3       下载免费PDF全文
邱洪华  余翔 《科研管理》2009,30(2):70-76
利用专利文献,制作专利地图是有效监测和了解技术发展现状和趋势的重要手段之一,因此最近几年以来,关于专利地图的研究在知识产权领域引起了广泛的关注。本文分析了专利地图在国内外的研究现状,归纳了专利地图的功能,剖析了当前专利地图制作方法的不足,利用了专利文献中的结构化项目和非结构化项目,通过k-means聚类算法,形成语义网络,并最终制作完成可视化专利地图。而根据该专利地图,可以清晰而直观的看出所研究目标技术领域的技术发展路径。  相似文献   

3.
一种基于密度最大值的聚类算法   总被引:1,自引:0,他引:1  
提出了一种结合了基于密度聚类思想的划分聚类方法——"密度最大值聚类算法(MDCA)",以最大密度对象作为起始点,通过考察最大密度对象所处空间区域的密度分布情况来划分基本簇,并合并基本簇获得最终的簇划分.实验表明,MDCA能够自动确定簇数量,并有效发现任意形状的簇,对于未知数据集的处理能力和聚类准确度都优于传统的基于划分聚类算法.  相似文献   

4.
k-means算法在运行过程中对聚类中心有着很高的要求,本文通过萤火虫算法初始化k-means算法的聚类中心,从而确保k-means算法得到更好的聚类效果。  相似文献   

5.
线性判别分析(LDA)具有很好的分类性能,但是计算复杂度一般较高。为了有效地降低LDA算法的计算复杂度,本文提出了一种基于k-means聚类的快速学习算法。该算法首先根据k-means聚类算法对原始样本进行聚类,计算聚类簇的样本中心作为新训练样本,然后再利用LDA算法进行分类。由于通过聚类算法有效地压缩了训练样本集的规模,因此算法具有更高的效率。在语音识别数据集上的实验充分验证了本文算法具有较好的分类性能,而且效率更高。  相似文献   

6.
朱凡  王印琪 《情报科学》2021,39(7):83-90
【目的/意义】基于机器学习算法对信息进行聚类及预测引起了广泛关注,本文将以航空公司客户信息为对 象构建出k-means,BP神经网络模型,对航空用户进行聚类及预测,实现用户的精准营销。【方法/过程】首先,对航 空公司的客户信息进行预处理,并根据信息聚类和信息预测理论,构建出k-means客户聚类模型与BP神经网络的 流失预测模型。【结果/结论】实证结果表明,在聚类模型上,k-means算法将客户聚为五类,实现了不同价值客户的 差异化识别;在客户预测模型上,BP神经网络的准确性更高。【创新/局限】本次研究将LRFMC模型引入到用户聚 类模型的实验中,使得模型泛化能力上存在了一定的局限,但也为该问题的未来研究提供了新的方式。  相似文献   

7.
非晶变压器的噪音污染问题随着电气时代的变迁正在遥步地显示出来,所以如何控制降低变压器噪音始终是变压器领域的一大难题.本文先是通过对噪声基础知识的介绍什么是噪声,噪声的量度怎样定义以及环境对噪音要求是什么.接着文章引入到变压器噪音这个主题上,分别对变压器噪音的来缘、影响非晶合金变压器噪音的几大重要因素(例如:铁心的磁通密度、磁致伸缩、铁心的结构、隔音材料、加工工艺等)进行一定地阐述和分析,如何有效地降低非晶合金变压器噪音的几大方法.  相似文献   

8.
提高电动机滚动轴承的使用寿命,探讨降低电动机滚动轴承的噪音,根据工作实践研究解决噪音的方法。  相似文献   

9.
针对K-means聚类算法无法确定k值,并容易忽视在多维角度下进行聚类的缺点,本文提出了改进的多维度的加权的算法,在自适应K-means聚类算法的基础上引入了视图权重和变量权重,得到了包含多层变量的目标函数,通过数学证明使得目标函数最小化,得到最优的聚类效果。实验采用3个标准数据集作为聚类研究的对象,通过与FCM算法比较,说明了本文算法在聚类方面具有良好的效果。  相似文献   

10.
《中国发明与专利》2010,(11):112-112
<正>专利号:ZL 200920242538.8艾迈计算机辅助工程公司(IMA Co.,Ltd)由美国IMAG工业公司的MS部(机械软件部)脱身而来。IMAG创建于1981年,总部位于加州硅谷,是一家长期致力于国际技术交流与合作的高科技跨国公司。多年来,一直立足于为广大用户提供全方位的解决方案,涉及嵌入式实时操作系统(VxWorks)、多媒体通信(V20IP)、协议栈、制造过程管理(MPM)、产品生命周期管理系统(PLM)、软件建  相似文献   

11.
基于优化初始类中心点的K-means改进算法   总被引:2,自引:0,他引:2  
K-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于K-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。本文提出了一种K-means算法的改进算法,首先探测数据集中的相对密集区域,再利用这些密集区域生成初始类中心点。该方法能够很好地排除类边缘点和噪声点的影响,并且能够适应数据集中各个实际类别密度分布不平衡的情况,最终获得较好的聚类效果。  相似文献   

12.
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法.  相似文献   

13.
构建医药制造业竞争力评价指标体系,运用数据挖掘技术(K-均值聚类算法)定量评价竞争力,得出相应结论,为政府和企业决策提供参考。  相似文献   

14.
由于价值观念的多元化,各种思想对青年大学生产生冲击等多种原因,团组织在高校共青团员中影响力不断弱化,地位逐渐降低。试图将改进的K-means聚类算法用于高校团组织的建设中,为建立更加适合高校学生的基层团组织提供科学的依据。  相似文献   

15.
孟婷 《情报探索》2021,(1):47-55
[目的/意义]使用K-means聚类分析方法,对外交机构遭受的恐怖主义袭击进行定量、客观的评估.[方法/过程]构造K-means聚类方法风险评估模型,对1970—2018年外交机构遭遇恐怖袭击事件进行分析,客观地计算出几类袭击方式、袭击目标和不同国家的风险,其中重点分析了该外交机构政治隶属和该外交机构地理位置所在国家的...  相似文献   

16.
王秀和 《科技通报》2015,(3):202-206
在对K均值算法和图像聚类的蚁群优化算法(ACO)进行对比分析后,本文提出了K均值ACO算法来解决K均值误分类和ACO慢聚敛的问题。K均值ACO算法将K均值的结果当成ACO的启发式信息,如此提高了ACO在蚁群寻找规则方面的光照概率和光照像素,允许蚁群根据信息素集中度而非概率来筛选节点,以致可以在不对ACO的随机搜索质量进行改变的情况下就可以完全获取到启发式信息。对模拟数据和真实数据进行验证后,K均值ACO算法证实可以改善K均值误分类的聚类精确度并提高ACO的收率速度。  相似文献   

17.
文献著者消歧是人名消歧的一种,近年来引起了学术界的广泛关注。其中,文献聚类方法是文献著者消歧的重要方法,但其实验效果往往不佳。基于此,对文本聚类K—means方法进行改进,并在此基础上来实现文献著者消歧。实验结果表明,改进的K—means算法能有效提高文献著者消歧的实验效果。  相似文献   

18.
模糊支持向量机(FSVM)具有很好的抗噪声能力,受到了很多专家的重视。然而模糊支持向量机算法的时间复杂度通常较高。针对这一不足,本文提出了一种基于核聚类的模糊支持向量机算法。首先根据核聚类算法对每一类原始样本进行聚类,然后对每一簇求样本中心,用样本中心作为新的样本点替换该类别的原始样本。最后本文算法利用中心距离型计算新样本的模糊权重,并利用模糊支持向量机算法进行求解。实验充分验证了本文算法相对于传统模糊支持向量机方法具有更快的分类速度。  相似文献   

19.
在深入研究数据挖掘聚类分析算法的基础上,针对传统算法的优缺点,提出一种改进的聚类分析算法——GBKM算法,通过理论分析以及实验证明该算法的有效性和先进性,并将其运用到教学实践中。使用该算法对国家计算机二级模拟考试成绩进行分析,根据分析结果获得学员个性特征,为学员提供有针对性的、个性化的学习指导,在教学实践中具有积极的指导意义。  相似文献   

20.
提出基于图的半监督学习算法,即类别传播算,结合K均值算法改进,用于网页分类。该K均值类别传播方法使用欧式距离的建立带权∈NN图。在这个图中,图节点表示已标记或未标记的网页,边上的权重表示节点的相似度,已标记节点的类别沿着边向邻居节点传播,从而将网页分类问题形式化为类别在图上的传播。结合K均值方法,提高了计算速度以及图方法的归纳能力,经UCI数据集测试,结果表明,此算法比类别传播算法有更好的性能,能够有效地用于半监督网页分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号