首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
提出了一种基于核的聚类方法,增加对样本特征的优化;通过核函数,把数据样本空间映射到一个高维的特征空间;在特征空间对数据样本进行k-中心点聚类,并通过计算类内距离作为适应度准则,取其最优的结果。通过Web日志挖掘中的Web客户聚类应用比较,表明核聚类方法在性能上比经典的聚类算法有较大的改进,从而实现更为准确的聚类。  相似文献   

2.
针对Web挖掘,首先论述了Web挖掘的基本理论,接着分析数据挖掘中的聚类算法,讨论了聚类分析的数据结构和数据类型,以及聚类算法的分类,详细介绍了数据挖掘中用到的主要聚类算法,最后对评价聚类结果的方法进行了分析。  相似文献   

3.
通过实例阐述了使用Google SOAP Search API在智能知识服务平台中实现信息搜索功能的关键技术。  相似文献   

4.
发现用户对网站的兴趣是Web挖掘的一个重要研究方向.根据用户的访问序列进行聚类分析,把用户归为不同的簇,可以给不同簇的用户提供个性化的服务,改善网站的组织结构,提高广告的投放效果.  相似文献   

5.
介绍了一种用来开发Web服务的技术——AxisC ;结合实际项目,在Linux操作系统下利用AxisC 构建、开发和部署了一个具有文件管理功能的Web服务。  相似文献   

6.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

7.
Web使用模式挖掘是从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化的服务。尽管Web日志挖掘是一些数据挖掘算法的应用,但不是简单地将数据挖掘算法修改为适用于新的数据类型,其中涉及许多处理工作。试从偏离网页的去除、使用者浏览路径相似程度的计算,对使用者浏览路径的模糊聚类的分析三个方面论述FC—MDE模糊聚类的Web用户模式挖掘。  相似文献   

8.
通过分析OWL-S的特点及传统的服务发现发布规范UDDI的缺点,介绍了能够更高效率、更准确的发现目标服务,如何在语义Web服务发现框架中使用OWL-S添加语义信息,以及OWL-S在语义Web服务发现框架中所起的作用。  相似文献   

9.
对数据挖掘领域中常用聚类算法进行了阐述,并对其优缺点进行了分析,指出各自的特点,以便于人们更快、更容易地选择一种聚类算法解决特定问题。  相似文献   

10.
从Web服务器日志文件和客户交易数据中挖掘出有意义的用户访问模式和潜在的客户群,使为企业提供全方位信息服务和开展有针对性的电子商务活动。该文分析了Web使用挖掘技术,阐述了挖掘数据的过程并提出了Web使用挖掘技术在电子商务中的作用。  相似文献   

11.
MapReduce是一种编程模型,这种编程模型编程简单,不必关心底层实现细节,可用于大规模数据集的并行计算。K-Means是一种简单、基本的数据挖掘聚类方法,它将对象组织成多个互斥的组或簇。针对K Means的特点,给出了MapReduce编程模型下K Means的实现方法。实验结果表明,MapReduce编程模型下的K Means算法部署在Hadoop集群上运行具有较好的性能。  相似文献   

12.
K-Means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-Means算法的局限性日益突出。基于网格划分的思想,提出了一种基于网格的K-Means聚类算法,该算法使用了网格技术在一定程度上去除了孤立点和噪声数据,减少了原始K-Means算法将大的聚类分开的可能。实验表明,该算法能处理任意形状和大小的聚类,对孤立点和噪声数据也能很好地识别,并且在去除孤立点和噪声数据方面可以达到较好的精度。  相似文献   

13.
随着宏基因组学的不断发展,揭示了微生物菌群在研究中的重要作用。采用K-Means聚类算法对来源于北平顶猴阴道微生物群落OTUs数据集的27个样本进行研究,并与PCA主成分分析法进行对比。K-Means聚类将OTUs数据集分成4个Cluster,而PCA将OTUs数据集划分成5个Cluster。此外,结合样本的元数据-pH,发现样本间的pH值相似性更能与K-Means聚类的分类保持一致。相较于PCA主成分析方法,K-Means聚类能更精确地对OTUs数据集进行分类。  相似文献   

14.
15.
在分析数据处理的意义基础上,提出了一种基于模糊聚类的数据处理方法。该方法不依赖于任何数学模型,通过对大量数据仿真处理,研究表明本文提出的方法能在保留原始数据的有用信息的基础上剔除冗余数据,侦破过失误差,减少随机误差。  相似文献   

16.
智能小区信息服务系统是小区住户获得全面、周到、快捷的信息服务的平台.本文以Web服务技术为基础,研究了如何应用Web服务技术实现智能化小区信息服务系统与服务提供商应用系统的集成,提高系统的可扩展性.  相似文献   

17.
Web服务组合是web服务发展的一种新的方向,而Petri网作为形式化的建模工具,在服务组合中扮演着重要角色,不仅可以辅助服务组合的设计,还可以更好地对组合流程进行分析和验证。文章对各种Petri网在基于工作流、人工智能(AJ)的Web服务组合中的应用以及基于Petri网的Web服务形式化组合方法进行了综述,并指出了Petri网在服务组合工作中的作用和重要性。最后对研究进行了总结,指出了下一步的工作。  相似文献   

18.
Web数据挖掘在搜索引擎中的应用   总被引:1,自引:0,他引:1  
分析了搜索引擎的结构组成,从Web的结构挖掘、内容挖掘、使用挖掘3方面对Web挖掘在搜索引擎中的应用进行阐述。  相似文献   

19.
首先分析了当前工作流系统存在的不足,然后探讨了Web服务技术原理和架构,在Web服务相关技术和标准中分别论述Web服务技术的4个主要组成部分:XML、SOAP、WSDL和UDDI的技术原理及特点。着重研究了如何借鉴最新的Web服务工作流技术,来构筑一个基于Web服务架构的可扩展性好、性能高、能适应大吞吐量的工作流管理系统体系结构。  相似文献   

20.
随着网络的快速发展,入侵检测系统生成的告警信息越来越多,聚类技术广泛的应用于处理告警信息.针对传统的K-Means算法易陷入局部最优,提出一种改进半监督聚类算法ISC.从数据集中抽取若干正常与异常样本分别采用层次聚类算法分别计算作为初始质心辅助K-Means算法进行聚类.实验结果表明,与现有相关算法相比,该算法具有更高的攻击检测率以及更低的误报率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号