首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 90 毫秒
1.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。  相似文献   

2.
本文提出了一种基于相似度聚类与免疫危险理论的入侵检测方法.该方法将相似度聚类分析方法应用在入侵检测的分类器产生阶段,既生成了用于免疫算法的检测器,又过滤了正常数据,减少了需检测的数据量,改进了检测方法,提高了系统的检测效率和检测能力.  相似文献   

3.
4.
提出了一种基于减法聚类的聚类上限检测方法.仿真试验表明,这种方法能将聚类上限确定在一个合理的范围之内,从而加快聚类的效率.  相似文献   

5.
针对上市公司的基本面情况分析,构建了较为全面的综合评价指标体系. 定义了上市公司股票间"相似程度"的一种度量,基于该度量提出了一种新的层次聚类算法对样本股票进行聚类,然后通过聚类结果来分析投资价值确定投资品种或范围. 最后,选取上证30指数27家上市公司股票进行实证研究,结果表明所提聚类方法对指导证券投资是实用有效的.  相似文献   

6.
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意.论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)聚类算法HTSC.对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证.该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息.  相似文献   

7.
提出一种新颖的基于谱聚类的音频聚类算法,首先对音频数据进行预处理,得到三维音频向量,然后根据向量之间的距离计算音频相似度,最后设计谱聚类算法获得音频数据聚类结果。在网易云音乐数据上的对比实验表明,与K means算法和快速查找密度峰值聚类算法相比,该算法获得的聚类结果更加优越。  相似文献   

8.
提出一种基于贪心随机自适应搜索过程的聚类算法.该算法先根据密度概念构造一个约束候选列表,然后从列表中随机选取k个对象作为K均值算法的k个起始中心点.试验结果表明该算法的聚类结果比k均值算法有显著改进.  相似文献   

9.
一种基于超级链接结构的WWW模糊聚类算法   总被引:2,自引:0,他引:2  
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)矣类算法HTSC。对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息。  相似文献   

10.
针对高维空间数据,提出一种基于超图模式的数据聚类方法,即把给定的高维空间中的原始数据映射到一个带权超图中,再对超图应用算法对顶点进行划分,从而得到相应数据项的聚类。  相似文献   

11.
结合XML文档树结构提出了一种基于节点相对路径的模式抽取算法,通过使用SAX解析器对XML文档进行一遍扫描,提取出XML文档节点及其相对路径来实现XML文档模式的抽取,该算法有效地解决了XML文档中存在的环路及缺边问题,计算结果模式的代价较低,效率较高.  相似文献   

12.
基于关系模式的XML数据存储技术研究   总被引:2,自引:0,他引:2  
XML数据具有自描述性和半结构化特征,所以在数据库、网络等许多方面都有良好的应用前景.本文讨论了如何利用关系模式来映射XML模式以在XML的文档数据结构和底层的存储结构间进行转换,从而在关系数据库中存取XML数据的技术;同时进行了初步应用.  相似文献   

13.
胡凯 《德州学院学报》2005,21(6):72-75,92
在介绍XML技术及Schema文档的特点基础上,着重探讨了XML模式与关系模式间数据转换的具体实现.  相似文献   

14.
XML已成为互联网上数据表示和数据交流的新标准,随着XML数据的日益增多,关于XML数据的存储方式受到了广泛的关注.对现有的存储方法进行概述,着重论述基于关系数据库的XML数据存储方式,对各种方案的查询性能进行了比较,并得出最优方案,以期用来指导实践.  相似文献   

15.
《宜宾学院学报》2015,(12):56-60
在灰色聚类分析法的基础上,改进传统的白化权函数,并对聚类后的评价对象进行排序,进而构建一个聚类后排序的灰色聚类评价方法.新的评价方法不仅可以对评价对象进行聚类,而且对同一灰类的评价对象进行排序,较好地解决了聚类对象的聚类和排序问题.引用图书馆员实际数据分析说明,构建的灰色聚类评价方法能够有效避免图书馆员工作评价的盲目性,为图书馆员的选拔、聘任和评价提供量化依据.  相似文献   

16.
针对地震数据环境下如何进行信息资源建设、实现信息资源共享的问题,从面向对象的角度出发将UML与XML Schema结合起来,提出一种使用UML建模创建XML Schema元数据的方法。并通过XML Schema模式向关系模式的映射来存储XML元数据。文中对地震信息元数据XML Schema的建立进行了详细阐述,对UML如何转换XMLSchmea进行了深入研究。应用实例表明,基于XML Schema存储映射策略能够完整地将XML地震信息元数据存储于关系数据库中,有效地实现了关系模式下XML地震信息元数据的存取。  相似文献   

17.
郝伟 《滁州师专学报》2013,(5):47-49,58
XM L技术广泛应用于数据库和在网络传输。但是XM L主要适用于文本数据,所以对于图形数据一般是分开传输的,从而改变了传输的统一性。本文提出了一种简单高效的图像转换的方法,从而实现了图像在XM L中的传输。  相似文献   

18.
互联网的广泛应用使Web数据挖掘成为当前数据挖掘研究的热点,而Web数据的结构却使对其所进行的数据控制十分复杂,XML的出现为Web数据挖掘技术提供了一个很好的入口。本文分析了XML文档的数据结构,提出一种经由HTML文档转换成XHTML并最终由XSL所决定的XML文档的Web数据挖掘模式。  相似文献   

19.
Web使用模式挖掘是从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化的服务。尽管Web日志挖掘是一些数据挖掘算法的应用,但不是简单地将数据挖掘算法修改为适用于新的数据类型,其中涉及许多处理工作。试从偏离网页的去除、使用者浏览路径相似程度的计算,对使用者浏览路径的模糊聚类的分析三个方面论述FC—MDE模糊聚类的Web用户模式挖掘。  相似文献   

20.
为了将大量的数据以关系数据库的形式存储和保存,将这些关系数据转换成XML文档,给出一个基于查询的关系模式到XML模式转换的有效算法。通过分析数据值基数和用户查询模式,采用列间的相等合并的方式,解决隐式参照完整性问题,最终结果用XML Schema表示。此算法能够避免关系模式转换成错误的XML Schema,并且能够全面有效地表达关系模式中的信息,实现有效信息的充分利用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号