首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
利用多关键字查询技术可以从大量的实验数据中检索表现突出的数据,Skyline查询是多关键字查询的经典方法之一。在高维空间中,Skyline查询返回的结果集较大,往往没有实际意义。而k-支配Skyline查询虽然可控制结果集的规模,但有可能产生循环支配,导致结果集为空。上述方法都没有考虑用户偏好。在k-支配Skyline查询的基础上,在支配关系中引入用户偏好的优先级,提出了k~*-支配Skyline查询。该查询既可控制结果集的规模,又消除了循环支配的可能性,保证了查询结果集不为空,还能使结果集尽可能满足用户偏好。通过实验,研究并验证了k~*-支配Skyline查询用于实验数据检索系统是可行性的。  相似文献   

2.
逆向Skyline查询能够应用到诸如决策支持、用户偏好支持以及市场行为分析等方面.由于参考对象q的存在,在执行逆向Skyline查询的过程中数据空间被划分成许多分区.然而,存在的算法都没有考虑这个问题的影响,直接使用原始数据集建立索引结构.本文提出了一种新的逆向Skyline查询方法CRSQ,它考虑了这个问题.CRSQ首先根据查询对象q对数据进行聚类,然后建立R-tree索引,最后利用高效修剪策略修剪索引搜索空间.实验结果表明CRSQ算法是有效的,它相对于没有聚类技术的算法获得了50 %以上的性能提高.  相似文献   

3.
为了让智能汽车辨识可行驶区域,道边检测是前提。使用多线激光雷达,通过对大量道边点数据进行分析,提出一种道边检测与跟踪算法。首先,通过分析扫描点特征,建立多阈值筛选算法,提取出有效道边点集;其次,采用基于K-means改进的聚类算法对有效道边点集进行聚类分析,得到左、右两侧的道边点集;最后,使用最小二乘法拟合得到左右道边。经过实际验证,该算法道边检测准确,处理每帧数据平均仅需34ms。  相似文献   

4.
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BLApriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式.  相似文献   

5.
针对经典的Apriori算法需要多次扫描数据库,不适合大规模数据这个问题,提出了一种改进的Apriori算法.该算法采用布尔向量关系运算思想,将事务数据库扫描后转化成压缩矩阵,在MapReduce框架下将压缩矩阵进行分块,每块分别被做并列式处理.利用分压缩矩阵快速计算所有的候选项集,从中产生频繁K-项集,降低了Apriori算法的时间复杂度.  相似文献   

6.
提出一种基于Voronoi图的插值算法,通过采用邻近点查询法找出待插值节点的相关邻近节点,再根据邻近节点构建局部Delaunay三角网,并据此形成局部Voronoi图,将待插值点看成一个虚拟节点更新局部Voronoi图;依据各邻居节点的Voronoi面积和观测值计算出待插值点的预测数据;最后进行模拟实验,验证算法结果。  相似文献   

7.
杨毅 《教育技术导刊》2016,15(5):166-168
通过对Web大数据库的访问,提高数据库的查询和信息调度能力。传统方法采用基于信息流减法聚类和模糊C均值调度的数据库访问算法,对数据库访问过程中的稀疏度均衡能力不好。提出一种基于稀疏度均衡调度的数据库优化访问算法,分析了数据库中海量数据存储结构模型,进行数据融合和冗余信息滤除处理。采用稀疏度均衡调度方法进行特征提取和数据库访问过程中的均衡调度,提高数据查准率。仿真结果表明,利用该算法进行数据库访问的均衡性能较好,数据的查准率和查全率较高。  相似文献   

8.
针对云计算环境下分布式存储系统的数据索引不支持复杂查询的问题,笔者提出了云环境下聚类分解的高维数据混合索引方法.首先,采用聚类分解方法对分割数据建立树状索引;然后,以叶节点为单位,通过扫描线算法来获取节点内部所有对象的局部最近邻结果;最后,依据计算的结果得出启发式的裁剪距离.在单节点最近邻计算中,第二个阶段获取外部的最近邻对象采用范围查询算法.实验分析表明,在查询效率上该索引方法高于单纯的聚类方法.与M-tree、顺序查找、iDisance相比,基于聚类分解的混合索引方法在高维查询模式下具有良好的查询效率和负载均衡.  相似文献   

9.
提出了一种自动化的网格聚类算法GAC。该算法主要采用密度阈值技术提取不同的类,使用边界点处理技术提高聚类精度。GAC算法只要求对数据集进行一遍扫描。实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,在处理多密度聚类方面有很好的精度。  相似文献   

10.
提高元组数目特别大下的不确定数据查询的准确高效特性,采用Top-k查询算法改进设计,通过数据查询操作设计及PT-k查询算法控制集合改进,结果验证有:对城市负荷预测的不确定数据应用预测得出设计算法实现了数据估计及收敛速度快的优点;对java中随机生成的实验数据得出控制集合以外的元组成为查询结果的可能性为0即控制集合较小时,算法优势明显,数据量较大元组更新时对不确定数据查询结果的影响概率明显降低;设计控制集合的方法查询算法远小于现有需要计算的元组方法处理的元组数目。这一研究对于大元组不确定的数据管理具有显著的理论和实践价值。  相似文献   

11.
对基于距离的聚类及基于密度的孤立点检测方法进行了分析研究,提出了一种基于距离和密度的聚类和孤立点检测算法DDBCOD.该算法根据距离和密度阈值对数据进行聚类,并发现数据中的孤立点.实验表明,该算法能够识别任意形状的聚类,对高维数据有效,能够很好的识别出孤立点.  相似文献   

12.
提出了一种基于边表的关系模式的DTD发布方法 .在分析了关系模式和DTD的特征的基础上 ,给出了它们之间的映射规则 .然后 ,给出了基于边表的转换算法 .获取关系数据字典中的关系模式信息和基于边表的转换算法是该方法的 2个关键点 .关系数据模式发布为DTD文档后 ,其他应用就可以利用DTD所包含的结构信息对关系数据进行优化查询 .  相似文献   

13.
The problem of continuously monitoring multiple K-nearest neighbor (K-NN) queries with dynamic object and query dataset is valuable for many location-based applications. A practical method is to partition the data space into grid cells, with both object and query table being indexed by this grid structure, while solving the problem by periodically joining cells of objects with queries having their influence regions intersecting the cells. In the worst case, all cells of objects will be accessed once. Object and query cache strategies are proposed to further reduce the I/O cost. With object cache strategy, queries remaining static in current processing cycle seldom need I/O cost, they can be returned quickly. The main I/O cost comes from moving queries, the query cache strategy is used to restrict their search-regions, which uses current results of queries in the main memory buffer. The queries can share not only the accessing of object pages, but also their influence regions. Theoretical analysis of the expected I/O cost is presented, with the I/O cost being about 40% that of the SEA-CNN method in the experiment results.  相似文献   

14.
针对一种新型的基于社区多角色的结构化P2P网络模型特点,提出了一种新的查询算法,即迭代扩展查询算法。该算法利用反馈机制,将已经返回的结果统计信息反馈到前端查询Q,指导查询Q向外路由的策略。将该算法与Chord网络查询算法进行了分析比较,使用P2Psim进行模拟验证。仿真结果表明,该网络模型性能稳定,资源查询速度快,通信量小,结果优良。  相似文献   

15.
提出了一种新的基于数据流相似查询的sct整合优化算法,解决了数据流系统中数据流序列庞大且速度慢的问题。算法先对数据流进行提取和整合形成相似数据流摘要,然后进行相似性查询。经实验证明算法确实有效,并比传统相似查询算法提高了查询速度和精确率。  相似文献   

16.
文章提出了一种基于粒计算从决策型关系数据集中快速提取关联规则方法,按照属性利用等价类对实体进行分类,利用分类后的属性值来构建粒,提出了基于粒计算提取决策型关系数据库的关联规则算法,来提取关系数据集的关联规则,通过实例来验证该方法的有效性,最后给出了性能分析,并指出基于关系数据集上的粒计算在提取关联规则方面的不足。  相似文献   

17.
最临近支持向量机Proximal SVM(PSVM)是一种有效的、简单的和快速的近似支持向量机方法,识别效果和标准支持向量机相当,相比之下有较少处理时间.虽然有此优点,它的有效性仅仅是针对维数不高、大样本的数据集,而对于上千维甚至上万维的、小样本的人脸数据库情况没有人给出实验结果.文章把PSVM稍做改变,对四个公开的人脸库进行分类.同时采用几种典型的泛化线性鉴别分析(GLDA)方法,对人脸图像预处理.从识别率和所用的处理时间两方面以及用最近邻及最近特征线分类器进行对比,得出具有较好识别效果和处理时间的方法.  相似文献   

18.
基于关系数据库表树的数据结构研究   总被引:1,自引:0,他引:1  
随着关系数据库技术的应用越来越广泛,利用关系表格、关系代数、结构化查询语言等研究基于外存储结构的数据结构有着实际的意义。本文从一个具有树结构的学校管理模型出发,提出一种用关系数据库表来表示树的方法,讨论了如何利用关系代数和SQL语言对表格进行一般查询,借助JaVa语言实现二叉树中比较典型的前序、中序和后序算法,最后对文章开始引出的问题给出了实现程序。  相似文献   

19.
基于内容自动扩展的多示例查询图像检索技术   总被引:1,自引:0,他引:1  
为了缩短基于内容图像检索存在的"语义鸿沟",提出了一种自动扩展的多示例查询技术.该技术将传统检索使用的单一查询图像自动扩展为多个查询示例,从而包含了更多的与语义相关的图像特征.对这些查询示例进行检索,并融合检索结果,可以获得更多相关图像.扩展主要利用了一般检索算法的查准率-查全率曲线特点,对原始查询结果的图像特征距离应用K-均值聚类算法,确定多个查询示例图像.实验结果表明该方法可以显著提高原有检索算法的查全率和查准率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号