首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
聚类分析是数据挖掘和机器学习的一个重要分支,应用范围广,但在聚类分析过程中大量敏感信息的泄露对用户构成威胁。因此,在聚类分析过程中实现隐私保护至关重要。传统基于差分隐私(DP)的k-means聚类算法由于存在盲目选择初始中心点、对异常点敏感度较高等问题,导致在保护数据隐私时,出现聚类可用性较低的情况。针对该问题提出一种改进的基于差分隐私保护的(IDP)k-means聚类算法以提高聚类可用性,并进行理论分析和对比实验。理论分析表明,该算法满足ε-差分隐私;仿真实验结果表明,在同一隐私预算下,k-means算法改进后在聚类可用性上优于其它差分隐私k-means聚类算法,在同一数据集与同一隐私参数下,改进k-means算法在数据可用性方面比传统算法提高了将近5个百分点。  相似文献   

2.
通信技术和数据挖掘技术的发展,使隐私数据保护面临巨大挑战。为解决位置大数据服务的恶意访问泄露个人敏感信息问题,提出一种新的防止基于背景知识攻击的差分隐私保护模型。首先对位置大数据进行预处理,将位置数据和非位置数据分开,然后运用差分隐私机制分别添加噪声,对扰动后的数据匿名重组后发布。实验结果表明,该方法能有效减少攻击者获取相关敏感数据,保护了用户位置隐私安全。  相似文献   

3.
针对虹膜数据在发布后可被攻击者利用并获得用户隐私的问题,提出了一种基于随机映射与差分隐私的虹膜数据发布隐私保护方法。该方法利用随机映射对发布虹膜数据进行模板处理,然后对注册过程中建立的模板添加噪声,使其满足差分隐私,进一步提高发布数据的隐私保护程度。最后,通过安全性分析及在模拟环境下的实验,进一步证实了所提出方法的安全性和有效性。  相似文献   

4.
为解决k-means聚类算法在聚类过程中隐私泄露风险,在满足ε-差分隐私保护前提下,提出一种隐私保护的RDPk-means聚类方法。该方法与传统随机选取初始点方式不同,采取基于网格密度的方式选取初始聚类中心,并在UCI数据集中进行有效性验证。采用543条数据生成2个聚类簇和19 020条数据生成3个聚类簇分别进行实验。结果表明,该聚类方法在不同的数据规模和维数情况下可以很好地保护数据隐私,能保证聚类结果的可用性。  相似文献   

5.
利用层次方法的平衡迭代规约和聚类(BIRCH)算法是层次聚类算法的一种,也是机器学习算法的一种.随着机器学习的日益发展,在机器学习中如何保护隐私成为目前研究的热点问题.差分隐私是数据分析保护中的新技术,其特点之一是数据在被不同的参数处理后具有可比较性.针对机器学习中的隐私泄露现象,提出面向差分隐私的BIRCH算法(DP...  相似文献   

6.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

7.
通过分析目前的聚类算法,提出了多隶属聚类的概念;提出了一种基于频繁项目集的多隶属聚类算法,该算法能产生事务型数据的多隶属聚类。  相似文献   

8.
差分隐私保护是Dwork提出的基于数据失真技术的一种新的隐私保护模型,由于其克服了传统隐私保护需要背景知识假设和无法定量分析隐私保护水平的缺点,近年来迅速成为隐私保护领域研究热点。PINQ是最早实现差分隐私保护的交互型原型系统。介绍了差分隐私保护相关理论基础,分析了PINQ框架的实现机制。以PINQ中差分隐私保护下K means聚类实现为例,研究了差分隐私在聚类中的应用。仿真实验表明,在不同的隐私预算下,实现的隐私保护级别也不同。  相似文献   

9.
《现代教育技术》2019,(5):99-105
如何降低学习隐私的泄露风险,是在线学习面临的一个亟待解决的问题。文章首先揭露了基于学习资源学习热度的推荐系统的形成与隐私泄露风险问题;针对此问题,文章基于差分隐私保护理论,提出了差分隐私保护的学习资源学习热度推荐方案,即对学习资源推荐值进行差分隐私保护处理后再发布结果;最后,文章通过问卷统计分析和实验对比分析,验证了差分隐私保护的学习资源学习热度推荐效果。差分隐私保护的学习资源学习热度推荐的运用,既能保护学习者的学习隐私,又能保留较高的数据可用性,有利于促进在线学习的安全、健康发展。  相似文献   

10.
传统欠采样方法在处理不平衡数据问题时只考虑多数类样本的绝对位置而忽略了其相对位置,从而使产生的平衡数据集存在边界模糊问题。提出一种改进 K 均值聚类的不平衡数据欠采样算法(UD-PK)。该算法首先利用改进的 PSO 算法迭代寻找全局最优解作为 K-means 聚类所需初始值,然后通过 K-means 进行聚类,再按照每个类别中多数类与少数类的比例定义所取多数类样本个数,并根据多数类样本与簇心距离择优选择参与平衡数据集构造。在 UCI 数据集上的对比试验表明,该算法在少数类准确率上较一些经典算法有很大提升。  相似文献   

11.
提出了1种基于差分隐私保护的TopN协同过滤推荐算法—DP-TopN算法,使用Laplace噪音机制分别对推荐过程的数据预处理部分和用户评分部分进行随机扰动,并对推荐算法步骤进行调整,使得整个推荐过程满足差分隐私模型,从而达到保护用户隐私安全的目的。通过在真实数据集上进行的实验和理论分析表明,所提算法能在满足精确推荐的同时有效地保护用户的个人隐私。  相似文献   

12.
当前,教育信息化正处于高速发展时期,教育数据隐私风险不容忽视。为有效保护教育数据隐私,文章采用系统文献分析法,首先从研究时间、研究主题两个维度梳理了教育数据隐私保护研究的发展历程,随后揭示了智能校园、智能虚拟教学空间、教育大数据平台三大教育信息化应用场景中存在的教育数据隐私保护问题,最后针对这些问题提出教育数据隐私保护的技术支持方案。该方案提供隐私泄露行为监测、隐私保护分级分类两大功能,整合3种模型训练方式与9种隐私保护技术进行三级隐私保护,可实现不同教育应用场景下模型训练方式与隐私保护技术的个性化配置,从而全场景保护教育数据隐私,促进教育信息化安全、健康发展。  相似文献   

13.
针对差分演化算法中的变异因子和交叉概率难确定的问题,设计一种基于均匀分布的自适应差分演化算法.在该算法中,变异因子和交叉概率是在某区间上服从均匀分布的随机数,随着演化的进行,该区间的长度将会根据前些代的演化经验自动调整.数值试验表明了该算法的有效性和稳健性.  相似文献   

14.
对多个相互冲突的目标同时优化称作多目标优化问题,为解决多目标问题,多目标进化算法应运而生.在进化算法迭代过程中,算法使用恒定不变的交叉因子和变异因子,这显然不符合种群迭代进化特征,所以需要根据种群初始和种群后期解的收敛情况来定向调整种群进化方向.同时,在采用边界与交叉的聚合算法时,θ支配的聚类算法只参考了解到权重向量的...  相似文献   

15.
针对近年来基于网格和密度的数据聚类算法均需要先验知识确定聚类相关参数的问题,提出了基于动态网格和密度邻接的数据聚类算法。该算法首先分析数据集的特征,确定网格单元的初始值,通过定义全局距离度量函数,对网格单元进行2-1动态递减迭代,最后得到全局最优聚类。实验结果证明:使用该算法对数据进行聚类,能够获得直觉上的最优聚类结果。将该算法应用到对GPS信息聚类中,也得到较为理想的效果。  相似文献   

16.
在使用Delphi进行数据库管理系统的开发过程中,数据集是必须而且经常大量用到的.创建数据集的类将减少代码冗余,使程序更具模块化、易于维护.本提出创建数据集类的思路,并就数据集类中的方法定义进行了研究和讨论.  相似文献   

17.
文本聚类是聚类方法的一个重要应用,是近年研究热点。对文本聚类定义、流程、相关问题进行了阐述,对其主要算法及应用领域进行了详细介绍。  相似文献   

18.
学生数据是教育数据的重要组成部分,在支撑教育决策、改进课堂管理、推送个性化路径等方面得到了广泛应用。然而,实践中出现了很多侵害学生数据隐私的问题,造成了不良社会影响,急需政府从立法层面加强保护。在此领域,欧美发达国家已经有数十年的经验,法律和制度都较为健全。针对美国和欧盟学生数据隐私保护立法和实践情况的分析发现,欧美已经建立了相对全面的学生数据隐私保护法律体系,形成了较为完善的隐私保护框架原则,其强调行业自律、全民参与的经验值得借鉴。但是也暴露出一些问题,例如,法律仍旧滞后于实践的需要,数据所有权不明确、处理过程不规范,学生、监护人及其他相关方的数据隐私保护意识薄弱,隐私保护和开放教育数据、学习分析之间存在矛盾等。我国尚处于数据隐私保护的起步阶段,应在汲取欧美国家的经验与教训基础上,提高认识,切实增强全民的法律意识;加快立法,尽快建立完善相关法律制度;加强行业自律,规范市场行为;营造隐私保护的社会大环境,构建多方参与的治理体系。  相似文献   

19.
物流配送路径的合理性较差会导致实际配送的成本和效率难以得到有效控制,为此,开展了基于自适应遗传聚类算法的物流越库配送仿真研究。结合物流公司和用户对物流配送的要求,将配送路程、配送时间以及配送成本问题统一为配送路径总成本问题,将基础运输成本和运输拥堵成本最小化作为规划目标。利用采用了自适应遗传聚类算法的路径进行规划阶段,将运输时间和运输成本平衡关系作为适应度函数,根据车辆的货载上限,对处于同一不重复路径上的目标配送点进行聚类处理,直至聚类覆盖所有节点。测试结果表明,对应配送路径的时间开销和成本开销均明显降低,配送过程中的重复行程也稳定在11.50%以内。  相似文献   

20.
一种改进的自适应差分演化算法   总被引:1,自引:0,他引:1  
差分演化是一种简单、有效的全局数值优化算法,相关研究表明,参数的自适应能够有效提高算法的性能.提出了一种集成的混合参数自适应差分演化算法,并巧妙利用一种自适应选择机制来选择算法池中的算法,通过对25个国际标准测试函数进行测试,实验结果表明,该方法在最优解质量、稳定性、收敛速度优于其它被比较的算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号