共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统相似度忽略用户局部偏好、用户评分差异和非共同评分项等因素的影响,提出了一种基于损失因子和数据集划分的协同过滤推荐算法.算法根据用户对项目的偏好度来划分数据集,并提出用两个修正因子来改进传统的相似度.在MovieLens数据集上将所提算法和Pearson算法、参考文献[1]中的算法进行比较,实验结果表明,基于损失因子和数据集划分的协同过滤推荐算法更明显地降低了MAE值. 相似文献
2.
针对常规有效信息过滤算法对数据间关联规则识别能力较弱等问题,提出物联网环境下大数据流中有效信息过滤算法。该算法根据数据权重向量维度,通过余弦夹角构建目标相似的大数据推荐模型;设置表层关联与隐含关联预测规则,利用预测函数确定数据间的关联程度;按照数据间的衔接性质,将数据集合划分成若干子集,模糊聚类物联网中的有效信息;根据用户主观倾向设置偏好函数,以协同过滤方式,得到有效信息过滤算法。实验结果表明,与常规有效信息过滤算法相比,该算法对数据关联规则识别能力提升 14.97%,满足当前物联网大数据流中对有效数据的过滤要求。 相似文献
3.
user-based协同过滤算法在B2C电子商务中是一种重要的推荐方法,但是用户共同评价项目的稀缺性导致了协同过滤算法质量的下降。鉴于此,在考虑用户评分数据的基础上,对用户评分记录进行聚类平滑。考虑用户购买记录作为数据源之一,并用曼哈顿距离相似度计算方法计算用户购买记录,将两者线性组合得到混合相似度,使用混合相似度进行推荐,通过实验计算两者线性组合的最佳权重系数,比传统的利用用户评分记录和用户购买记录的精确度高。实验结果表明,基于混合相似度的协同过滤推荐能有效提高由于数据稀缺性造成的推荐准确度。 相似文献
4.
数据稀疏是协同过滤预测精度的一个重要影响因素。Slope One算法使用简单的线性回归模型解决该问题,但它只使用评分数据做计算,未考虑相似性。提出一种基于用户习惯偏好相似度的Slope One算法(UPS Slope One)。UPS Slope One首先基于用户习惯偏好聚类,得到三组不同偏好的用户,然后分别计算各组评分偏差,计算时将用户习惯偏好相似度融入其中,最后使用线性回归模型预测评分。在MovieLens数据集上的实验表明,该算法可得到更高的推荐质量、预测准确性和稳定性。 相似文献
5.
基于粗糙集和直觉模糊集理论,提出了研究直觉模糊决策系统的属性约简算法。通过引入基于加权的欧氏距离的相似度和相异度,构造α, β-相似关系,导出α, β-极大一致块,进而构造出直觉模糊决策系统的辨识矩阵,得到基于辨识矩阵的属性约简算法。实例验证表明,该算法在数据存在一定误差的情况下也能得到很好的效果。 相似文献
6.
针对内存数据库集群的数据划分,提出了基于相似度计算的内存数据库数据划分算法。该算法首先根据数据相关性对数据作初步简单划分,然后再基于事务相似度计算,得到最佳事务相似性判断标准,对事务进行相关性合并,进而进一步划分数据,得到合理优化的数据划分结果。算法创新地提出根据Rough集原理计算事务相关性,去除了数据库读写系数的影响,对内存数据库集群的数据划分具有一定指导意义。 相似文献
7.
针对传统协同过滤推荐算法在大数据环境下存在数据稀疏性及计算复杂性等问题,提出一种双向聚类协同过滤推荐算法。该算法首先从用户维度和项目维度两个方向分别进行属性聚类,然后在目标用户和目标项目所在类簇中分别使用改进后的相似度计算方法进行协同过滤推荐,最后通过平衡因子综合预测评分并形成最终推荐列表。在 MovieLens 公开数据集上进行实验,结果表明,该算法(DCF)相比传统协同过滤推荐算法(TCF)、基于用户聚类的协同过滤推荐算法(UCF)以及基于项目聚类的协同过滤推荐算法(ICF),在平均绝对误差上分别降低了 16%、8.1%、7.5%,有效提高了推荐精度。 相似文献
8.
运用图论中的一系列思想对生物序列、蛋白质结构和基因芯片数据进行综合分析,将多物种的序列进行聚类,为生物基因的功能研究提供了新的思路.其算法首先根据生物序列的相似度、蛋白质结构的相似度和基因芯片数据的相似度建立一级图,然后根据一级图建立二级图,进而通过二级图的分析来挖掘基因的聚类关系.算法聚类的结果可以对各种基因的功能进行预测,可广泛应用于后基因组计划的基因和蛋白质研究. 相似文献
9.
10.
遗传负荷的一种定义是:一群体的平均值与某一参考基因型的平均值所差异的部份,常用适合度来表示,而用作参考的基因型常常是各种可能有的基因型中适合度最大的基因型。另一个相似的定义是这样的,一个群体中存在某一因子与另一其余都相同但不存在这一因子的群体其平均值进行比较时,即该群体由于存在这一因子平均值发生变化,这一变化的部分就是遗传负荷。 相似文献
11.
传统协同过滤算法主要根据稀疏的评分矩阵向用户作出推荐,存在推荐质量较差的问题。为此,提出一种基于信息熵的综合项目相似度度量方法。考虑到用户的兴趣会随时间发生变化,而且不同用户群体的兴趣变化不同,受艾宾浩斯记忆遗忘规律启发,提出适应于不同用户群体兴趣变化的数据权重。基于movielens数据集的实验结果表明,改进后算法不仅能缓解评分数据稀疏问题,而且能提高算法的准确率。 相似文献
12.
13.
14.
采用本体概念映射方法,研究概念间相似度计算问题并提出本体图驱动的概念相似度算法。该算法将概念映射到本体结构图上,通过计算概念的语义、结构及属性相似度得到综合相似度。其中,结构相似度通过语义辐射圆计算模型得到,属性相似度通过概念重心向量夹角余弦得到。通过实验对比证明,该算法在一定程度上提高了相似度准确性,为数据挖掘提供了一定依据。 相似文献
15.
16.
针对传统协同过滤推荐算法中存在的数据稀疏性问题,提出了一种基于二分K means的协同过滤推荐算法。该算法在K means算法的基础上,为了降低初始质点选择对聚类结果的影响,在运行中逐个添加质点。首先初始化评分数据并将其作为初始簇,然后选择合适的簇随机产生两个质点将簇分裂为两个簇,重复上述步骤,直到聚类完成。最后为了降低不同用户评分标准差异,将用户评分的平均值和用户同簇内相互间的相似度相结合,计算预测评分矩阵,生成推荐结果。实验结果表明,改进后的算法较好地解决了数据稀疏问题,提高了推荐质量。 相似文献
17.
18.
通过引入广义变精度粗糙集模型,定义了识别对象的相似度和α邻域的概念,建立了不完备信息系统的α-β下近似属性约简算法,有效地删除了属性的冗余信息和降低了噪声数据的干扰,从而得到了基于相似度的不完备信息的识别准则.实验表明,论文所研究的方法具有处理信息缺失多的能力和容错特性,对不完备信息的识别具有较好的准确率和稳定性. 相似文献
19.
王竹婷 《赤峰学院学报(自然科学版)》2014,(20):28-30
协同过滤是个性化推荐系统中使用最为广泛的一种推荐算法之一,分为基于用户和基于项目两种协同过滤算法.本文提出的改进算法将两种方法相结合使用,首先改进了传统的相似度度量方法,再分别利用用户和项目之间的相似度值预测未评分项目值,并将两种预测结果加权平均,根据用户近邻数和项目近邻数动态确定加权系数.实验结果表明,改进后的协同过滤算法可以提高推荐质量. 相似文献
20.
《实验室研究与探索》2015,(9):132-135
针对Web服务组合中相似服务的选择问题,将联系数引入到Web服务选择领域。首先利用层次分析法和离差最大定权法计算Web服务的主观权重和客观权重,并将主观权重与客观权重形成的区间转换成联系数,根据联系数模的几何意义确定主观权重和客观权重相互作用的综合权值。在模拟实验中将灰色关联理论和欧几里得距离结合,并把权重因子引入关联度量化模型中,根据相似度选择Web服务。实例表明了该实验方法的有效性和可行性。 相似文献