您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页一种改进协同过滤推荐算法

一种改进协同过滤推荐算法

来源:爱go旅游网
2014年11月 咸阳师范学院学报 Journal of Xianyang Normal University NOV.2014 Vb1.29 No.6 第29卷第6期 【计算机科学与应用研究】 一种改进协同过滤推荐算法 陈伟,师秦龙 (咸阳师范学院信息工程学院,陕西咸阳712000) 摘要:在传统的协同过滤推荐算法基础上,对传统协同过滤算法中冷门物品不能进行处理问 题进行剖析,提出一种改进的协同过滤推荐算法。通过实验仿真,验证了该算法的有效性。 关键词:电子商务;个性化推荐;协同过滤 中图分类号:TP31 文献标识码: A 文章编号:1672—2914(2014)06—0047—03 An Adaptive Algorithm for Collaborative Filtering Recommendation CHEN Wei,SHI Qin—long (School ofInformation Engineering,Xianyang Normal University,Xianyang 712000,Shaanxi,China) Abstract:This paper describes the traditional system filtering recommendation algorithm based on traditional collaborative filtering algoritm hwhich does not apply to multi--user interest in the prob-・ lem analysis,proposed improved user-based collaborative filtering recommendation algorithm,an im- proved.Through simulation experiments to verify the effectiveness of the algorithm is veriifed. Key words:electronic commerce;personalized recommendation;collaborative filtering recom— mendation; 随着电子商务的普及,网上购物已经成了一种 成功、最广泛的技术。传统的过滤算法是根据相似 普遍的商业模式。在电子商务网站环境下,提供的 用户的行为来对物品进行推荐或者预测。 商品种类日益繁多,从商品和用户的角度来分析推 协同过滤算法需要事先获得用户或物品的特 荐技术,发掘用户所感兴趣的商品,是个性化推荐的 征,它们只依赖于用户过去的行为,以评分的形式收 核心问题。在推荐算法方面,协同过滤算法是应用 集用户对物品的反馈,接着计算用户之间的相似度, 最广泛的个性化推荐技术,基于用户之间的相似性, 然后利用与目标用户相似度较高的邻居对其他物品 即邻居用户产生推荐效果。文献[1]使用奇异值分解 的评价,来预测目标用户对特定物品的喜好程度,最 技术减少特征向量空间的维数,提高最近邻的搜索 后根据这一喜好来对目标用户进行推荐 。协同过 速度。文献[2]对用户最近邻和项采用不同权重的方 滤算法从3个方面考虑:收集用户偏好、相似度计算、 法提高推荐质量。文献[3】提出一种优化的协同过滤 用户推荐。 算法,文献【4]提出基于项目聚类的协同过滤推荐算 (1)收集用户偏好。传统协同过滤技术的推荐 法。本文在聚类协同的基础上,提出一种改进的相 系统中,采用评分数据来表示用户的喜好。评分机 似度计算方法,改善了协同过滤算法的推荐质量。 制分为显性评分和评分两种。显性评分是直接 给项目评分,如百度里面的用户评分。评分就 1传统的协同过滤推荐算法 协同过滤这一概念首次于1992年由Goldberg、 是通过评价或是购买行为给项目评分。如当当网中  Nicols、Oki和Terry提出,应用于Tapestry系统。目 用户对书目的评价。(2)相似度计算。协同过滤算法核心是根据用 前协同过滤推荐算法是个性化推荐技术 中应用最 收稿日期:2014—10—20 基金项目:陕西省大学生创新创业训练项目(1741);成阳师范学院大学生创新创业训练项目(201410722027)。 作者简介:陈 伟(1976-),男,陕西西安市人,成阳师范学院信息工程学院讲师,研究方向为机器学习与大数据。 咸阳师范学院学报 第29卷 户一物品评分矩阵发现需要推荐的目标用户的最近 户对冷门物品采取过同样的行为更能说明他们兴趣 邻,即:对当前用户,要产生相似度较近的邻居组合, 的相似度。 形成新的聚类。相似度的度量方法很多,最常用的 2.2算法设计 (1)收集用户的偏好。在收集用户行为数据时, 有皮尔森相关系数 、余弦相似度 。 皮尔森相关系数,通过Pearson系数公式来计 对数据进行一定的预处理。方法有两种:减噪和归 化。减噪,用户行为数据是用户在使用过程中产 算,主要来衡量两个数值之间的线性关系;余弦相似 可能存在噪音,去除噪音使得数据分析更加精 度,用户评分可看作n维向量空间,用户相似度通过 生的,向量之间的夹角来度量,余弦值越大用户问相似度 确;归一化,将各类数据除以此类中最大值,以保证 一越高。 Pearson相似度计算公式: ∑ ∈ .( ~巧)( 一 ) ’ 其中 是对物品i和 都评过分的用户集合, 是 用户甜对物品i的评分, ,是所有用户对物品i的平 均评分。得到所有物品之间相似度之后,可以通过 简单加权平均预测用户U对物品i的评分,如公式 (2)所示。 P 姿喾塑 — —厶jEK —一 (J(2) 其中K是用户 所有已评分项目中与i最相似的居 个物品的集合。 (3) 用户 和用户 ,N(u)表示用户 曾经有过正反馈 的物品集合,N( )为用户 曾经有过正反馈的物品 集合。 (3)用户推荐。根据相似性最高用户选择的物 品,推荐合适的物品给其他用户。 2改进协同过滤推荐算法 2.1问题分析 传统的协同过滤推荐算法是用邻居对某一物品 的喜好来形成用户对该物品抉择,最近邻用户是和 当前用户相似度最高的用户。考虑两种情况,第一, 最近邻用户和当前用户兴趣爱好不一定与预测的方 面爱好相同,而有可能是其他方面的爱好。如果仍 采用最近邻预测,其误差是一定。第二,两个用户都 买过《新华字典》,不能说明他们兴趣相似,因为绝大 部分人都买《新华字典》。但如果两个用户都买过 《数据挖掘导论》,那可以认为他们兴趣比较相似,只 有研究数据挖掘的人才会买这本书。所以,两个用 归一化后数据取值在【0,l】范围中。 (2)相似度计算。①根据问题分析,在计算相似 度之前,将采用聚类技术按照某种圭臬划分 ,对具 有相似性的评价映射到此类别中,统计参数,计算相 似度。②相似度计算,对余弦相似度计算进行改进, 提高对冷门物品相似性处理。 改进相似度计算公式: 一f∈N(“)nN( )log 1+lN( f4) ~ 、f{N(“ IN l 通过 惩罚了用户 和用户 共同兴趣 列表中热门物品对相似度的影响。 (3)用户推荐。根据用户推荐中的方法来推荐 适合的物品。用户的预测:已知用户 已评分项集 L,则用户11对任意未评价项i的预测是 + ㈦ /"J v61“ 其中P 是用户 对物品的评分预测 ,L是邻居的集 合也就是和用户 最相似的用户的集合。,- 是用户 对物品的评分,而用户 和 之间的相似度记为 。 3实验分析 3.1数据集 实验采用的数据集是来自美国Minnesota大学 GroupLens项目组提供的MovieLens数据集。Mov— ieLens是GroupLens项目组开发的一个基于Web的 研究性推荐系统,用于接收用户对电影的评分并提 供相应的电影推荐列表。 实验从数据库中抽取一部分数据集:200个用户 对857部电影的16 543条评分数据,将评分集转换成 用户一项目评分矩阵。实验中考虑数据集的稀疏等 级,它被定义为用户一评分矩阵中没有被评分的条目 所占的百分比。数据集稀疏等级为: 1—1 6543/(200×857)=0.9035。 3.2实验结果分析 (1)最近邻大小不同下推荐结果比较如表1所 第6期 陈伟,等:一种改进协同过滤推荐算法 ・49・ 表1最近邻大小不同所得测试数据 示,改进的算法的预测效果在区间内都好于传统协 同过滤算法。 (2)改进协同过滤算法与传统协同过滤比较如 表2所示,通过以上数据分析,说明在计算用户兴趣 相似度时考虑物品的流行度对提升推荐结果确实有 帮助。 表2传统算法与改进算法比较 4结论 个性化推荐系统是新兴的重点研究领域,随着 用户需求的提高,推荐算法的研究不断完善和发 展。本文提出基于改进的协同过滤算法考虑了分类 用户,以及冷门兴趣的相似性对推荐结论的影响,改 善了协同过滤推荐算法的质量。目前推荐系统已经 向混合型推荐、以及社交网络的推荐方面提出了新 的需求,更需要新的技术来推动推荐系统的发展。 参考文献: 【1]Zhou Tao,Jiang Luoluo,Su Riqi,et a1.Effect of iniital con= figuration on network-based recommendation[3].Europhsics Letters,2011,81(5):285-293. [2]Liu Jianguo,Zhou Tao,Wang Binghong,et a1.Highly accurate recommendation algorithm based on hiigh・order similariites [J】.PhysicaA,2012,389(8):881—886. 【3】周军锋,汤显,郭景峰.一种优化的系统过滤推荐算法[J]. 计算机研究与发展,2004,41(10):1943—1947. 【4】洪雪飞,徐维祥.基于粗糙集的决策树推荐算法【J】计算机 工程与应用,2009,45(13):163-165. [5】刘建国,周涛.个性化推荐系统的研究进展[J].自然科学 进展,2009,19(1):1一l5. [6]Takacs G.,Pilaszy I,Bottyan N,et a1.Major components of hte gravity recommendation system[C].SIGKDD Explor. Newsl,2007(9):80-83. 【7]Resnick Iacovou N,Suchak M,et a1.Groupslens:An open architecture for collaborative ifltering of netnews[C].In Pro. ceedings of ACM 1994 Conference on Computer Supported Cooperative Work,ACM,Chapel Hill,North Caroline,1994: 175-186. [8]Linden G D,Smith B,York J.Amazon.com recommendations: item—to-item collaborative ifltering[J].IEEE Intemet Comput- ing,2003,7(1):76-80. [9】邢春晓,高凤荣,战思南,等.适应用户兴趣变化的协同过滤 推荐算.法【J】.计算机研究与发展,2007,44(2):296—301. [1O】王太雷.个性化推荐系统相似模式聚类研究【J】.计算机工 程,2010。5(6):l53-157. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务