推荐算法综述

上传人:小** 文档编号:54770590 上传时间:2018-09-18 格式:PPT 页数:24 大小:4MB
返回 下载 相关 举报
推荐算法综述_第1页
第1页 / 共24页
推荐算法综述_第2页
第2页 / 共24页
推荐算法综述_第3页
第3页 / 共24页
推荐算法综述_第4页
第4页 / 共24页
推荐算法综述_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《推荐算法综述》由会员分享,可在线阅读,更多相关《推荐算法综述(24页珍藏版)》请在金锄头文库上搜索。

1、,推荐算法综述,作者:杨博 赵鹏飞 机构:吉林大学,山西大学学报,主要推荐算法,1、协同过滤推荐算法,2、基于内容的推荐,5、推荐系统的评价准则,3、基于图结构的推荐,4、混合推荐&其他推荐算法,1,协同过滤推荐算法,用户-项目评分矩阵,User-item rating matrix,1,协同过滤推荐算法,1.1,基于记忆的推荐,1.基于用户(user-based)的推荐,根据余弦相似度计算用户间相似度,根据计算出来的相似度估计用户评分:(2.5),1.1,基于记忆的推荐,2.基于项目(item-based)的推荐,根据余弦相似度计算项目间相似度,根据计算出来的相似度估计评分,1.2,基于模型

2、的推荐,采用统计学、机器学习、数据挖掘等方法,根据用户历史数据建立模型,并产生合理推荐。,简单的评分模型:,1.2,基于模型的推荐,1.2,基于模型的推荐,1.基于朴素贝叶斯分类的推荐,朴素贝叶斯分类方法的前提是假设样本的各个属性相互独立,由朴素贝叶斯假设可得:,=,1.2,基于模型的推荐,2.基于线性回归的推荐,线性预测模型:,u=(x1,x2, ,xn)表示用户u对n个项目的评分 p=(a1,a2, ,an)表示评分系数、 m表示偏差,1.2,基于模型的推荐,3.基于马尔科夫决策过程MDP的推荐,借鉴强化学习(reinforcement learning)的思想,把推荐过程建模为MDP最优

3、决策问题,即如何产生一个能最大用户收益的推荐项目列表. 将MDP模型定义为一个4元组(S,A,R,Pr) 推荐过程对应的MDP过程:,1,2,1.2,基于模型的推荐,除以上介绍的方法外,基于模型的协同过滤方法还包括基于聚类的Gibbs抽样方法,概率相关方法和极大熵方法等.基于模型的协同过滤算法能在一定程度上解决基于记忆的推荐算法面临的主要困难,在推荐性能上更优,但通常算法复杂,计算开销大.,2,基于内容的推荐算法,自适应推荐,2,基于内容的推荐算法,1.文本推荐方法,采用TF-IDF方法:,Term Frequency: 词频,Inverse Document Frequency: 逆向文件频

4、率,相似度计算公式:,根据历史信息构造用户偏好文档,计算推荐项目与文档的相似度,将最相似的项目推荐给用户.,2,基于内容的推荐算法,关键词的同义和多义现象导致文档相似度不准确. 提出了潜在语义分析方法(Latent Semantic Analysis,LSA).,2.基于潜在语义分析的推荐(LSA和SVD),LSA方法基于SVD分解:,然后把的r个对角元素的前k个保留(最大的k个), 后面最小的r-k个奇异值置0, 得到k;最后计算一个近似的分解矩阵:,2,基于内容的推荐算法,3.自适应推荐,偏好文档是基于内容推荐的关键.用户的兴趣会随时间动态变化,因此需要及时更新偏好文档. 采用更新用户文档

5、的自适应过滤方法: (1)首先确定用户偏好模型(2)选择合适的阈值进行过滤(3)比较每一次的偏差(4)根据偏差以及阈值调整公式算下一轮的阈值(5)迭代直到取得合适的阈值,2,基于内容的推荐算法,3.自适应推荐,主题向量,特征向量,偏好模板,训练集,相似度阈值,阈值,是否成立,非正例文本,正例文本,特征提取,阈值调整,是,否,3,基于图结构的推荐算法,用户项目矩阵可建模为二部图,节点表示拥护和项目,借鉴动态网络资源分配过程。该方法的推荐过程如下:,建立推荐二部图.,m个项目,n个用户,计算资源分配矩阵W.,a53=1,3,基于图结构的推荐算法,针对指定用户计算各项目的资源分配. fi=(ai1,

6、ai2, ,aim)表示用户i的初始资源分配,由图可知用户y1的初始资源分配:,fi表示用户i的最终资源分配,则有fi= Wfi.用户1的最终资源分配为:,根据最终资源分配从大到小产生除了用户已经偏好项目外的推荐.对用户1推荐项目的排序是:3142=5,4,混合推荐算法&其他推荐算法,混合推荐:为解决以上三种算法各自问题而提出的.,其他推荐:基于关联规则(啤酒-尿布)和基于知识的推荐,5,评价准则,1.平均绝对误差(mean absolute error,MAE) 用于度量推荐算法的估计评分与真实值之间的差异.,2.均方根误差(root mean squared error,RMSE) RMS

7、E是Netflix竞赛(电影推荐)采用的评价准则.RMSE值越小,算法的准确度越高.,5,评价准则,3.查全率(recall) 用于度量推荐列表中是否包含了用户偏好的全部项目.,4.查准率(precision) 用于度量推荐列表中是否都是用户偏好的项目.,Li表示推荐算法为用户i产生的推荐列表, Ri表示测试集中用户i偏好的全部项目.,总结,推荐系统是帮助用户解决信息过载问题的有效工具,已被广泛应用于包括电子商务在内的多个领域.协同过滤、基于内容推荐、基于图结构推荐和混合推荐是目前较为常见的推荐方法.本文综述了相关算法,分析了各自方法的优势与不足,总结了常被采用的推荐算法评价准则.现有的推荐算法仍面临诸多困难,其中数据稀疏、过拟合、可扩展性和多媒体信息特征提取是主要问题。现有的技术和方法都不能从根本上解决这些问题.随着应用领域的不断拓展,推荐系统还会面临新的需求与问题. 针对以上问题的推荐方法研究仍是信息检索、数据挖掘和机器学习等智能信息处理领域的研究热点.,Thank you for your attention!,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号