电影推荐系统

上传人:桔**** 文档编号:557773735 上传时间:2023-06-29 格式:DOCX 页数:12 大小:183.04KB
返回 下载 相关 举报
电影推荐系统_第1页
第1页 / 共12页
电影推荐系统_第2页
第2页 / 共12页
电影推荐系统_第3页
第3页 / 共12页
电影推荐系统_第4页
第4页 / 共12页
电影推荐系统_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《电影推荐系统》由会员分享,可在线阅读,更多相关《电影推荐系统(12页珍藏版)》请在金锄头文库上搜索。

1、基于 Slope one 算法的电影推荐系统摘要:商业网站迅猛发展的时代已经到来,网上服务的交易方式正在改变 着传统的商业模式。如果说过去的十年是搜索技术高速发展的十年,那么个性化 推荐技术将作为下一个十年中最为重要的革新之一。目前几乎所有大型的商业网 站,如亚马逊、淘宝网等,都不同程度地使用了各种形式的推荐系统。本文就推 荐系统这一话题展开讨论,首先介绍了推荐系统的提出和发展过程,然后列举出 了几种推荐系统的研究方法,其中,详细的描述了 Slope one算法推荐系统的实 现过程以及用Slope one算法编写程序完成了电影推荐系统。最后列举了几个推 荐系统的实例。关键字: Slope on

2、e 算法 推荐系统 数据挖掘 个性化推荐一、 发展背景:随着 Internet 的日益普及,商业网站的蓬勃发展,如何提高商业网站的有效 性,尤其是如何运用个性化推荐技术提供个性化服务来实现已逐渐成为一个能 引起广泛兴趣的热点课题。虽然商业网站从“以站点为中心”向“以用户为中 心”发展成为必然趋势。但目前国内大多数商业网站的商品推荐通常是:推荐 热销产品;推荐相关产品;依据用户浏览历史的信息进行推荐。由 Daniel Lemire 教授在2005年提出的一个Item-Based (基于条目)推荐算法,可应用于各类 以网上商品销售为主业务的网上商店,以及提供文章、新闻、音乐、电影等“无 形”的产品

3、的网络站点。用于帮助商店经营者,网络站点从事产品的个性化推 荐,提高营销及服务质量,更好地挖掘潜在客户及客户的使用、购买潜能。同 时也根据用户的喜好,网站会留下记录,当用户再次访问时,网站会推荐用户 可能喜欢的东西,这样也方便了用户,用户无需浪费时间去搜索大量的信息。二、 现有推荐系统研究方法:1、基于内容的推荐:基于内容的推荐(content-based recommendation)是指根据用户选择的对象, 推荐其他类似属性的对象作为推荐,属于 Schafer 划分中的 Item-to-Item Correlation 方法.这类算法源于一般的信息检索方法.不需要依据用户对对象的 评价意见

4、.对象使用通过特征提取方法得到的对象内容特征来表示 ,系统基于用 户所评价对象的特征,学习用户的兴趣,从而考察用户资料与待预测项目相匹配的程度.对象内容特征(Content(s)啲选取在目前的研究中以对象的文字描述为主,比如信 息检索中最经典的文本特征是词频-倒排文档频率(term frequency-inverse document frequency, 简 称 TF-IDF). 另 一 方 面 , 用 户 的 资 料 模 型 Con te ntBasedProfile(c)取决于所用机器学习方法,常用的有决策树、贝叶斯分类算 法、神经网络、基于向量的表示方法等,数据挖掘领域的众多算法都可以

5、应用.2、协同过滤推荐协同过滤推荐(collaborative filtering recommendation)技术是推荐系统 中最为成功的技术之一,它于 20世纪 90年代开始研究并促进了整个推荐系统 研究的繁荣.大量论文和研究都属于这个类别.协同过滤的基本思想是:找到与当前用户ccur相似(比如兴趣和口味相似的 其他用户cj,计算对象s对于用户的效用值u(cj,s),利用效用值对所有s进行 排序或者加权等操作,找到最适合ccur的对象s*.其基本思想非常易于 理解, 在日常生活中,我们往往会利用好朋友的推荐来进行一些选择.协同过滤正是 把这一思想运用到推荐系统中来,即基于其他用户对某一内

6、容的评价向目标用户 进行推荐.基于协同过滤的推荐系统可以说是从用户的角度进行推荐的,并且是自动的, 也就是说,用户所获得的推荐是系统从用户购买或浏览等行为中隐式获得的,不 需要用户主动去查找适合自己兴趣的推荐信息,如填写一些调查表格等.其另外 一个优点是对推荐对象没有特殊的要求(而基于内容的推荐需要对推荐对象进行 特征分析),能够处理非结构化的复杂对象,如音乐、电影等.同时,研究用户之间 的关系需要大量的用户访问行为的历史数据,与社会网络研究有交叉点,有丰富 的研究基础和广阔的前景.对协同过滤最早的研究有Grundy system,后来的 研究成果包括 Tapestry system, Gro

7、upLens, Ringo, PHOAKS system, Jester system等.总体而言,此类推荐算法可以分为两类:启发式(heuristic-based or memory-based)方法和基于模型(model-based)的方法。3、基于知识的推荐:基于知识的推荐(knowledge-based recommenda tion)在某种程度上可以看 成是一种推理(inference)技术.它不是建立在用户需要和偏好基础上推荐的,而 是利用针对特定领域制定规则(rule)来进行基于规则和实例的推理(case-based reasoning) 例如,文献34中利用饭店的菜式方面的效用

8、知识,推荐饭店给顾客. 效用知识(func tional knowledge)是一种关于一个对象如何满足某一特定用户 的知识,因而能够解释需求和推荐的关系,用于推荐系统.效用知识在推荐系统中 必须以机器可读的方式存在(ontology本体知识库),例如quickstep and fox trot sys tems使用关于学术论文主题的ont olog y本体知识库向读者作推荐.4、Slope one算法推荐:Slope One是一系列应用于 协同过滤的算法的统称。由Daniel Lemire 和Anna Maclachlan于2005年发表的论文中提出。有争议的是,该算法堪称基 于项目评价的n

9、on-trivial协同过滤算法最简洁的形式。该系列算法的简洁特 性使它们的实现简单而高效,而且其精确度与其它复杂费时的算法相比也不相上 下。该系列算法也被用来改进其它算法。当可以对一些项目评分的时候,比如 人们可以对一些东西给出1到5星的评价的时候,协同过滤意图基于一个个体过 去对某些项目的评分和(庞大的)由其他用户的评价构成的数据库,来预测该用 户对未评价项目的评分。 如:如果一个人给披头士的评分为5 (总分5)的话, 我们能否预测他对席琳狄翁新专辑的评分呢?这种情形下,item-based协同过滤系统 根据其它项目的评分来预测项目 的分值,一般方法为线性回归 - 1,;).于是,需要列出

10、xV个线性 回归方程和回归量,例如:当有1000个项目时,需要列多达1,000,000个线性 回归方程,以及多达2,000,000个回归量。除非我们只选择某些用户共同评价 过的项目对,否则协同过滤会遇到过适(过拟合)问题。三、Slope one算法描述及实现过程:1、算法原型:图例一(如图3-1所示):/r1ItemAItemBUserA加43UserB2?LJ图3-1算法演示图如上图所示,UserA对ItemA的评分是4,对ItemB的评分是3, UserB对ItemA 的评分是2,那么,预测UserB对ItemB的评分是多少呢?根据 Slope One 算法,2+(34)=1。图例二(如图

11、3-2所示):JItemAItemBLUserA43JUserB29B)表示这N位用户对A和对B打分的平均差(A-B),有 M位 用户对条目B和条目C打分了,R (C-B)表示这M位用户对C和对B打 分的平均差(C-B),注意都是平均差而不是平方差,现在某个用户对A的打分 是ra,对C的打分是rc,那么A对B的打分可能是:N x (ra - R(A - 巧)+ M X (rc - R(C - B)rb=汀*上面讨论的是用户只对条目的喜好程度打分。还有一种情况下用户也可以对 条目的厌恶程度打分。这时可以使用双极Slope One算法(BI-Polar Slope One)。四、实验结果:测试数据

12、movielens均方根RMSE=0.9474 45分以上推荐正确率:卢一强:北京遇上西雅图李长月猩球崛起燕睿涛:北京遇上西雅图李长月听风者龚志鑫:北京遇上西雅图燕睿涛肖申克的救赎刘璐:北京遇上西雅图刘思遥肖申克的救赎李长月:北京遇上西雅图孙召星肖申克的救赎龚志鑫:少年派燕睿涛泰坦尼克号卢一强:速度与激情5汤瑶:泰坦尼克号刘璐:速度与激情5刘思遥:泰坦尼克号刘璐:猩球崛起注释:此数据代表按照自己和别人的评分推荐的电影致 青 春北 京 遇 上 西 雅 图人 再 囧 途 之 泰 囧少年派的奇幻漂流黑八、衣 人白 鹿 原次 曝 光速 度 与 激 情 五泰 迪 能八、功夫熊猫源代码猩 球 崛 起失恋 心、十天志 明 与 春 娇听风者这 个 杀 手 不 太 冷肖 申 克 的 救 赎大话西游泰坦尼克号卢04.000004.03.0000000000*219强32燕八、3.4.003.2.2.03.00003.005.004.睿822563849涛861945357龚04.04.02.003.00000000000志5575鑫

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号