大众点评POI与评论推荐分析研究计算机科学与技术专业

上传人:鲁** 文档编号:569139971 上传时间:2023-06-13 格式:DOCX 页数:31 大小:583.84KB
返回 下载 相关 举报
大众点评POI与评论推荐分析研究计算机科学与技术专业_第1页
第1页 / 共31页
大众点评POI与评论推荐分析研究计算机科学与技术专业_第2页
第2页 / 共31页
大众点评POI与评论推荐分析研究计算机科学与技术专业_第3页
第3页 / 共31页
大众点评POI与评论推荐分析研究计算机科学与技术专业_第4页
第4页 / 共31页
大众点评POI与评论推荐分析研究计算机科学与技术专业_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《大众点评POI与评论推荐分析研究计算机科学与技术专业》由会员分享,可在线阅读,更多相关《大众点评POI与评论推荐分析研究计算机科学与技术专业(31页珍藏版)》请在金锄头文库上搜索。

1、 目 录前言1第1章绪论21.1研究背景21.2研究意义21.3研究现状31.4本文工作概述3第2章相关介绍52.1基于协同过滤的推荐52.2基于内容的推荐62.3相似度计算72.3.1 欧式距离相似度72.3.2 余弦相似度72.3.3 皮尔逊相关系数82.3.4 Jaccard 系数82.4线性回归模型82.5评价指标10第3章数据的收集与处理123.1数据采集123.1.1 数据爬取123.1.2 数据存储143.2数据处理143.2.1 评论分词153.2.2 词向量表达15第4章基于文本评论的评分预测174.1主要任务174.2评分预测模型184.2.1 相关定义184.2.2 模型

2、建立194.3实验结果分析21第5章总结与展望235.1课题总结235.2后续工作展望23参考文献25致 谢27摘 要随着互联网和移动通信迅猛发展,电子商务强势崛起,越来越多的人倾向于网上消费。如何从海量的互联网数据中筛选出用户感兴趣的信息成为了全球互联网用户潜在的问题,推荐系统(Recommendation System)技术通过搜索大量动态生成的信息来为用户提供个性化的内容和服务来解决这个问题。推荐系统作为一种信息过滤方式,试图预测用户的偏好兴趣和对物品的评价。近年来,频繁活跃的互联网用户在消费信息的同时也产出了海量的原创内容。本文的主要研究工作是深度挖掘用户原创的评论内容,分析出用户和物

3、品的特征,进而进行评分预测。评论(Comment)指人对于事物做出的客观叙述,反映了人的主观感受。基于用户的文本评论数据,本文的主要研究工作如下:首先,从互联网上采集包含有用户、物品和用户文本评论的数据。该数据集来源于大众点评网。然后对评论文本进行分词,用词向量对其进行数学表达,形成主题词的分布表。最后,基于用户文本用评论主题词进行评分预测,通过线性回归模型和改进的协同过滤算法预测评分,最终的实验结果表明,预测的评分客观准确,同时组合的预测算法效果更优。 关键词:推荐系统;用户评论;线性回归;评分预测AbstractWith the rapid development of the Inter

4、net and mobile communications, and the strong rise of e-commerce, more and more people tend to spend online. How to filter the information that users are interested in from the massive Internet data has become a potential problem for global Internet users. Recommendation systems solve this problem b

5、y searching through large volume of dynamically generated information to provide users with personalized content and services.The recommendation system serves as an information filtering method that attempts to predict the users preference for interest and the evaluation of the item. In recent years

6、, frequent and active Internet users have also produced massive amounts of original content while consuming information. The main research work of this paper is to deeply mine user-originated commentary content, analyze the characteristics of users and items, and then make score predictions.Comment

7、reflects peoples subjective feelings. Based on the users text review data, the main research work of this paper is as follows:First, data containing user, item, and user text reviews is collected from the Internet. This dataset comes from the Dianpings website. Then, the comment text is segmented an

8、d mathematically expressed by the word vector. Then the text of the comment is segmented and expressed mathematically by the word vector to form the distribution table of the topic word.Finally, based on the users comment, the scores are predicted by the subject headings, and the linear regression m

9、odel and the improved collaborative filtering algorithm are used to predict the scores. The final experimental results show that the predicted scores are objective and accurate, and the combined rating prediction algorithm is more effective.Keywords: Recommendation System; Users Comment; Linear Regr

10、ession; Rating Forecast前 言进入互联网时代后,技术发展日新月异,人类获取信息的数量也急剧增长,从匮乏到当前的过载,信息的获取信息的方式也逐渐多样化。互联网是当代信息的重要载体,日常活动呈现数字化趋势,形形色色的数据充斥在互联网的网页上,不管是信息的生产者还是消费者,都面临信息处理的难题。对消费者来说,不借助工具在海量的数据中发掘出自己需要的信息于个人来说几乎不可能,对生产信息的企业和商家来说,如何把产出的信息加工分类,把用户感兴趣的信息推送到用户面前也是巨大的挑战。推荐系统则可以解决上述的难题,它不仅可以帮助用户过滤不感兴趣的无关信息,而且能发掘出用户潜在的可能喜欢的信

11、息。因此,推荐系统在数据挖掘领域具有重要的研究价值。推荐系统可以针对某个用户对某项物品进行模拟的评分预测。本文主要研究的就是基于用户的文本评论进行深度分析,挖掘用户和物品特征,模拟出用户对物品的评价。本文的主要工作和创新点如下所示:(1) 利用网络爬虫获取大众点评的餐饮服务数据,包含用户、物品和文本评论数据。(2) 对中文文本评论进行分词处理。(3) 对分词后的文本利用word2vec工具构建成矩阵表达,通过相似度排序得到主题词的分布表。(4) 基于评论的主题分布进行分析,利用线性回归模型训练参数。用训练后的模型模拟用户对物品的评分预测。(5) 结合协同过滤算法提升(4)的评分预测的准确度。实

12、验结果充分证明评分预测的准确度较高。第1章 绪论1.1 研究背景近十多年来,互联网和Web技术迅猛发展,互联网信息呈现爆炸式增长,人类面临信息过载的挑战。一方面,为了从海量的数据中获取对用户而言有价值的信息,另一方面,为了把信息推广展示给对其有兴趣的用户,推荐系统应运而生。推荐系统致力于通过分析用户的行为向用户推荐一些物品。随着电子商务的蓬勃发展,为了为精准获取用户购物反馈,许多电商都提供了针对消费过的商品进行评分和评论的功能。例如,用户在Yelp和Dianping上为他们购买的产品或他们收到的服务提供评论和数字评级。这些评论意见包含关于用户的意见和偏好的丰富信息,这对推荐系统可能是有价值的。

13、但是,在传统方法中,推荐方法考虑的往往是数字评分,而评论意见却被忽略。因此,面向推荐系统的文本评论的深度挖掘的研究对于提升推荐个性化具有重要价值。1.2 研究意义在Web2.0时代,用户不仅是信息的消费者,更多的时候扮演的是生产者的角色,大量的用户在互联网上生产原创内容(User Generated Content, UGC)。增长迅速且形式越来越丰富的UGC数据为更加多维度和细粒度的分析刻画用户特征提供了可能。近年来,机器学习和文本的情感分析技术不断进步,对于用户产生的文本评论数据进行深度的分析成为了提高推荐系统准确性的重要研究方向。不同于简单的数字评分,用户的文本评论中往往隐藏了用户想要表达的真实想法和情感,深入分析评论能发掘出用户的行为偏好和决策过程,基于此进行个性化推荐,不仅能够减轻用户筛选信息的负担,主动推送给用户能帮助用户更加便捷发现自己真正想要的物品,甚至能够发掘出潜在的意外惊喜。推荐给用户想要的商品,对商家来说,无疑会增加用户购买的概率,可能会显著增加销量。一些推荐系统可以将推

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 大学论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号