2014数学建模mathorcup 获奖论文

上传人:n**** 文档编号:88888952 上传时间:2019-05-12 格式:DOC 页数:15 大小:450KB
返回 下载 相关 举报
2014数学建模mathorcup 获奖论文_第1页
第1页 / 共15页
2014数学建模mathorcup 获奖论文_第2页
第2页 / 共15页
2014数学建模mathorcup 获奖论文_第3页
第3页 / 共15页
2014数学建模mathorcup 获奖论文_第4页
第4页 / 共15页
2014数学建模mathorcup 获奖论文_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《2014数学建模mathorcup 获奖论文》由会员分享,可在线阅读,更多相关《2014数学建模mathorcup 获奖论文(15页珍藏版)》请在金锄头文库上搜索。

1、评委一评分,签名及备注队号:20025评委三评分,签名及备注评委二评分,签名及备注选题:B评委四评分,签名及备注题目:基于层次分析法与BP神经网络对书籍推荐的研究摘 要随着信息技术和互联网的发展,关于各类信息的评价、推荐越来越被广泛关注。本文根据一个著名网上书店的用户行为信息,分析影响用户评分的因素来建立用户对书籍的评分体系模型,进而对用户进行书籍推荐。对于问题一,首先对原始数据筛选处理,得到用户对书籍的评价为5分的数据;考虑到不同因素对书籍评分的影响,然后再对标签、社交好友、书籍浏览量三组数据分别进行双变量相关分析,得到用户对书籍的评分分数与标签数量、用户好友数量、书籍的历史浏览量成正相关的

2、关系,对用户对书籍评分影响程度分别为历史浏览量用户好友人数书籍标签数量。对于问题二,本文分别通过建立层次分析模型和BP神经网络模型对评分进行预测。首先将三个影响评分的因素:书籍的书签数量、历史浏览量、用户的好友数量作为评分指标,建立层次评价指标体系。然后,通过建立层次分析模型,得到标签数量、历史浏览量、用户好友数量三个指标的权重:0.0813,0.6837,0.2349,进而确定用户对书籍的评分公式,再将问题中的36组数据分别进行分析,并运用评分公式得到用户对每个书籍的评分。接下来构建BP神经网络模型,先对原始数据进行筛选得到99组数据;把不同用户对书籍的标签数量、用户好友数量、书籍浏览量和对

3、应的书籍评分作为输入量,将其他用户对书籍的评分作为输出量。选取80组数据训练该神经网络,剩余19组数据检验模型,误差在5.3%之内,最后利用该训练好的网络预测用户对书籍评分。通过两种模型的对比得出更为精确的结果。对于问题三,本文考虑到对书籍的好评频率越高,用户对书籍的喜爱程度越高,通过对原始数据筛选得到用户未看过书的ID,选取前三本评分为五分频率最高的书籍,即为推荐给该用户的三本书籍ID,然后循环五次进行分析最终得到问题所要求的五个用户的推荐书籍ID。关键字:书籍评分;相关分析;层次分析法;BP神经网络基于层次分析法和BP神经网络对书籍推荐的研究1.问题的重述 随着信息技术和互联网的发展,人们

4、逐渐从信息匮乏的时代走入了信息过载的时代。此时,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐,就是解决这一矛盾的重要工具,在互联网的产品和应用中被广泛采用,包括大家经常使用的相关搜索、话题推荐、电子商务的各种产品推荐、社交网络上的交友推荐等。我们获得了一个著名网上书店的用户行为信息,包括对于书籍的评分数据,书籍的标签信息以及用户的社交关系,请你根据数据完成以下问题。 1.分析影响用户对书籍评分的因素;2.建立一个模型,预测pred

5、ict.txt附件中的用户对书籍的评分;3.针对predict.txt附件中的用户,给每个用户推荐3本没看过的书籍。2.问题的分析 对于书籍的评分与推荐,主要是基于对大量统计数据的处理。所以,对于问题的解决需要抓住关键有用的数据,并对数据进行转变、筛选、分析、归纳,分析用户对书籍评分的影响因素,以此为依据,通过建立用户对书籍评分的模型,进而完成用户对书籍的评分预测和书籍推荐。2.1问题一的分析 问题一要求分析影响用户对书籍评分的因素,是对附件中数据的综合分析,首先对user_book_score.txt进行原始数据筛选分别得到用户对书籍的评价为15分的数据;考虑到不同影响因素对书籍评分的影响,

6、然后再对其他数据进行筛选,分析,初步得到各阶段书籍的评价分数与标签数的关系、与社交好友的关系、与书籍浏览量的关系。最后对得到的数据进行科学分析和归纳总结,得到影响用户对书籍评分的因素。2.2问题二的分析问题二要求建立模型,预测predict.txt附件中的用户对书籍的评分。首先对标签数量,社交关系,书籍浏览量三个方面进行研究,这是一个多目标决策问题。根据问题,可以运用YAAHP层次分析软件建立总评分-准则层两层次分析模型,利用层次分析法综合分析确定各指标对总评分的权系数,并确定综合书籍评价公式,从而得到书籍评分模型,进行预测评分。其次为了更加充分的考虑模型的准确性,运用BP神经网络模型,首先建

7、立一个神经网络结构,把不同用户对书籍的标签数量、用户好友数量、书籍浏览量和对应的书籍评分作为输入量,预测其他用户对书籍的评分作为输出量,根据已知数据训练神经网络,该过程不断调整网络结构,直到到达满意,为止,最后利用该训练好的网络进行用户对书籍评分的预测。2.3问题三的分析 问题三要求针对predict.txt附件中的用户,给每个用户推荐3本没看过的书籍。考虑到书籍的好评频率越高,用户对书籍的喜爱程度越高,运用SPSS软件对user_book_score.txt附件进行筛选,得到所有书籍评分为五分的频率,然后在EXCEL中进行排序处理,运用LOOKUP函数筛选得到该用户未看过书的ID,选取前三本

8、评分为五分频率最高的书籍,即为推荐给该用户的三本书籍ID,然后循环五次进行分析最终得到问题所要求的五个用户的推荐书籍ID。3.符号约定符号说明观测样本数用户对书籍的评分用户浏览量的指标用户好友人数的指标标签数量的指标一致性比例4.问题假设1、假设影响用户对书籍评分的因素相互独立。2、假设影响书籍评分的因素只有书籍标签,用户好友数量,书籍浏览量。3、假设书籍的好评频率越高,用户对书籍的喜爱程度越高。5.模型的建立与求解5.1问题一模型的建立5.1.1对书籍评分数据的处理题目要求分析影响用户对书籍评分的因素,运用SPSS统计软件1对附件user_book_score.txt(用户评分数据)对书籍分

9、数进行排序,然后进行筛选,从而得到评分为5分好评对应的书籍。5.1.2书籍标签对书籍评分的影响考虑到书籍标签的数量对书籍评分结果存在着一定的影响关系,因此要对标签数量进行综合分析。首先运用SPSS统计软件对附件book_tag.txt(书籍的标签数据)进行数据筛选,得到不同的书籍评分为5分出现的频数;然后运用EXCEL统计软件进行计数处理,得到评分为5分的所有书籍的标签数量。再次运用SPSS软件对其进行双变量相关分析2,得到标签数量影响因素下的描述性统计量表包括均值、标准差、观测样本数,如表1所示:表1 标签数量与好评的描述性统计量表描述性统计量均值标准差N标签数量15.167.3524738

10、好评15.167.3524738标签数量与评分的相关分析,如表2所示: 表2 标签与好评的相关分析结果表相关性标签评分标签数量Pearson相关性10.012显著性(双侧)0.414平方与叉积的和256030.2323042.232协方差54.0490.642N47384738好评Pearson相关性0.0121显著性(双侧)0.414平方与叉积的和3042.232256030.232协方差0.64254.049N47384738 对表2进行分析,标签数量与书籍评分之间的Pearson相关系数为0.012,表示二者之间存在不完全相关且为正相关。两者之间的不相关的双侧显著性的值为0.414,否定

11、了二者不相关的假设。所以,根据表2可以得出结论:用户对书籍的的评分与书籍标签数量之间存在正相关性,标签数量越多,书籍评分越高。5.1.3社交关系对书籍评分的影响基于对社交关系的考虑,用户的好友人数对书籍评分出现五分好评的频数有一定的影响,首先运用SPSS软件对附件user_social.txt(用户的社交关系数据)进行数据筛选,得到每个用户对书籍评分为5分出现的频数;然后运用EXCEL统计软件进行计数处理,得到评分为5分的用户的好友人数。再次运用SPSS软件对其进行双变量相关分析,得到用户影响关注好友的数目对评分影响因素下的描述性统计量表包括均值、标准差、观测样本数,如表3所示:表3 用户好友

12、人数与其好评的描述性统计量表 描述性统计量均值标准差N好友人数8.066.6823661好评16.7129.4263661 用户好友人数与评分的相关分析如表4所示:表4 好友与评分的相关分析结果表相关性标签评分好友人数Pearson相关性10.164显著性(双侧)0平方与叉积的和163411.043118097.177协方差44.64832.267N36613661好评Pearson相关性0.1641显著性(双侧)0平方与叉积的和118097.1773169049.279协方差32.267865.860N36613661 对表4进行分析,用户对书籍的评分与用户好友人数的Pearson相关系数为

13、0.164,表示二者之间存在不完全相关且为正相关。两者之间的不相关的双侧显著性的值为0,否定了二者不相关的假设。所以,根据表4可以得出结论:用户对书籍的的评分与书用户的好友人数之间存在正相关性,用户好友人数越多,用户对书籍的评分越高。5.1.4历史浏览量对书籍评分的影响首先运用SPSS统计软件对附件user_read_history.txt(用户看过的书籍数据)进行数据筛选,得到在此附件中不同的书籍评分为5分出现的频数;然后运用EXCEL统计软件进行计数处理,得到评分为5分的所有书籍的历史浏览量。再次运用SPSS软件对其进行双变量相关分析,得到只考虑书籍历史浏览量此因素下的描述性统计量表包括均

14、值、标准差、观测样本数,如表5所示:表5历史浏览量与好评的描述性统计量表均值标准差N好友人数579.442242.9644738好评12.9135.4354738书籍的历史浏览量与评分的相关分析如表6所示:表6 历史浏览量与评分的相关分析结果表相关性标签评分被浏览量Pearson相关性10.527显著性(双侧)0平方与叉积的和23831319985.228198426991.949协方差5030888.74541888.746N47384738好评Pearson相关性0.5271显著性(双侧)0平方与叉积的和198426991.9495947795.210协方差41888.7461255.604N47384738 对表6进行分析,书籍的历史浏览量与书籍评分之间的Pearson相关系数为0.527,表示二者之间存在不完全相关且为正相关。两者之间的不相关的双侧显著性的值为0,否定了二者不相关的假设。所以,根据表6可以得出结论:用户对书籍的的评分与书籍的访问量存在正相关性,书籍的历史访问量越多,书籍评分越高。5.1.5整体综合指标结果的分析 根据上述求解过程,从书籍标签,社交关系,历史访问量三个方面分析用户对书籍评价的影响因素,其结果均与用户对书籍的评分成正相关。对用户对书籍评分影响程度分别为历

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号