2014数学建模论文－金锄头文库

资源描述

《2014数学建模论文》由会员分享，可在线阅读，更多相关《2014数学建模论文（12页珍藏版）》请在金锄头文库上搜索。

1、班级：12 级数师 2 班姓名：谭栖希学号：2012020240900基于微博用户行为的数学建模和数学分析摘要：微博作为一种新兴的交流工具，以简单快捷的操作方式、随时随地发布信息的互动形式,在各类网络社交服务中独树一帜。本问针对不同的微博问题，提出了不同的模型和算法，过程如下：问题一与问题二都是利用行综合评价模型，根据数据分析，对问题定义合适的影响因子，对不同的影响因子用极值差方法做标准化处理，得到合理的数据，使评价结果更为合理。采用组合赋权法，得到更加合理的权数，使用线型加权综合评价法得到最后的评价结果，利用到问题答案。问题三通过图论分析算法将 n 个人看作 n 个顶点，将相互关注的好

2、友连接起来，建立无向的图即为好友圈，通过深度优先扫描的法判断是否是无向连通图，通过广度优先算法找出连通的最大图即为最大好友圈，求出最大连通图中的边数 e，通过得到的变数 e 找出最大连通图的顶点数，则找到最大好友圈的人数。问题四通过本题对大 V 的定义从而我们知道影响力越到的大 V 那么他传播消息的能力则越强，则传播的图就越大，从而我们先找出影响力最大的大 V，依次从往小的剔除数据，建立新的邻接矩阵。当去到一定的数据时，对数据通过回归分析拟合得到了关于剔除人数和对于大 V 之间的函数关系，从而解出所需要传播发布消息的最少人数。关键字：综合评价模型、图论分析算法、回归分析一、问题重述微博，作为

3、互联网上的新兴应用，由于智能手机的普遍，使得其御用变得极其方便，从而吸引了大量的注意力。涉及微博的很多应用问题，是值得大家注意和思考的。通常微博用户的群体数量巨大，使得如下问题的计算变得极其复杂，为了便于考1虑问题，使得计算在普通的微机上也可行，我们分别考虑有 2000 个用户和 10000 个用户的问题，数据文件含了这些用户的相互关注数据，每一行为该行号对应的用户对其它用户的关注信息。数据文件若干消息数据，每一行为用户发布或转发的消息编号。现在我们来解决如下问题：问题一：在微博群体中，有的人受关注度很高，他们被称为大 V。由于受关注度很高，他们发微博的影响力就很大，我们需要通过已知数据对

4、大 V 定义合适的影响因子，并通过影响因子找出最具有影响力的十个大 V。问题二：每天更新的微博消息有很多，但被大量的用户转发和关注的却很少，消息的影响力不同。消息的影响力与发消息的人有关，因此，我们将通过比较受不同关注程度的人群发出微薄消息的影响力的不同程度和消息本身的价值给出计算消息影响力的值，并找出十个最具影响力的消息。问题三：在微博中，相互关注的用户称为好友，对于一个群体，如果他们相互之间均为好友，则称为好友圈。因此我们将通过图论的方法，从大 V 出发找出人数最多的好友圈。问题四：假设任一微博用户发布的消息，其粉丝都会看到。如果要发布一则消息，确保让所有的用户在不转发的情况下都能看到，去

5、找出最少的用户数发布该消息的方案。二、符号说明：为样本总数；n：为实际使用样本个数；m：为第 i 个人所关注的人的集合；第 i 个人所关注的人的编号；接矩阵；三、其他因素无关。与名人效应、随大流、恶作剧等其他心理作用无关。播的数量会增大。点与节点之间是单向的。在一个人转发微博后，这个人的全体粉丝都能看到这条微博并决定是否转发，而非粉丝无法通过他来看这条微博。次见到该微博时他将不会转发它。四、量说明:实测数据；价指标的权重系数；价对象的综合评价值；准化处理对得到的样本，一般不直接拿来使用，要先进行一定的标准化处理。但由于各指标具有不同的量纲，且类型不同，故指标间具有的不可共度性难以直接进行比较

6、。因此，在综合评价前，必须把这些分指标按某种规律归一化到某一无量纲区。（1）对于偏大型指标（如被关注的量），数值越大，其影响力越大，若对其进行标准化处理，作极差变换即令 /（ 1中。a（2）对于中间型指标（如，关注的量与发布与转化的消息量），即靠近某个中间值评价效果越好，则对其进行标准化处理如下, /(1)其中。()/2，，价指标最终系数的设定3由于主观赋权法和客观赋权法各有其优缺点, 因此, 如果将主观法所得权数与客观法所得权数按照一定的数学方法进行组合的话, 就可能产生出更为合理的权数, 这就是在主、客观赋权法的基础上形成的组合赋权法。（1）主观赋权法,根据实际情况，相应的给出

7、3 种因子的权重为 .1。）客观赋权法，根据数据选用变异系数法。在评价指标体系中，指标取值差异大的指标更能反映出各被评价对象的差距。因此，差异越大的指标越重要。标准差能够反映取值差异，但标准差的大小易受取值大小的影响。为了消除各指标量纲不同的影响, 用各指标的变异系数来衡量各项指标取值的差异程度。令第 i 个指标的均值为，方差为，则各指标的变异数为 ,各指标的客权重为。/（3）基于综合集成的赋权法如果别是由两种不同的方法所确定的指标两种权重系数。采用乘积集成法来计算最终权重，即 1,2,合评价模型的构建为了全面地综合分析评价被评价对象的影响力，有 n 个被评价对象，每个被评价对象

8、都有 k 项评价指标，即 12,，相应的权重系数向量为，则构造综合评价函数 y=f(w , 1,2 1,2x)，即为综合评价的数学模型. 根据指标观测值和权重向量计算出 n 个被评价对象的综合评价指标值：,1,2按取值的大小对 n 被评价对象进行排序或分类。(1,2)i n根据分析，采用线性加权综合评价法，即。12. 基于 V 的影响力本题给出的是 2000 个微博用户的相互关注数据和若干消息数据。这里我们先作以下预处理：4（1）根据数据分析，对大 V 定义了 3 个合适的影响因子：用户的被关注度、关注度、发布与转发的消息。利用具对 3 个影响因子进行统计，截取前 10 个数据，如表示

9、。表 3 个影响因子的数据用户被关注的量关注的量发布和关注的消息量1 26 39 252 22 38 273 23 15 284 21 20 275 23 31 286 18 14 237 21 19 278 21 29 249 25 10 2910 13 13 17（2）由于各影响因子具有不同的量纲且类型不同，则对其进行标准化处理。利用具进行处理，截取前十个数据，如表示。表准化处理后的数据用户被关注的量关注的量发布和关注的消息量1 ）由于主观赋权法和客观赋权法各有其优缺点, 则采用组合赋权法。由主观赋权法得到其 3 个影响因子的权数为：观赋权法采用变异系数法得出其 3 个影响

10、因子的权数为：用乘积集成法的出最后权重：数据带入照模型评价公式进行计算，得到影响力综合评价结果，则影响力最大的十个大 V 如表示。表响力最大的十个大响力最大的十个大消息的影响力（1）根据数据分析，对消息的影响力定义了 2 个合适的影响因子：消息被转发的次数、大 V 对它的关注量。对十个影响力最大的大 V 进行排序，根据大 V 影响力的综合评价得分，利用公式得到十个大 V 对消息影响力的权数，再利用别对 100 个消息中有哪些大 V 关注，关注量为，则。利用具对 2 个影响因子进行统计计算，截取前 10 个数据，如表示。表个影响因子的统计数据消息号被转发次数大 V

11、对它的关注量1 493 50 4 04 948 77 7 07 361 00 41 94 0（2）由于各影响因子具有不同的量纲且类型不同，则对其进行标准化处理。利用具进行处理，截取前十个数据，如表示。表准化处理后的数据消息号被转发次数大 V 对它的关注量1 4 7 （3）由于主观赋权法和客观赋权法各有其优缺点, 则采用组合赋权法。由主观赋权法得到其 2 个影响因子的权数为：观赋权法采用变异系数法得出其 2个影响因子的权数为：用乘积集成法的出最后权重：数据带入照模型评价公式进行计算，得到影响力综合评价结果，则影响力最大的十个消息如表示。表影响力最大的十个消息7消息号影响力最大的十个消息4 创建无相连通图的个数；大连通的分量集合 P；Q：向图的模型建立（1）以任意的

展开阅读全文