B题:客观、合理地评价及预测学生学习状况

上传人:飞*** 文档编号:16377121 上传时间:2017-11-07 格式:DOC 页数:30 大小:1.10MB
返回 下载 相关 举报
B题:客观、合理地评价及预测学生学习状况_第1页
第1页 / 共30页
B题:客观、合理地评价及预测学生学习状况_第2页
第2页 / 共30页
B题:客观、合理地评价及预测学生学习状况_第3页
第3页 / 共30页
B题:客观、合理地评价及预测学生学习状况_第4页
第4页 / 共30页
B题:客观、合理地评价及预测学生学习状况_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《B题:客观、合理地评价及预测学生学习状况》由会员分享,可在线阅读,更多相关《B题:客观、合理地评价及预测学生学习状况(30页珍藏版)》请在金锄头文库上搜索。

1、2009 年“希望杯”大学生数学建模竞赛承诺书我们仔细阅读了大学生数学建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们的参赛报名编号为:参赛队员 (签名) :2009 年 月 日评阅编号(由组委会评阅前进行编号1

2、B 题:客观、合理地评价及预测学生学习状况摘要问题一:我们建立了基于判定树的数据分析模型,对所给数据进行抽取、转换、分析和模型化处理,通过最后的数据分析,我们这样描述学生的整体情况:第一学期具有最大信息增益度且第一学期的学习状况对第二学期的学习状况有一定的影响,该结论置信度达到 72%;同时经过两个学期后,学生在成绩的稳定性方面得到了提高,置信度为 95.1%。问题二:我们建立了三个模型,模型 1 是改进的 LOGISTIC 模型,模型 2 为回归分析模型,模型 3 是 BP 神经网络模型。模型 1 通过对数据进行分组并计算观测对数发生比,然后对数据进行消除异方差和自相关性的处理,最后通过一般

3、最小二乘估计法得到五个分组的模型表明:第一组学生的成绩有明显上升的趋势,最后一个学期的成绩在以后成绩的预测中占的比重最大;第二组学生的成绩同样上升比较快,但同时与第一组的学生相比波动比较大,即稳定性略差;第三组学生的成绩相对保持稳定,在第二个学期有点下降,但第三个学期的成绩马上恢复原来的水准;第四组学生的成绩也处在上升的阶段,但总体来说幅度偏小,可以说稳中有升;最后一组学生的后两个学期的成绩对其以后的影响较大,但也有略微的提升。模型 2 首先将数量进行指标化,分析后面学期与前面学期成绩之间的关系,并预测将来的学习效果,得到学生的学习水平可以根据前面几个学期进行评定,另外从回归系数的取值情况来看

4、,第一学期对以后的成绩起到了很好的“预测”作用,即一部分人接下来的成绩保持在第一学期成绩的一定范围内变动,另外一部分人经过合理的调整之后逐渐提高,而另一部分人则学习成绩一直下降,只有少数人的成绩在剧烈的波动。模型 3 通过对所有人取得的成绩用 MATLAB 软件进行训练,最后显示学期2,3,4 学习进步(速率大于 0)的学生人数分别为 194 人,200 人,200 人,由此可知学生总体的成绩是在进步的,而且进步的学生人数在增加。同时,学期 1 成绩低于60 分的学生成绩进步的人数由 9 人,增加到 14 人,11 人,进步比率由 4.6%,7%,到5.5%,说明成绩较差的学生在很努力地学习,

5、并且得到很大的提高。问题三:根据问题二中的模型 1 和模型 3,我们首先对学生接下来的两个学期的成绩进行计算机模拟,模拟的结果和问题二中的分析基本一致,其中对改进 Logistic 模型的模拟表明有 71.6%的学生在五、六学期的平均成绩高于前四学期的平均成绩,另外对 BP 神经网络模型的模拟则表明全部学生五、六学期之间的成绩波动都在 0.4 分之内,反观前几个学期,波动在 0.4 之内的分别仅有 5.47%、 6.47%、 2.49%。另外从学生成绩排名来看,前四个学期排名变化比较大,后两个学期逐渐趋于稳定,只有 3.98%学生有名次的变动。关键词 判定树 信息增益度 指标数量化 BP 神经

6、网络 随机误差项 异方差2一 问题重述评价学生学习状况的目的是激励优秀学生努力学习取得更好的成绩,同时鼓励基础相对薄弱的学生树立信心,不断进步。然而,现行的评价方式单纯的根据“绝对分数”评价学生的学习状况,忽略了基础条件的差异;只对基础条件较好的学生起到促进作用,对基础条件相对薄弱的学生很难起到鼓励作用。附件给出了一个专业同年级 201 名学生连续四个学期的综合成绩。1.根据附件数据,对这些学生的整体情况进行分析说明;2.根据附件数据,采用两种及以上方法,全面、客观、合理的评价这些学生的学习状况;3.根据不同的评价方法,预测这些学生后两个学期的学习情况。二 模型假设问题一:假设 1:以 60

7、分为基准判定及格与不及格;假设 2:每个学生的成绩真实有效,不受突然性因素影响;问题二:假设 1:随即误差项的平均值为零;假设 2:各个随机误差项的离散程度是相同的;假设 3: 不同期的 和 彼此不相关,即有iuj ; ;(,)(,)0ijijCOVEij,12,in假设 4:每个学生的成绩是关于学期变化的。假设 5:各个学生的成绩是相对独立的。假设 6:第一学期的成绩可以基本代表该学生学习状况所处的等级。问题三:假设 1:解释变量之间不存在完全的线性关系;假设 2:解释变量 与随机项不相关,即12,x,k ; ;(,)0ijCOVu1,in3三 符号说明En 维有穷向量jF有穷离散符号集jV

8、.,21,njFj 正整数PE正例集N反例集p 正例集的大小n 反例集的大小I信息量Gain 信息增量1S1且 第 二 学 期 成 绩第 一 学 期 成 绩 120且 第 二 学 期 成 绩第 一 学 期 成 绩1=1且 第 二 学 期 成 绩第 一 学 期 成 绩 02S=0且 第 二 学 期 成 绩第 一 学 期 成 绩 1x第一学期成绩2第二学期成绩3x第三学期成绩y 第四学期成绩回归系数2第二学期成绩的增长速率3第三学期成绩的增长速率4第四学期成绩的增长速率base学期 1 成绩numi学生学期 的成绩的学期集合i4p学习周期动量系数kE第 个样本预测值与真实值间的误差ke总误差t期望

9、值ijWBP 神经网络权值、 正整数:j神经元的等效误差3ID判定树归纳算法四 问题分析问题一:我们通过对所有学生在每个学期的成绩变化进行分析,采用了判定树的方法,将所有的数据进行分类,研究整体成绩在不同学期间的关系,从而达到题目的要求。问题二:问题二和问题三是紧密相连的,所以在评价学习状况的同时也要根据这些变化进行预测,关键在于找出学生成绩变化的关键因素,于是我们首先采用了模型1(LOGISTIC 模型),对所有学生的成绩进行分析,根据所找到的每一个影响因素分析对学生成绩影响的关联性,最后寻找到最紧密的关系为第三题做铺垫。接着为了更加全面的分析,我们又从学生成绩的变化方向和趋势方面采用 了基

10、于判定树的分析模型(模型 2)和 BP 神经网络模型(模型 3)。问题三:在问题二的基础上,通过给出的数据进行预测,对于预测的模型运用已知的数据和统计的检验方法进行分析,从而得到相对准确的学习成绩的预测答案。5五模型建立与求解问题一(基于判定树的数据分析模型):模型的建立:设 是 n 维有穷向量空间,其中 是有穷离散符号集, 中的E1FN2 jFE元素 e=( 称为例子。其中 设 和 是 的两个例子集,),nV .,21,njVj PEN分别叫正例集和反例集。假设向量空间 E 中的正例集 和反例集 的大小分别为p,n, 基于如下两种假设:1、在向量上间 上的一棵正确决策树,对任意例子的分3ID

11、类概率同 E 中正、反例的概率一致。2、一棵决策树对一例子做出正确类别判断所需的信息量为:(1)npnpnpI 22loglog),(如果属性 A 作决策树的根,A 具有 V 个值 ,它将 分成 v 个子集,21VE,假设 中含有 个正例和 个反例,那么子集 所需的期望信息是,21vEiiPiNi以属性 A 为根分类所需的期望熵是:),(iNP(2)),()(1iviiinpI以 A 为根的信息增益是:Gain(A)=I(p,n)- (A) (3)E选择使 Gain(A) 最大(即 (A)最小)的属性 作为根结点,对 的不同3ID *A*A取值对应的 的 v 个子集 递归调用上述过程生成 的子

12、结点 。Ei vB,.21模型的求解:首先,根据附件数据选取了学生序号、学期 1 成绩、学期 2 成绩、学期 3 成绩、学期 4 成绩这 5 个属性生成数据转换表。在转换表中,将学生每个学期的成绩转化为0 或 1,0 表示成绩小于 60 分;1 表示成绩大于或等于 60 分。这一转换过程在 Excel中可以使用 IF 函数来实现(见附表 1)。然后,采取整体抽样的方法,从这些数据样本中从中选取了 4 个学期共 804 条学生成绩记录作为训练集并将这四个学期的成绩记录复制到训练实例工作表中。利用 Excel 软件中的统计函数,求出训练集中一个学期成绩及格的人数和不及格的人数。如图所示:6第一学期

13、第二学期第三学期第四学期及格 183 175 186 188不及格 18 26 15 13有了以上数据,就可以利用信息增益度选取最能区别训练集中实例的属性。构造好的判定树的关键在于如何选择好的属性。一般情况下,树越小则树的预测能力越强。所以,要构造尽可能小的判定树,关键在于选择恰当的属性。这里使用信息增益1度 进行属性选择。2从学生考试成绩来看,第二学期的平均成绩最低,因此选取第二学期作为参考对象。由判定树归纳算法 的基本原理得到:3IDP:第二学期成绩=1 175 条记录N:第二学期成绩=0 26 条记录=0.5557 (4)2016log20175log),(npI 条 记 录且 第 二

14、学 期 成 绩第 一 学 期 成 绩 条 记 录且 第 二 学 期 成 绩第 一 学 期 成 绩 条 记 录且 第 二 学 期 成 绩第 一 学 期 成 绩 条 记 录且 第 二 学 期 成 绩第 一 学 期 成 绩 1300: 5: 72121 S 2.26175( 4.0),()/8()3,()/83()( 第 一 学 期 ),(第 一 学 期 )第 一 学 期 EIGain IE如此计算可得: 068.(48.0 71,( 第 四 学 期 )( 第 四 学 期 ) 第 三 学 期 )第 三 学 期 ) GainE根据各学科的信息增益度的大小,由于属性第一学期具有最大信息增益度,所以我们选

15、择第一学期成绩作为这一属性作为所建判定树的根结点,由于学期成绩的属性只有两个值:1(表示及格), 0 (表示不及格)。在第一学期节点下可创建两条分支。利用 Excel 的筛选功能,显示第一学期不及格且第二学期及格的记录只有 5 条,这说明第一学期成绩不及格的,第二学期有 72%的可能不及格 。因)( 注 : %7218)(此可以对第一学期不及格这一条停止分割。第一学期及格人数 183 人,其中第二学期及格人数 170 人,不及格人数 13 人,对第一学期成绩及格这条分支可进一步分割。由上面的各信息增益度可知,应选取第三学期这一属性作为分裂节点进行细化。再次利用 Excel 的筛选功能, 显示出

16、第一学期及格且第三学期及格的记录,并统计结果:第二学期 175 及格,9 人不及格。同样做法,显示出第一学期及格且第三学期不及格的记录,并统计结果:第二学期及格 4 人,不及格 4 人。 因此可如下图构建出数据的判定树:7因此,沿着该判定树的根结点到树叶节点的路径,可以得出下列 IF-THEN 分类规则:(1) 如果学生的第一学期成绩不及格,那么第二学期成绩通常也不及格。 %47.6201/)58(支 持 度置 信 度(2) 如果学生的第一学期成绩及格且第三学期成绩不及格,那么第二学期成绩不及格的置信度和支持度如下:0.21/)48(支 持 度置 信 度(3) 如果第一学期成绩及格且第三学期成绩及格,那么第二学期成绩也通常及格。%.87/)9(5支 持 度置 信 度另外,我们在

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号