《数学建模毕业生就业问题》由会员分享,可在线阅读,更多相关《数学建模毕业生就业问题(12页珍藏版)》请在金锄头文库上搜索。
1、数学建模毕业生就业问题 摘要本文讨论了在新的就业形势下大学生的就业问题。首先,通过对影响就业的因素的分析,建立线性回归模型,利用逐步回归分析求解模型,我们得出了影响大学生就业的主要因素是专业前景和政治面貌。其中,专业前景占的比重要大一些。通过对不同专业就业情况的讨论,在进一步假设的基础上选取样本数据,分别计算各专业的就业率、初始薪金均值及目前薪金均值,在作图比较的分析下给出客观评价。问题三:给出某一专业毕业生的就业策略。我们选定“计算机”专业毕业生作为研究对象,再次利用逐步回归模型,探究在该专业毕业生就业情况中起主要作用的因素,以此为依据就初始学历、专业是否对口等方面提出针对性策略建议。问题四
2、:结合实际探讨毕业生就业情况与地区经济发展水平间的关系。在明确研究背景的基础上,我们选取了八个不同城市作为研究对象,分别计算该地大学毕业生就业率,得出地区经济发展现状与就业率呈正相关的结论。问题五:对我校毕业生就业提出指导性建议。在本题研究成果的基础上,结合我校实际,分析了就业压力、自身期望、企业需求等方面的现存问题,从就业观、薪金要求、专业对口等几个方面给出就业指导建议。关键词:虚拟变量;回归分析;逐步回归模型;相关性系数一、问题提出随着我国大学教育逐步向大众化方向转变,招生数量连年增多,导致大学毕业生就业情况逐步严峻。2007年全国普通高校毕业生将达到495万,比2006年增加82万。大学
3、毕业生的就业率高低,既有社会整体大环境的因素,也有专业结构、培养方向、教学方式、学生学习态度等多方面的原因。附件给出了一个七千多名毕业生的调查数据,请你根据这些数据,建立相应的数学模型,研究以下问题:(1)影响毕业生就业的主要因素是什么,并对相关因素进行排序;(2)评价不同专业的毕业生就业情况;(3)给出某一专业的毕业生的就业策略;(4)请你结合其他信息对毕业生就业与区域经济发展水平之间的关系作出评价;(5)结合中央民族大学本科教育现状,写一篇对在校生今后就业具有实际指导意义的短文。21世纪是知识的时代,人才是国家发展的先决条件。大学毕业生的就业情况关乎社会发展状况与人才利用效率,通过数学模型
4、的建立对影响就业率的各项因素进行深入分析研究,具有重大的实际意义。二、基本假设在本次研究中做出以下假设:1假设毕业生就业情况只受性别、专业、政治面貌、毕业生条件、学历、专业前景、专业是否对口、课程是否适合社会、毕业时间等因素的影响。2假设具有上述同等条件的毕业生间就业机会相同。3假设附件中的数据信息均合理。三、建立模型及其检验、求解、评价(一)问题1:确定影响大学生就业的主要因素1.1 问题分析与建模思想此题要在众多的就业率影响因素中选取主要因素,并对其进行排序。首先需要研究变量间的相关关系,多元线性回归分析模型可解决这一问题;但进一步的,我们希望从所有的影响因素中挑选出对就业率影响显著的项目
5、,并且从应用的角度讲,变量个数尽可能少,而逐步回归模型则可有效实现这一目标。逐步回归的基本思想是:根据各个自变量重要性的大小,每次选一个重要自变量进入回归方程。先是在所有可供选择的自变量中选择一个,条件是由其所参与的一元回归方程有最大的回归平方和。然后在未选的自变量中再选择一个,条件是由这两个已选的自变量所组成的二元回归方程有更大的回归平方和。如此继续下去。一般地说,第t步是在未选的自变量中,选一个自变量与其他已经选择的自变量一起所组成t元回归方程,并使该方程有更大的回归平方和。为保证每一个选入回归方程的自变量是真正重要的,应该对每一个进入回归方程的自变量进行显著性检验。不仅要按自变量的贡献大
6、小逐一选出重要自变量,而且还要考虑较早选入回归方程的某些自变量,有可能随着其后另外一些自变量的选入而失去原有的重要性。这样的自变量应及时地从回归方程中剔除,使最终的回归方程只保留重要的自变量。上述思想是“有进有出”的。直到回归方程中的自变量都不能剔除,而又没有新的自变量引入回归方程为止。在逐步回归的计算中,不重要的自变量始终不会进入回归方程,无需解一个可能具有较大阶数的正规方程,计算效率的提高是显然的。更重要的是,当某个自变量与已经选入回归方程的自变量存在线性相关或近似线性相关时,其作用可以由与其相关或近似相关的自变量所代替,这时就不可能引入回归方程,由此可以防止逐步回归计算过程中出现不稳定。
7、1.2 符号说明l Xi:影响因素虚拟变量(i=1,2,3,20)l Yi:就业情况虚拟变量 (i=1,2,3,20)l Coefficients:相关性系数l R2 :判定系数l F:显著性检验l P-value:F统计量对应的概率值l RMSE:剩余标准差1.3 建立模型 第一步:抽取样本考虑到数据总量庞大,从中抽取部分数据作为样本。为了使模型能够反映出就业与未就业情况之间的对比,我们从已经就业的学生中选取了20位,再从未就业的学生中选取了10位,用他们的数据来建立回归方程。 第二步:引入虚拟变量在回归分析模型中,解释变量均为定性变量的模型称为方差分析模型(analysis-of-vari
8、ance models)(ANOVA),本题即为此状。现建立人工变量,将定性变量“定量化”,具体赋值情况如下:X1:性别虚拟变量,设X2:专业虚拟变量,X3:政治面貌虚拟变量,设X4:毕业生条件虚拟变量,设X5:学历虚拟变量,设X6:专业前景虚拟变量,设X7:专业是否对口虚拟变量,设X8:课程是否适合社会虚拟变量,设X9:毕业时间虚拟变量,设Y:就业状况,设经过上述量化过程,样本数据排列为下面的矩阵形式:1 0 0 0 0 1 1 0 1 11 0 0 0 1 1 1 1 0 11 0 0 1 1 1 1 1 1 10 0 0 1 0 1 1 0 1 11 1 1 1 1 1 1 1 1 10
9、 1 0 1 0 1 1 1 0 10 0 0 0 0 0 0 0 0 00 1 1 0 1 1 0 0 0 10 1 0 1 1 1 1 1 1 11 0 0 0 1 1 1 1 0 10 1 0 0 0 1 1 1 1 01 0 1 0 1 1 1 0 0 01 1 0 1 1 1 0 1 0 11 1 0 0 0 1 1 0 1 11 0 0 0 0 1 1 0 0 10 0 0 1 1 1 1 0 1 10 0 0 1 0 0 0 0 1 00 0 0 1 0 0 0 0 1 01 0 0 0 0 1 1 1 1 10 1 0 1 0 1 1 1 1 11 1 0 0 1 0 1 0
10、0 10 1 1 1 1 1 1 1 0 00 0 0 1 1 1 1 1 1 11 0 1 1 1 1 1 0 0 10 0 1 1 0 1 1 1 0 0 第三步:建立多元线性回归模型本题需要研究各个因素与大学毕业生就业率之间的关系,故建立多元线性回归的一般模型:Y = b0 + b1X1 + b2X2 + + b9X9 + ,其中,b0 ,b1 ,b2 , ,b9 是未知数参数,b0 为回归模型的常数,为随机误差。假定 N( 0 , 2),即 E(Y)= b0 + b1X1 + b2X2 + + b9X9 . 第四步:引入逐步回归模型进一步的,本题要求找出影响大学毕业生就业率的主要因素,
11、即从若干变量中选取对就业率影响最大的几个因素,并使自变量个数尽量少。为实现这一目标,引入逐步回归模型。逐步回归模型的基本思想如前1.1节中所述,在此不再重复。本题中的因变量为就业情况,自变量为性别、年龄、学历等因素,具体符号及赋值见1.3节所述。实际操作中,我们主要运用MATLAB编程进行求解。 第五步:模型求解 将得到的数据输入matlab程序进行求解,得到回归方程是:Y=-0.047632+0.324764X1+0.210202X2-0.608878X3+0.206894X4+0.241774X5+0.696961X6-0.294683X8 1.5 问题解答根据上面得到的数据,我们可以得到
12、以下结论:影响大学毕业生就业的主要因素分别为(按影响作用大小排序):专业前景、政治面貌、性别、课程是否适合社会、学历、专业、毕业生条件。1.6 模型评价l 该逐步回归模型具有以下优点: 逐步回归模型的思想简单易懂,且与本题要求甚为相符。 引入逐步回归模型可以免去多次重复计算多元线性回归,并且可以利用MATLAB软件简化运算。l 但由于处理水平有限,该模型有不可避免的局限性: 不能引进所有的变量。由于存在将定性变量定量化的困难,对于一些分类繁多的变量,如毕业院校、工作单位、具体毕业专业等,则无法引入该模型进行相关性分析。 数据容量有限,拟合出的方程精度不高,使得预测值与真实情况产生偏差。(二)问
13、题2:评价不同专业毕业生就业情况2.1 模型进一步假设1)假设就业情况的评价主要包括就业率、初次月薪及目前月薪。2)假设不同专业毕业生的就业状况主要由其专业类别决定。2.2 问题分析根据假设,不同专业毕业生的就业情况差异主要由其专业决定,所以可在所有数据中分专业择取部分样本进行各项指标的统计,并以此为依据评价其就业情况差异。2.3 数据统计 数据抽样利用EXCELL软件的自动筛选命令,在不同专业的数据中分别随机选出20条数据作为样本。 指标计算利用EXCELL软件的函数命令,分别对各专业的样本数据计算以下统计值:就业率,初次月薪均值,目前月薪均值。1) 利用COUNT命令统计总人数及已就业人数
14、,计算就业率。2) 插入函数AVERAGE计算初次月薪均值及目前月薪均值。 结果分析就业率是对某专业毕业生就业情况的综合评价,是其是否适合社会大生产要求的客观反映。根据前面的计算结果,由统计数据做出下图:不同专业毕业生就业率比较图00.20.40.60.81工科类管理类经济类理科类农林类师范类文史类专业就业率专业对口率图2 不同专业毕业生就业率比较图由图可知,各专业就业率差异不大。相较而言,工科类、经济类、管理类及理科类专业就业率较高,这可能与现代社会需求有关。薪金反映了毕业生就业的理想程度,也是评价就业情况的重要指标。下图为不同专业的就业薪金水平比较图:不同专业毕业生就职薪金比较图05001
15、000150020002500300035004000工科类管理类经济类理科类农林类师范类文史类专业薪金初次月薪目前月薪图3 不同专业毕业生就职薪金比较图尽管农林类与文史类的毕业生就业率不高,但就业部分的月薪水平相较其他专业类别却很高,这可能与他们的就业单位及岗位有关。综上,各专业毕业生就业情况各有所长但差别不大,工科类、经济类、管理类及理科类专业就业率较高,而农林类与文史类毕业生的就业薪金水平却相对较高。(三)问题3:给出某一专业毕业生的就业策略3.1 分析与运算任一专业的就业策略都需根据影响就业的因素来制定。现选定“计算机”专业进行分析研究。根据(1)题模型及运算方法,在计算机专业中任选12名从 “计算机”专业毕业的大学生的数据作为研究对象,模型化,得到的数据是:0 0 0 1 0 0 0 0 1 1 1 0 1 0 1 1 1 1