数据分析师CPDA复习主观题.ppt

上传人:pu****.1 文档编号:568491556 上传时间:2024-07-24 格式:PPT 页数:33 大小:1.60MB
返回 下载 相关 举报
数据分析师CPDA复习主观题.ppt_第1页
第1页 / 共33页
数据分析师CPDA复习主观题.ppt_第2页
第2页 / 共33页
数据分析师CPDA复习主观题.ppt_第3页
第3页 / 共33页
数据分析师CPDA复习主观题.ppt_第4页
第4页 / 共33页
数据分析师CPDA复习主观题.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《数据分析师CPDA复习主观题.ppt》由会员分享,可在线阅读,更多相关《数据分析师CPDA复习主观题.ppt(33页珍藏版)》请在金锄头文库上搜索。

1、复习大题中国商业联合会数据分析专业委员会数据分析师认证培训课程主观题1一元回归复习题:主观题1一元回归复习题:(1)绘制散点图,并计算相关系数,说明二者之间的关系;步骤:展示分析-散点图主观题1一元回归复习题:(1)绘制散点图,并计算相关系数,说明二者之间的关系;步骤:展示分析-散点图-计算相关系数ExcelDatahoop相关系数的值介于-1与+1之间,即-1r+1。当r0时,表示两变量正相关,当r0时,表示两变量为负相关。当|r|=1时,表示两变量为完全线性相关即函数关系。当r=1时,称为完全正相关,而当r=-1时,称为完全负相关。当r=0时,表示两变量间无线性相关关系。r仅仅是x与y之间

2、线性关系的一个度量,它不能用于描述非线性关系。r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。当r0.8时,可视为高度相关;当0.5r0.8时,可视为中度相关;当0.3r0.5时,视为低度相关;当r0.3时,说明两个变量之间的相关程度极弱。人均人均GDP与人均消费水平间的相关系数为与人均消费水平间的相关系数为0.998,说明两者间存在强烈的正相关关系。,说明两者间存在强烈的正相关关系。主观题1一元回归复习题:(2)人均GDP作自变量,人均消费水平作因变量,求出估计的回归方程,并解释回归系数的实际意义;Excel:利用系数表中的利用系数表中的结结果,回果,回归归方程方

3、程为为 ,其含,其含义义是人均是人均GDP每增加每增加1元,人均消元,人均消费费水平增加水平增加0.309元。元。主观题1一元回归复习题:(3)计算判定系数,并解释其意义;R2:判定系数/拟合优度(Y的总变动由X带来的有多少)Excel:判定系数是判定系数是0.996,说明方程解释人均消费,说明方程解释人均消费水平变化的水平变化的99.6%可以由人均可以由人均GDP的变化来的变化来解释。解释。主观题1一元回归复习题:(4)检验回归方程线性关系的显著性(a=0.05);F检验:回归线性关系检验(P值)T检验:回归系数检验(X对y的影响)小于拒绝,大于不拒绝:原假设,假设Excel:系数表中的系数

4、表中的Sig./P-value值值a,说说明回明回归归方程的方程的线线性关系性关系显显著性。著性。主观题1一元回归复习题:(5)如果某地区的人均GDP为5000元,预测其人均消费水平;步骤:预测分析Excel输入公式得出结果人均人均GDP为为5000元时,人均消费水平为元时,人均消费水平为2278.107元元主观题1一元回归复习题:(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。人均消费水平人均消费水平95%的置信区间为的置信区间为1990.749,2565.464和预测区间为和预测区间为1580.463,2975.75。主观题2多元回归复习题:主观题2多元回归复习题

5、:分析主观题2多元回归复习题:分析R2:判定系数/拟合优度(Y的总变动由X1、X2、X3带来的有多少,每增加一个变量,不管相不相关,拟合优度就会提高,因此要调整拟合优度)F检验:回归线性关系检验(概率P值/sig)原假设H0:所有系数都为0H1:至少一个不为0T检验:回归系数检验(X1、X2、X3对y的各自影响)多重共线性-主观题2多元回归复习题:分析主观题2多元回归复习题:分析去掉X1主观题2多元回归复习题:分析单独X2单独X3主观题2多元回归复习题:分析销售价格的预测值以及销售价格的预测值以及95%的置信区间和预测区间见上表。的置信区间和预测区间见上表。回归方程为回归方程为去掉的原则之一:

6、模型对数据较好的拟合,如果去掉后拟合数据差异较大就不合适去掉主观题3哑变量回归复习题:主观题3哑变量回归分析:回回归归方程方程为为 y=732.06+111.22x1+458.68x2男性男性职职工的平均月薪是工的平均月薪是732.06+458.68=1191,女性,女性职职工的平均月薪是工的平均月薪是732.06,男性男性职职工的平均月薪与女性工的平均月薪与女性职职工的平均月薪之工的平均月薪之间间的差的差值值是是 458.68 。工工龄龄每增加每增加1年,男性或女性月薪的平均增加年,男性或女性月薪的平均增加值值111.22 。主观题4已知某厂家的产量和生产费用数据,如下表,请根据生产费用和产

7、量数据进行如下分析:(所有结果保留两位小数)(1)请用生产费用作为因变量(Y),产量作为自变量(X),利用线性回归最小二乘法估计回归方程,显著性水平=0.05,根据分析结果判断是否可以做线性回归,并解释原因,列出回归方程,并且解释回归系数的实际意义。(2)根据回归分析结果,写出判定系数(R2)的值,并解释其值代表的实际意义。(提示:列出调整后的R2)(3)请根据第一问中求得的回归方程,估计如果产量为180,估计生产费用。主观题4(1)请用生产费用作为因变量(Y),产量作为自变量(X),利用线性回归最小二乘法估计回归方程,显著性水平=0.05,根据分析结果判断是否可以做线性回归,并解释原因,列出

8、回归方程,并且解释回归系数的实际意义。:通过线性回归分析结果可以看出,线性回归方程Y=aX+b检验结果F检验p值=3.06*10-9,X回归系数检验结果p=3.06*10-9,均小于0.05,因此F检验和T检验均通过,所以可以做线性回归,根据结果列出回归方程为Y=5.12X+276.24。其中X的系数为5.12,截距为276.24,因此可以看出产量增加1,,生产费用增加5.12。得分点:列出F检验的p值和X系数检验的p值;列出回归方程Y=5.12X+276.24;解释含义主观题4(2)根据回归分析结果,写出判定系数(R2)的值,并解释其值代表的实际意义。(提示:列出调整后的R2):根据回归结果

9、可以看出调整后的R2=0.86,R2代表模型的拟合度,它越接近1代表拟合度越好,根据此模型的R2的值可以看出模型拟合度良好。得分点:列出R2的值;解释含义主观题4(3)请根据第一问中求得的回归方程,估计如果产量为180,估计生产费用。根据题目可知,当X=180时,Y=5.12*180+276.24=1197.84Datahoop预测分析:主观题5一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型的回归模型,以此对运费作出预测。该运输公司所运输的货物分为两种类型:易碎品和非易碎品。下表给出了15个路程大致相同、而货物类型不同的运输费用数据(1)写出运输费用与货物类型之间的线

10、性方程。(2)对模型中的回归系数进行解释。(3)检验模型的线性关系是否显著(a=0.05)主观题5(1)写出运输费用与货物类型之间的线性方程。回归方程:y=4.543+7.082x主观题5(2)对模型中的回归系数进行解释。回归方程:y=4.543+7.082x解释:“易碎品”的预期运输费用比非易碎品的预期运输费用多7.082元(3)检验模型的线性关系是否显著(a=0.05)p0.05,所以通过检验主观题6某厂生产甲乙两种产品,都经过A、B两个工序,分别有A1、A2和B1、B2两台设备。甲产品可在A、B任何一种设备上加工,乙产品可在工序A的任一种设备上加工,但B工序只能在B1设备上加工。单位产品

11、的工序加工时间、原材料费用、售价,以及各设备的单位时间加工费用、设备有效使用时间如下表所示。要求:合理安排生产计划,使该厂获利最大。主观题61.列生产计划方案:变量设置:甲产品的四种方案A1B1、A1B2、A2B1、A2B2的产量分别为X11、X12、X21、X22;乙产品的两种方案A1B1、A2B1的产量分别为Y11、Y212.目标函数:获利=收入-成本(两项:原材料和设备加工费)收入-原材料成本(1.25-0.25)*(x11+x12+x21+x22)+(2-0.35)*(y11+y21)设备加工费0.05*(x11+x12)*5+y11*10)+0.03*(x21+x22)*7+y21*

12、9)+0.06*(x11+x21)*6+(y11+y21)*8)+0.11*(x12+x22)*4max(1.25-0.25)*(x11+x12+x21+x22)+(2-0.35)*(y11+y21)-0.05*(x11+x12)*5+y11*10)-0.03*(x21+x22)*7+y21*9)-0.06*(x11+x21)*6+(y11+y21)*8)-0.11*(x12+x22)*4主观题6规划结果:X11、X12、X21、X22分别为0、965、0、785,Y11、Y21分别为0、500,总利润为1023.9元。约束条件:5*(x11+x12)+10*y11=60007*(x21+x2

13、2)+9*y21=100006*(x11+x21)+8*(y11+y21)=40004*(x12+x22)=0,且为整数主观题7某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成时间以及各作业的紧前作业。指定用PERT图和线性规划的方法求解下面的问题。主观题7某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成时间以及各作业的紧前作业。指定用PERT图和线性规划的方法求解下面的问题。主观题7某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成时间以及各作业的紧前作业。指定用PERT图和线性规划的方法求解下面的问题。主观题8假设一个地区的总悬浮微粒(TSP)来源于当地的三个工

14、厂。若工厂1和工厂2燃煤TSP排放因子为95kg/t(煤),工厂3的TSP排放因子为85kg/t(产品)。工厂3产量为250000t(产品)/a,工厂1和工厂2的燃煤量分别为400,000t/a和300,000t/a,为了满足环境质量要求,TSP最大允许排放量为17,600,000kg/a,各种除尘设备效率和各种除尘方法的费用如下表所示:要求:以最小的治理费用达到环境目标。主观题8变量设置:工厂1四种方案X10X11X14X15费用分别为C100.0,C111.0,C142.0,C152.8,工厂2四种方案X20X21X24X25费用分别为C200.0,C221.4,C242.2,C253.0,工厂3五种方案X30X31X32X33X34费用分别为C300.0,C311.1,C321.2,C331.5,C343.0目标函数:min=1.0x11+2.0X14+2.8X15+1.4X21+2.2X24+3.0X25+1.1X31+1.2X32+1.5X33+3.0X34

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号