多元统计和SAS (7)-(8)

上传人:206****923 文档编号:47526155 上传时间:2018-07-02 格式:PDF 页数:70 大小:841.29KB
返回 下载 相关 举报
多元统计和SAS (7)-(8)_第1页
第1页 / 共70页
多元统计和SAS (7)-(8)_第2页
第2页 / 共70页
多元统计和SAS (7)-(8)_第3页
第3页 / 共70页
多元统计和SAS (7)-(8)_第4页
第4页 / 共70页
多元统计和SAS (7)-(8)_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《多元统计和SAS (7)-(8)》由会员分享,可在线阅读,更多相关《多元统计和SAS (7)-(8)(70页珍藏版)》请在金锄头文库上搜索。

1、多元统计和多元统计和SAS第七讲第七讲相关和回归分析相关和回归分析多元统计和多元统计和SAS第七讲第七讲1、变量间的关系、变量间的关系2、定量变量间的关系、定量变量间的关系3、定量变量的线性回归分析、定量变量的线性回归分析4、Logistic回归回归多元统计和多元统计和SAS第七讲第七讲1、变量间的关系、变量间的关系多元统计和多元统计和SAS第七讲确定性关系 函数关系第七讲确定性关系 函数关系圆的面积与半径的关系;位移与速度的关系圆的面积与半径的关系;位移与速度的关系非确定性关系 相关关系和回归关系非确定性关系 相关关系和回归关系身高和体重身高和体重多元统计和多元统计和SAS第七讲第七讲例例.

2、 广告投入和销售之间的关系广告投入和销售之间的关系AD14121086420SALE706050403020100是否有关系?关系是否显著?用模型来描述?是否带有普遍性?是不是因果关系?是否有关系?关系是否显著?用模型来描述?是否带有普遍性?是不是因果关系?多元统计和多元统计和SAS第七讲第七讲模型模型?模型模型 Y=f(X)?自变量和因变量自变量和因变量?回归回归?预测预测多元统计和多元统计和SAS第七讲第七讲变量间的关系变量间的关系81.058.5171.01胸围x3(cm)体重x2(kg)身高x1(cm)编号71520972女510251085男高收入中收入低收入高收入中收入低收入观点:

3、赞成观点:反对性别BA52%15000学校1招生范围研究生比例在校人数多元统计和多元统计和SAS第七讲第七讲2、定量变量间的关系、定量变量间的关系多元统计和多元统计和SAS第七讲第七讲1078对父亲及成年儿子的身高散点图1078对父亲及成年儿子的身高散点图多元统计和多元统计和SAS第七讲第七讲相关系数含义相关系数含义线性相关或围绕直线群集程度的一种度量。线性相关或围绕直线群集程度的一种度量。多元统计和多元统计和SAS第七讲第七讲YX=0YX=-.8YX=.8YX=0YX=-1YX=1多元统计和多元统计和SAS第七讲第七讲散点图的作用散点图的作用两个定量变量没有关系,就谈不上建立模型或 进行回归

4、。确定两个变量有没有关系的最简单办法就是画 出它们的散点图。两个定量变量没有关系,就谈不上建立模型或 进行回归。确定两个变量有没有关系的最简单办法就是画 出它们的散点图。多元统计和多元统计和SAS第七讲第七讲三种相关系数三种相关系数Pearson相关系数:相关系数:线性相关系数。它一般用字母r表示.Kendall相关系数:相关系数:把所有的样本点配对,看每一对中的x和y是否都增加来判断总体模式.Spearman秩相关系数:秩相关系数:把点的坐标换成各自样本的秩.多元统计和多元统计和SAS第七讲第七讲某学校随机抽取18名学生,测定其智商(IQ)值,连同当年数学和语文成绩,数据见下表。某学校随机抽

5、取18名学生,测定其智商(IQ)值,连同当年数学和语文成绩,数据见下表。76120110971057510010095智商181716151413121110编号819988957567454873数学889292977870435375语文1026165912595988113899871257889696829358858524607061361768429283781智商语文数学编号多元统计和多元统计和SAS第七讲第七讲data iq; input no math chinese IQ ; cards; 1788395 28476100 36170100 4525875 59382105

6、 6897897 79889110 89895120 9656176 10737592 11485361 12454360 13677088 14757896 159597125 168892113 179992125 188188102 ;symbol1 v=dot cv=red h=1 ;symbol2 v=star cv=green h=2 ;proc gplot;plot chinese*IQ=1 math*IQ=2/overlay;run;proc corr kendall spearman;var math chinese IQ;run;SAS程序SAS程序多元统计和多元统计和SA

7、S第七讲第七讲多元统计和多元统计和SAS第七讲第七讲分析变量中两两之间的简单相关分析,用corr过程;分析变量中两两之间的简单相关分析,用corr过程;当两变量都服从正态分布时,计算pearson相关系数;当两变量都服从正态分布时,计算pearson相关系数;当变量不服从正态分布或为等级数据时,应采用 Kendall或Spearman相关系数;当变量不服从正态分布或为等级数据时,应采用 Kendall或Spearman相关系数;Spearman相关可用于双向有序分类变量之间是否有关联 的分析,也称为秩相关。Spearman相关可用于双向有序分类变量之间是否有关联 的分析,也称为秩相关。多元统计

8、和多元统计和SAS第七讲第七讲偏相关偏相关去除第三个变量对两变量之间相关的影响去除第三个变量对两变量之间相关的影响proc corr nosimple;var chinese;with math;run;某人有一小孩,又在家旁种树苗一株,发现儿长树长,并积累了数据。计算发现,树高与儿高具有相关性?某人有一小孩,又在家旁种树苗一株,发现儿长树长,并积累了数据。计算发现,树高与儿高具有相关性?proc corr nosimple;var math chinese;partial IQ;run;多元统计和多元统计和SAS第七讲第七讲3、定量变量的线性回归分析、定量变量的线性回归分析多元统计和多元统计

9、和SAS第七讲第七讲一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型回归模型回归模型多元回归多元回归多元回归多元回归一元回归一元回归一元回归一元回归线性 回归线性 回归线性 回归线性 回归非线性 回归非线性 回归非线性 回归非线性 回归线性 回归线性 回归线性 回归线性 回归非线性 回归非线性 回归非线性 回归非线性 回归回归模型的类型回归模型的类型多元统计和多元统计和SAS第七讲第七讲线性回归模型线性回归模型前提条件是前提条件是Y与自变量线性相关;与自变量线性相关;Y=f(x1,x2,xm)+t;参数估计方法最小二乘法;回归方程的显著性检验;回归系数的显著性检验。

10、;参数估计方法最小二乘法;回归方程的显著性检验;回归系数的显著性检验。多元统计和多元统计和SAS第七讲第七讲一元线性回归分析一元线性回归分析实测的标准物质浓度色谱峰面积的数据。实测的标准物质浓度色谱峰面积的数据。487073616264341876143236313481200290367796623649917861881940626色谱峰面积标准物浓度根据问题的实际意义来判断是否有截距。根据问题的实际意义来判断是否有截距。多元统计和多元统计和SAS第七讲第七讲data reg;input y x;cards;6261881940786236499196629036771200 363134

11、81432 43418761626 4870736;symbol1 v=dot cv=red h=1 ;symbol2 v=dot cv=red h=1 i=rl ci=blue w=2;proc gplot;plot y*x=1 y*x=2/overlay;proc reg;model y=x;/* proc reg;model y=x / noint;*/run;多元统计和多元统计和SAS第七讲第七讲多元统计和多元统计和SAS第七讲第七讲多元统计和多元统计和SAS第七讲第七讲Root MSE:残差标准差,反映回归方程的精度,其值越小说明回归效果越好;R-square:说明所有自变量能解释Y

12、变化的百分比,其值越接近1,说明模型越好。多元统计和多元统计和SAS第七讲第七讲多元统计和多元统计和SAS第七讲第七讲多元线性回归分析多元线性回归分析某校20名学生体重、胸围、肩宽和肺活量的数据。对影响肺活量的有关因素作多元回归分析。某校20名学生体重、胸围、肩宽和肺活量的数据。对影响肺活量的有关因素作多元回归分析。data a; input x1 x2 x3 y; cards; 51.3 73.6 36.4 2.9948.9 83.9 34.0 3.11 42.8 78.3 31.0 1.9155.0 77.1 31.0 2.63 45.3 81.7 30.0 2.8645.3 74.8 3

13、2.0 1.91 51.4 73.7 36.5 2.9853.8 79.4 37.0 3.28 49.0 72.6 30.1 2.5253.9 79.5 37.1 3.27 48.8 83.8 33.9 3.1052.6 88.4 38.0 3.28 42.7 78.2 30.9 1.9252.5 88.3 38.1 3.27 55.1 77.2 31.1 2.6445.2 81.6 30.2 2.85 51.4 78.3 36.5 3.1648.7 72.5 30.0 2.51 51.3 78.2 36.4 3.1545.2 74.7 32.1 1.92 ; run;多元统计和多元统计和SA

14、S第七讲第七讲proc reg;model y=x1 x2 x3;run;多元统计和多元统计和SAS第七讲第七讲并不是所有自变量对应变量的回归作用都有统计学意义;如果漏掉对应变量影响显著的变量,预测偏差;如果包含对应变量影响不大的变量,影响精度。并不是所有自变量对应变量的回归作用都有统计学意义;如果漏掉对应变量影响显著的变量,预测偏差;如果包含对应变量影响不大的变量,影响精度。多元统计和多元统计和SAS第七讲第七讲最优模型:最优模型: 统计上有显著性意义的统计上有显著性意义的xj都含在模型中;都含在模型中; 统计上无显著性意义的统计上无显著性意义的xj都不含在模型中。当自变量较多时,获得最优模

15、型的方法一般采用逐步回归的方法,即依次分析所有可能的模型,逐步地达到最优模型的条件。都不含在模型中。当自变量较多时,获得最优模型的方法一般采用逐步回归的方法,即依次分析所有可能的模型,逐步地达到最优模型的条件。多元统计和多元统计和SAS第七讲第七讲常用的三种逐步回归法常用的三种逐步回归法FORWARD前进法:前进法:从模型中没有变量开始,每次将一个最显著的变量引入模型,直到模型以外的变量不再有显著的下值为止;BACKWAND后退法:后退法:从模型中含所有自变量开始,每次从模型中剔除一个贡献最小的变量,直到模型中只剩下均为显著的变量为止;STEPWISE逐步法:逐步法:每次引入模型一个最显著的变

16、量,然后考虑从模型中剔除一个最不显著的变量,直到既没有变量引入也没有变量剔除为止。多元统计和多元统计和SAS第七讲第七讲proc stepwise;model y=x1 x2 x3 /sle=0.05 sls=0.05;/* 确定自变量进入模型和剔除出模型的标准 */* 确定自变量进入模型和剔除出模型的标准 */ run;PROC STEPWISE ; MODEL 因变量因变量=自变量选项;自变量选项; RUN;多元统计和多元统计和SAS第七讲第七讲多元统计和多元统计和SAS第七讲第七讲多元统计和多元统计和SAS第七讲第七讲多元统计和多元统计和SAS第七讲第七讲多元统计和多元统计和SAS第七讲第七讲多元统计和多元统计和SAS第七讲第七讲回归

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号