第6章回归分析

上传人:cn****1 文档编号:570737422 上传时间:2024-08-06 格式:PPT 页数:114 大小:1.48MB
返回 下载 相关 举报
第6章回归分析_第1页
第1页 / 共114页
第6章回归分析_第2页
第2页 / 共114页
第6章回归分析_第3页
第3页 / 共114页
第6章回归分析_第4页
第4页 / 共114页
第6章回归分析_第5页
第5页 / 共114页
点击查看更多>>
资源描述

《第6章回归分析》由会员分享,可在线阅读,更多相关《第6章回归分析(114页珍藏版)》请在金锄头文库上搜索。

1、8/6/2024统计学第3章参数估计6-1统计学统计学费宇,石磊费宇,石磊 主编主编高等教育出版社高等教育出版社裸建衅端普速锣肖溜涉盲萍蜀坷基奏磅逝怔郊议颖欢饭靡雨夺喝鼎历邦钝第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-2第第6章章 回归分析回归分析F6.1 相关分析相关分析F6.2 一元线性回归一元线性回归F6.3 多元线性回归多元线性回归F6.4 虚拟变量回归虚拟变量回归F6.5 Logistic回归回归F6.6 回归分析的扩展回归分析的扩展F6.7 可化为线性情形的非线性回归可化为线性情形的非线性回归躯侵吧澄昧义睹吧尸诣渤瓶确贵排互裙蔷哨攻疗豁性宏昌货制婆篮贞复摘

2、第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-3【引例【引例6.0】F(数据文件为(数据文件为example 6.0)某公司经理想)某公司经理想研究公司员工的年薪问题,根据初步分析,研究公司员工的年薪问题,根据初步分析,他认为员工的当前年薪他认为员工的当前年薪y(元元)与员工的开始与员工的开始年薪年薪x1(元元)、在公司的工作时间、在公司的工作时间x2(月月)、先、先前的工作经验前的工作经验x3(月月)和受教育年限和受教育年限x4(年年)有有关系,他随机抽样调查了关系,他随机抽样调查了36个员工,收集个员工,收集到以下数据:到以下数据:岔歹镶夕禹睫隅抹兹颜茨炒檀悦适讯鲁汀

3、谅奥范鞍馋棉误需九搬亡分仙渴第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-4蜘封跋邵廖倔诀惦谈入扫舀乏貉妒畦阎伏屉屎副锦艾碱掀以奄硝公涅腑慢第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-5问题问题F经理想根据以上样本数据,构建一个模型经理想根据以上样本数据,构建一个模型来反映来反映y与与x1、x2、x3和和x4之间关系,并希望之间关系,并希望利用该模型在给定一个员工的利用该模型在给定一个员工的x2、x3和和x4的的条件下,预测该员工的当前年薪条件下,预测该员工的当前年薪y。F此外,经理认为,公司男女员工的薪水结此外,经理认为,公司男女员工的薪水结构不

4、同,他想在建立模型的时候能把性别构不同,他想在建立模型的时候能把性别因素考虑进来,这是否可行?因素考虑进来,这是否可行? 在彪童出抢仆望钵退丸洽辗霞唾汇暴塘制骋驰践窒笨逗笔搁裤丽遂笆劳婶第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-66.1 相关分析相关分析F6.1.1 相关的概念相关的概念 F1. 人的身高与体重有相关关系。人的身高与体重有相关关系。F2. 居民可支配收入与支出有相关关系。居民可支配收入与支出有相关关系。F3. 粮食产量与施肥量有相关关系。粮食产量与施肥量有相关关系。 晃纹总壮粳淋采杆堤起暮恕乍毯霓佛姬冈畦荒漫阑洪迅侵贱躁竣乡瞒咒蒜第6章回归分析第6章回

5、归分析8/6/2024统计学第3章参数估计6-76.1.2 相关的种类相关的种类F1. 按相关程度划分按相关程度划分: 分为完全相关、不完全分为完全相关、不完全相关和不相关;如图相关和不相关;如图6.1所示。所示。F2. 按相关方向划分按相关方向划分: 分为正相关和负相关。分为正相关和负相关。如图如图6.2所示。所示。F3. 按相关形式划分按相关形式划分: 分为线性相关和非线性分为线性相关和非线性相关;如图相关;如图6.3所示所示 。 F4. 按变量多少划分按变量多少划分: 分为简单相关和复相关。分为简单相关和复相关。 载件惯幽凡垦仪捅柑竖靖沼顺雾济梨诲距琉傍锁武框赌盎滔辩洁申迹鸳岔第6章回归

6、分析第6章回归分析8/6/2024统计学第3章参数估计6-86.1.3 相关关系的度量相关关系的度量F1. 简单线性相关系数简单线性相关系数 无脯钵堂伶荷碌额蹦孝树淘酷编毗壁饮皱嗓贱评苯闽干任仔害娥粥兔饱阉第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-9剔茄荷服柴量悠参秘拨淄诫歇嘻贱匝馁穷结恫肌氯阮终雀邮族麓缄贪实霜第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-10争泻懈峨硫牺傍俘档茎餐逆的脑住农寄锣扳兔穿碍疤放蠕笔逸蓖括等唾猩第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-112. 偏相关系数偏相关系数竭宿滦浊漫拯履提帆蘸蜘灌健

7、瑚瓶认蛔新嫌诈唾最甩哎舅管试赂痢妓害耶第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-12【例【例6.1】 舅梭锹舆娥拿绰坠壮奴楚焰凑贞肝厌惋母井垄浦马蔼掸挨楼溺蹦鳃停阔玲第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-13帮珊益责鸵埔泞蹋礼尾半俘檄扇渴巧甸斜买富帝键芬沿瑰日靖实瘦缅聪陆第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-14窄胯赣圃赏财么瞎护愤绚丑促念疚奋丁宝胆酷鼎泽饭趟讯力缄迈毙哨版钒第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-156.2 一元线性回归一元线性回归F6.2.1 回归的含义回归的含

8、义F回归(回归(regression)一词最早由英国生物)一词最早由英国生物学家兼统计学家高尔顿(学家兼统计学家高尔顿(F.Galton)于)于1886年在论文年在论文“Regression towards mediocrity in hereditary stature”中正式中正式提出。提出。F回归分析(回归分析(regression analysis)是通过)是通过建立回归模型来研究相关变量的关系并作建立回归模型来研究相关变量的关系并作出相应估计和预测的一种统计方法,出相应估计和预测的一种统计方法, 蝗刮舵档氏年创笋咬之爆脚女佰灵噬隅情胺猾吹理会物须旺危窗仇闸托象第6章回归分析第6章回归

9、分析8/6/2024统计学第3章参数估计6-166.2.2 一元线性回归一元线性回归学悦洒衍悟鳖萄瘩景休变署扇时换举烈壮锨铬斋孵谆伦桐芍睡勋昆痛惯轿第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-17檬坎捧颤嘱索砰依知链伸曰梭绣省驶镶烙庸别斑汝馒栖菲巩宫厌奴倪忱基第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-186.2.3 最小二乘估计最小二乘估计图图6.4 x和和y的散点图的散点图呵碉纠菱沧俘番戌槐藕涡鞭义祖文吾距钮湘厚衷尺振萌荤诀希锋鞠踪睫蔗第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-19行妊情终俞嫉聊烃棺谩梆恿秒思洼募绕咽

10、狐蜒响蔼厅箭淆犁儿它群膘翅泄第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-20盯龋藕凸吸复鸯裳骡蔫归缔舔妖眨联卒蔗炯列巩俺屯奠裳狡顶捌愈歼凌间第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-21奴抚淫侗埂莫硒崭停饺摔狰陀锨祖参谢授龚蔗警当坯甥哎杖栗毙坊祭垫吠第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-22栅晃壕稗侈苍隅李燥盔衍谗函聋乌袍粥瓜僧蒜奔借盐壬酉辆焦山致公婴油第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-23瓷堑捧疯碘釉唤抽毗彻范烩摈呕灾小矿汕优札监掇鲸斑核契周惑遏顿况阎第6章回归分析第6章回归分析

11、8/6/2024统计学第3章参数估计6-24【例【例6.2】F(数据文件为数据文件为example 6.2) 已知我国已知我国2007年年31个地区城镇居民年人均可支配收入和个地区城镇居民年人均可支配收入和年人均消费性支出数据如下表(单位:元)年人均消费性支出数据如下表(单位:元),试分析城镇居民年人均可支配收入和年,试分析城镇居民年人均可支配收入和年人均消费性支出之间的关系,如果有线性人均消费性支出之间的关系,如果有线性相关关系,试建立一元线性回归模型。相关关系,试建立一元线性回归模型。 郁度蔬盈唱中槽禁择八蚌辫氰骸附绕沿挝再百乔序赎幸拼搜优泣哑氧荔贞第6章回归分析第6章回归分析8/6/20

12、24统计学第3章参数估计6-25弥送茵本仪淤潮踌真垄醛檬彪裳潍搞拢惊忱抒杜饰柠舆激锗厉菲哺璃芬歧第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-26图图6.5人均可支配收入人均可支配收入x和人均消费性支出和人均消费性支出y散点图散点图 副掸旋腾茬业痢咋札镐兑辉腰瘪于嫩痒焕秧依搅冗阐枝寂洞筋青又割震趟第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-27苟垦拓俯凋宽咱敏褒畔陆弧节梁牵肯券溜撬藉锭程灵魏忱宣嫉谤彰番碟莫第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-28迈疯份恢身脚革普冶饭干非断缘捍堑泣籽掐呈备枷于酞雄狐畏鹰屉肉通际第6章回

13、归分析第6章回归分析8/6/2024统计学第3章参数估计6-29躬懈癣醉虫耕瘁挠响儡遮驴躇殃颗塌阵弘咸弘汕婴镑栅骇赠枢蜜市鄂反骡第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-306.2.4 回归方程的检验回归方程的检验 焙倍厘途袍紫腿化办目苗还寇导宦壬毡足鱼仍假捆它臃涪幽水讣卒谊翘氨第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-311. F检验检验罢窃猎杭符绑降乔王郴露挽肘苇绎竹贫爆苛修钨峰盗珠肥扁挎剃嘘清檄亮第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-32隘极诽芭成膨雹授妄智瞎蔑墓稼唯役娥听憋卿凛鳃葛挽待阻罚喷释撒肚伞第6章

14、回归分析第6章回归分析8/6/2024统计学第3章参数估计6-33砌滩秽泅慷桩室冗南瞄肠镰见颊贯脾百拷抵乃困砾逼钞淫窟阵孕轮涌劲算第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-34墅郸悼您祝荆尚出野碳货超梭阎瞬撑裤酣工坝朗缩捏寅命鲁寄篱遥竟铭弘第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-352. t检验检验拯渗埂暑侗羽赋软棒炽王并幌付绥蔡遏钟郭涛架碑闹凄涝关抑菠咱涉仙灯第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-363.r检验检验慈丝龚屁敦咯吟匿找协乃琴绪邵积唆幂癌佣晾职粱伏洱戴虾取舆穴木龙媳第6章回归分析第6章回归分析8/

15、6/2024统计学第3章参数估计6-37有榷尤秀惩读敖里屋拿啡何温喉汰樱扛苦均翅穿樊延裳枢旗燎资宫掠丁做第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-38【例【例6.3】F给定显著水平,对例给定显著水平,对例6.2的回归方程进行检的回归方程进行检验。验。钱珠早马祈邯宫傻替钉屁屈瑚练略弄扯沏乞弱哥痕掉宫酶腥邀啃啤摹级健第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-39话阿气蜀倒杨悬心私味瞳涵靴墩举驱栏近哟普躯蛔抵俗翻肌芦罕泽费烯糜第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-40署乐绅梦统砷厌昂局慷蛔慕桩猖堡舷骆曰东绽娠夯孟径遇洞

16、坦供姜俏舷裸第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-416.2.5 估计与预测估计与预测拉绩箱捶丧翘级严橡传幼铣庙咋潘骗吭伊泛涟绪七孰汐华锁坷扬将屈膝瘫第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-42锰抽疚家利见艾陪鳖仙污韦踏爪送胯菲洞獭坞习湃斌讯求怔杭荔踏笨酶养第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-43图图6.6 回归预测的预测区间回归预测的预测区间怯乌志祝猖少忱梆搁渺派啮缀倪质荚假严吹汉遇雍薯夏背村韦慨别舌欣曹第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-446.3 多元线性回归多元线性

17、回归F6.3.1 多元线性回归模型多元线性回归模型拴幌醚妄拇折欧喊沫设甲匣糕鹿秦略腋钦呕友颅刚磋请翘夺思极件魂餐亏第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-45引入矩阵符号引入矩阵符号 文渭殊啥公疾镜妒催尸灵艺仗褂蔼漫徒墟谆吊养磷撰为酗伺泄谬拇匠篓府第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-46删力朗马砰幌交骑坍瘫括吠许鸽著凌碳锗殊伺框窑座史尚镁茎椭迭官高屹第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-47家悉爵丁驴显巩妙饵凳镰窟坡柒漏朵案趟杠隅轿窑罕烬氯粮那恫惮漫酵泼第6章回归分析第6章回归分析8/6/2024统计学第

18、3章参数估计6-486.3.2 多元线性回归方程的检验多元线性回归方程的检验锭劈沥纫称代涣琅爸袱树纲秤缉鄂莉障映陕粕婿东即与抬骤寡谭银郁鸵境第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-49椎彪麓芜半规为霍梢京暂惹陷姐眠袒披川帆夹冀退稽妈绳钩岛毫融邦窑仿第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-502. 方程显著性检验方程显著性检验锄缝状桃蛤乌员奠吨参佬岛碎抡诚苫磁纠线先讳缀霓潦么式肘肇绪闯委零第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-51瓜醚须靶限糕酿韦剑掺牙忌灵尿抛尸换并恩肉樊木酶雏定义吃阴乏长函殖第6章回归分析第6

19、章回归分析8/6/2024统计学第3章参数估计6-52表表6.11 多元回归方程显著性检验的方差分析表多元回归方程显著性检验的方差分析表砖赖乡胰烂酸小粘嗽烫跳卞蜡血炎隶肪寂羊镀杆间也潮呆句料忙侧休蚤穷第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-533. 回归系数显著性检验回归系数显著性检验蛰南苏绢烤汉瓤叶策柞广肉迅桨惨檬蚁蔚素谜乓浆沟伶兄聘羡欠表适赋务第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-54【例【例6.5】F(数据文件为数据文件为example 6.0) 沿用本章引例中沿用本章引例中的资料,建立多元线性回归方程并对回归的资料,建立多元线性

20、回归方程并对回归方程进行检验(给定显著水平方程进行检验(给定显著水平=0.05)。)。F解:解: 1. 先点散点图,用先点散点图,用SPSS打开数据文打开数据文件件example 6.0,选择,选择GraphsLegacy DialogsScatter/Dot.Simple Scatter,点,点Define,将两个变量开始年薪,将两个变量开始年薪x和当前和当前年薪年薪y分别选入分别选入X Axis和和Y Axis,点,点OK。 许揩妻莆啡楞疚鳞胸鞠址筛砸夫预搅挝忌锌钒癌裁隔艺茎绍押幼懂涪箩骗第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-55图图6.7 当前年薪对开始年薪

21、的散点图当前年薪对开始年薪的散点图 敞阵罚贤啦抿痘保售捏棱孟卿亨窗死镍画政坷喊罐希吏幢攫夺团鞘凰潍径第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-562做多元线性回归:做多元线性回归: F选择选择AnalyzeRegressionLinear,将,将自变量开始年薪、工作时间、先前工作经自变量开始年薪、工作时间、先前工作经验和受教育年限选入验和受教育年限选入Independent,再将因,再将因变量当前年薪变量当前年薪y选入选入Dependent中,然后选中,然后选择择Method为默认值为默认值Enter,点,点OK即可得即可得3个主要表格个主要表格 :表:表6.12至至

22、6.14。 卯痉磅侈贡确吗酥济迄叙讹隔菩眺黔玄掇时哟炽取蚕藻豌灯牌赁紫鲍阶站第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-57表表6.12 员工年薪问题的回归方程的可决系数员工年薪问题的回归方程的可决系数俏镣衰原妹血拱毋钻巍媳乔葡石店乙位雷彩扁孝圆瓶李慰笛续湃英圆剧邹第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-58表表6.13 员工年薪问题的方差分析表员工年薪问题的方差分析表目晋尾捎惜歌呵曳绸李柿田威衰篷鸡倍硕资仓素顽完段掇囱桨卑认歌秘左第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-59表表6.14 员工年薪问题的多元回归方程

23、回归系数表员工年薪问题的多元回归方程回归系数表彤亭哇黑巷掸躯贷汛芋挽舔芬认航博琼柏铂斡佬托包七扛占爽辐榴掖拌轿第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-60于是可得如下回归方程:于是可得如下回归方程:F从回归方程可以看出:当前年薪从回归方程可以看出:当前年薪y与开始年与开始年薪薪x1和受教育年限和受教育年限x4正相关(回归系数为正)正相关(回归系数为正),这是合理的;但与工作时间,这是合理的;但与工作时间x2和先前工作和先前工作经验经验x3负相关(回归系数为负),这是不合负相关(回归系数为负),这是不合理的,为什么?理的,为什么?桅玛盅愉侣路炒掖助储鹃客骚冻涸霓斗望年

24、腆降牙生业拜恭士逮漱扼锯刘第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-613对回归方程进行检验。对回归方程进行检验。秧诧卖滩苟石咋燕根奋际纂存夹阮妮矽蔑英潍咋焉墅操锻嗜捻惹蟹体浅迫第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-626.3.3 估计与预测估计与预测F1. 均值均值E(y0)的估计的估计挞傀掐洗法朔戎动算疆丢碟建拜唬佩那梯铅北颂谷疵细舱斌胰嘿疑氏桩园第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-632. 个值个值 y0的预测的预测披统延芹石裸忆腰昏擎宗药冬委坑芬痞野少酪灼搞衷童肉付前孵侈卞紊弓第6章回归分析第6章回

25、归分析8/6/2024统计学第3章参数估计6-646.4 虚拟变量回归虚拟变量回归柱俄堰洁茎握怜第口赔禁峙尹颤凄卧法廷亏鉴居乙儡馒娜蒋右玄族镇敲脆第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-65【例【例6.6】 F在例在例6.5中,将性别作为虚拟变量引入回归中,将性别作为虚拟变量引入回归方程,建立当前年薪方程,建立当前年薪y关于受教育年限和性关于受教育年限和性别虚拟变量的线性回归模型。别虚拟变量的线性回归模型。 F解:解: 性别性别x5是虚拟变量,所以这是虚拟变是虚拟变量,所以这是虚拟变量回归问题;将性别变量量回归问题;将性别变量“量化量化”, x5=0表示男性,表示男

26、性, x5=1表示女性,统计模型设定表示女性,统计模型设定为为 淮久垃柑价届橙锥沫炉节蔬烘臂浊浸脸钩憨呐肤压贰哉镶咎扎竭陪赤迟买第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-66F用用SPSS打开数据文件打开数据文件example 6.0,选择,选择AnalyzeGeneral Linear ModelUnivariate,将因变量当前年薪,将因变量当前年薪y选入选入Dependent Variable中,把定量自变量受教育年限中,把定量自变量受教育年限x4选入选入Covariate中,中,把虚拟变量性别把虚拟变量性别x5选入选入Fixed Factor中,在中,在Opt

27、ions中选择中选择Parameter Estimates,点击,点击Model,在,在Specify Model中选中选Custom,再把定,再把定量自变量量自变量x4和虚拟变量和虚拟变量x5选入右边,在选入右边,在Building Term中选中选Main effect,然后点,然后点Continue回到主回到主对话框,在对话框,在Options中的中的Display中选择中选择Parameter estimates,点,点ContinueOK即可得即可得参数估计值表表参数估计值表表6.15。涣觉逢稚颧炙吻潞烟鸦瞅澄易收嘴回例纂伞竣网扬尊蝇诡衍尾锨呼必辞灵第6章回归分析第6章回归分析8/6

28、/2024统计学第3章参数估计6-67表表6.15 引入性别虚拟变量的线性回引入性别虚拟变量的线性回归模型回归系数表归模型回归系数表蚊彪淋娠岔漂肮名擞奖斑械分晴蛛跃猫糙血速服弃邵俊卡宰掣潍彭球掺踊第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-68由表由表6.15容易得如下回归方程容易得如下回归方程F显然,这两条线是截距不同的两条平行线,显然,这两条线是截距不同的两条平行线,截距的差异表示男女职工年薪的差别。截距的差异表示男女职工年薪的差别。 苑戍阁醋彦注打侵蹲爵涌狗靳玻娘偶椿迸炙闲挚吐烘班耿送毗控叭裙些病第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-

29、696.5 Logistic回归回归F本节讨论因变量是二值定性变量的回归,本节讨论因变量是二值定性变量的回归,即即Logistic 回归。回归。 封宇汛儒橡灾求渍掌邢掸维邮吭延蓑哄氛殉眩利酸差碍粒饺蛔耀臻掌学痈第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-70【例【例6.7】 F为了研究家庭年收入与是否有私家车的关为了研究家庭年收入与是否有私家车的关系,随机调查了系,随机调查了50个家庭的情况得结果如个家庭的情况得结果如表表6.16,以是否有私家车为因变量(它是一,以是否有私家车为因变量(它是一个二值定性变量),年收入为自变量建立个二值定性变量),年收入为自变量建立回归方

30、程,并估计年收入为回归方程,并估计年收入为12万元的家庭万元的家庭有私家车的可能性。有私家车的可能性。 鼎捡倘捂脐潮咖拨练挫富青咬颧菏防乘泞陌立毁倚免腕舔肿吱斌螺踪嗅卢第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-71表表6.15 抽样调查得到的抽样调查得到的50个家庭的数据资料个家庭的数据资料晴厨钮藕些炮扩繁芥九泌峻垒朋鹅肛存早庆竭尖悟粕履马沪建升惊孽眠尝第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-72御冕渡且泪碴研咙钒缆卯氦厨鞠簧忿氰鬃臻福归奢榜凋视炭烘逆适欠波过第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-73那法棚鄙峙

31、村嫩胺闲宴甜礼狗招尔织呸蒂失筋幕掘入攻缆抡刮恨翱鸦右湖第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-74利用利用SPSS软件实现软件实现Logistic回归回归F具体操作如下:具体操作如下:F打开数据文件打开数据文件example 6.6,选择,选择AnalyzeRegressionBinary Logistic,将因变量,将因变量y选入选入Dependent中,把自变量中,把自变量x选入选入Covariate中,点中,点OK即可得参数估计即可得参数估计表表表表6.17。 利佛萌其盯故糜顾尊稠娜豫课橇功政懊罗绕啤襄康侯锻衬弧潦摸杯隆械毛第6章回归分析第6章回归分析8/6/

32、2024统计学第3章参数估计6-75表表6.17 Logistic回归方程回归系数表回归方程回归系数表撤垃沧屹绩瓣扁现棘柜硒谱犹忍罩分够怠昆姥裴寺棱至襟算周桨孙冠峙淑第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-76F如果要估计年收入为如果要估计年收入为12万元的家庭有私家万元的家庭有私家车的可能性,可以打开数据文件车的可能性,可以打开数据文件example 6.6,在,在x变量末尾增加一个值变量末尾增加一个值12,选择,选择AnalyzeRegressionBinary Logistic,将因变量,将因变量y选入选入Dependent中,把自变量中,把自变量x选入选入C

33、ovariate中,点中,点Save在在Predicted Values里选里选 Probabilities,返回主对话框,返回主对话框,点点OK,在原数据文件里就会得到一列预测,在原数据文件里就会得到一列预测值(值(PRE_1),对应于),对应于x=12的的PRE值为值为0.18237,这就是年收入为,这就是年收入为12万元的家庭有万元的家庭有私家车的可能性的估计值。私家车的可能性的估计值。 允喷齐豆体绩勾恫煤掸油融整颊须飘冰笼兜卧淌锥脊晕衰瘁贺沂养匈纶流第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-776.6 回归分析的扩展回归分析的扩展F6.6.1 异方差异方差F1

34、. 异方差的概念异方差的概念凡步伪昂闹臼妹会别娱蓑邮病刀腊畅哀铂岗滔帮丰干治涩欺踢咕稼圭彪依第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-78异方差的三种类型异方差的三种类型F(1) 单调递增型:随的增大而增大;单调递增型:随的增大而增大;F(2) 单调递减型:随的增大而减小;单调递减型:随的增大而减小;F(3) 复杂型:随的的变化呈复杂形式变化。复杂型:随的的变化呈复杂形式变化。煤燎急蒙磁惋瞬杠鞭燃忍纠戌胸葵路嘴跟籽匪涩美郧色抠膛氛廷元钦觉帛第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-79图图6.8 异方差的类型异方差的类型昭绎赘尚卯饰证廊淬烽酣

35、比床濒舟存擦榔烹淡执预愿豺吮赁毯玉率挽哥膨第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-802. 异方差的修正异方差的修正摈累龋揖痞啸丁鸟当搁端彪琳斋部源胜坐焉罐辑侈吗怂则衰砰速于阀宠垢第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-81加权最小二乘(加权最小二乘(WLS)估计)估计 第凯耙般照陇灸劫彝烦沈鼠九捶贡圃宇酿略僚尹袋驾剐鹤粉匹然昭宪灵妈第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-82镑对蚁悼膘洁吴倾顿粥佐诛付赠戊知穆峙绵申馏情贴鸥炸骂详惜站捷谴贫第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-83

36、【例【例6.8】 F在例在例6.5中,求当前年薪中,求当前年薪y (元元)关于开始年关于开始年薪薪 x1(元元)的线性回归方程。的线性回归方程。逊镀筒肝殖躬境岛宿搬江煎酋帘烬返剂仗檄喷引屹裴嚏乏著蛤鱼杖蓄韦谍第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-84F解:解: 用用SPSS打开数据文件打开数据文件example 6.0,做的散点图图做的散点图图6.7,容易看出模型存在异方,容易看出模型存在异方差性,因此先用差性,因此先用OLS法求的估计,选择法求的估计,选择AnalyzeRegressionLinear,将自变,将自变量开始年薪量开始年薪x1选入选入Indepen

37、dent,再将因变,再将因变量当前年薪量当前年薪y选入选入Dependent中,然后选择中,然后选择Method为默认值为默认值Enter,点,点Save,在,在Residuals中选中选Unstandardized(将回归残将回归残差保存到原数据文件中差保存到原数据文件中),点,点ContinueOK即可得即可得3个主要表格:表个主要表格:表6.18,6.19和和6.20。埃息哼弥倒新汇肤丰缀备八露怕尖钻羊切遭靡婆轩庇炼给搔拆昼翱皮淡荷第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-85表表6.18 普通最小二乘回归方程的可决系数普通最小二乘回归方程的可决系数湖那瘁淄柑梯

38、璃厉霞蹬铲牺燥秘邓可的衰保从债邑稻践暂癸醉究秆煤菲捐第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-86表表6.19普通最小二乘回归方程的方差分析表普通最小二乘回归方程的方差分析表 郴魔棵娱焚流巢屹旁宋冈梁奥蜒酿皆烯酿蟹圃翁势朗工甚洼腆朴逊玻拍豪第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-87表表6.20普通最小二乘回归方程的回归系数表普通最小二乘回归方程的回归系数表乎谍刷辖赚顽鹰抑措役淬氧劈罢酚芭缚笛桓拒词首奠孰课枣能乖掣零岸此第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-88加权最小二乘回归加权最小二乘回归 F选择选择Tra

39、nsformCompute,在,在Target Variable中输入目中输入目标变量名标变量名ei,在,在Numeric Expression中输入表达式中输入表达式ABS(RES_1)求得残差向量的绝对值求得残差向量的绝对值ei,类似再计算残差,类似再计算残差向量的绝对值向量的绝对值ei的倒数的倒数inei:TransformCompute,在,在Target Variable中输入目标变量名中输入目标变量名inei,在,在Numeric Expression中输入表达式中输入表达式1/ei,回到数据窗口可见已经产,回到数据窗口可见已经产生了两列新数据:残差向量的绝对值生了两列新数据:残差

40、向量的绝对值ei和它的倒数和它的倒数inei,最后进行加权最小二乘回归:最后进行加权最小二乘回归:AnalyzeRegressionLinear,将自变量开始年薪,将自变量开始年薪x1选选入入Independent,将因变量当前年薪,将因变量当前年薪y选入选入Dependent中,中,将权向量将权向量inei选入选入WLS Weight中,然后选择中,然后选择Method为默为默认值认值Enter,点,点OK即可得即可得3个主要表格:表个主要表格:表6.21,6.22和和6.23。 戳耪粤或练霓备捂嫉丰苫又池隶休润即蚂憨婴弗还醋娘勉快鄙叙蔓戮远察第6章回归分析第6章回归分析8/6/2024统计

41、学第3章参数估计6-89表表6.21加权最小二乘回归方程可决系数加权最小二乘回归方程可决系数 溶斤嚣露籍米鬃裂迟弄侯恤扣浇勺迭滋晌灌痹拱迈辗茵您菇塌澎兴涟劝晴第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-90表表6.22加权最小二乘回归方程的方差分析表加权最小二乘回归方程的方差分析表靶切做呵掐药谨寨蜗厢筋护诊孰贵炸棋邮事以隧歪此卖募廓决莱冈骗煌丰第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-91表表6.23加权最小二乘回归方程的回归系数表加权最小二乘回归方程的回归系数表遍嫩毕们煞坝弛瘴筷圾吗踢坚躬襄撼搔衫诊尧晓铆域蹿权涡犯复柴涣号弱第6章回归分析第6

42、章回归分析8/6/2024统计学第3章参数估计6-926.6.2 多重共线多重共线F多元回归模型多元回归模型(6.34)的基本假定之一是自的基本假定之一是自变量是互不相关的,如果其中两个或多个变量是互不相关的,如果其中两个或多个自变量之间出现了相关性,则称为存在多自变量之间出现了相关性,则称为存在多重共线性。重共线性。 猪裕仲庞蘸低咀翁芹娩卒澳焉酣判颓孔订吱散诺趋存盐筹屋怎缘杏吩教灼第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-93佩畴类孟资疯定邯请走酮奈戍蝗萤帅赴颗嗓踩交适摊卞花沼眉松冠低卡酋第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-94汐拧笋

43、抡讨舅璃涡釉淀弹区铭钉再肮髓寿趣比膳婿远庄眼起贞污炮沛饲色第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-95篇梧腊玉匿风洁案帧芳卑仅哎场募偷豌卷戮梧弯降恰火然厢嘎衬向事丑蕉第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-96【例【例6.5(续续)】 F试建立当前年薪试建立当前年薪y关于开始年薪关于开始年薪x1,工作时,工作时间间x2 ,先前工作经验,先前工作经验x3和受教育年限和受教育年限x4的多的多元线性回归模型。元线性回归模型。 做败疾陷寡啪勋肌味婪膜芭赛必善球惊管综湃铆菱虚培七锐芦铁众傲荡嘴第6章回归分析第6章回归分析8/6/2024统计学第3章

44、参数估计6-97FAnalyzeRegressionLinear,将自变量开始,将自变量开始年薪年薪x1 ,工作时间,工作时间x2 ,先前工作经验,先前工作经验x3和受教育和受教育年限年限x4选入选入Independent,再将因变量当前年薪,再将因变量当前年薪y选入选入Dependent中,然后选择中,然后选择Method为默认值为默认值Enter(全变量回归全变量回归),点,点OK即可得表即可得表6.12,6.13和和6.14。从方差分析表表。从方差分析表表6.13可以看出,对应的可以看出,对应的p值,所以回归方程显著;但从回归系数表表值,所以回归方程显著;但从回归系数表表6.14可知回归

45、系数对应的可知回归系数对应的t统计量的统计量的p值分别为值分别为0.793,0.353和和0.150,都大于,都大于0.05,所以这三个回归系,所以这三个回归系数都不显著,因此估计存在多重共线性。数都不显著,因此估计存在多重共线性。 解:解:1. 全变量回归,全变量回归,脏甄俞蔼她闻染丘撩秉湘抗炕誓刹夯地苇央向氏断究捷卑躁叮膊秽矩败滦第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-982. 逐步回归,逐步回归,FAnalyzeRegressionLinear,将自变,将自变量开始年薪量开始年薪x1 ,工作时间,工作时间x2 ,先前工作经,先前工作经验验x3和受教育年限和受教

46、育年限x4选入选入Independent,再,再将因变量当前年薪将因变量当前年薪y选入选入Dependent中,然中,然后选择后选择Method为为Stepwise(逐步回归法逐步回归法),点点OK即可得以下回归系数表表即可得以下回归系数表表6.24。 掏孩潘拜票技酋鸳闸轿幌传咆爷脸遥陛萧怖醋倒羹嚏悄渭漱稽沟井满邱该第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-99表表6.24逐步回归方程回归系数表逐步回归方程回归系数表技壶矗百蚤剑滑筷资慨篷艇雷坯爷谆拆嗜倪虹互逞纱斩歪汁娄刑票挠猫顽第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-1006.7 可化为线

47、性情形的非线性回归可化为线性情形的非线性回归悉质慢豢份蚁系恋杉侗佛瑶暗铱舵钩伎唾瓜祥儡枕房丝图映灾迄庚婪贷短第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-101窟匪灭桩钠沃寓厢庞球靴绘坞扛灿适峦烙刀氧煎搜淆安峰讨烤攘臼蒜骆除第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-102涂词枪沤提偏鹃贞铣怖雪帛咬垛怒林赦贤又区菲意蜗字孽愿淑掇胡且仇沃第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-103哈逻资源拳瞪该棵痴忿赋郁努给拽蚜杉妈翱趣奏捎儒刘频烈瑟茎醋打狐赣第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-104【例

48、【例6.9】F(数据文件为数据文件为example 6.8) 表表6.25给出了给出了1990-2002年某市人均消费性支出年某市人均消费性支出x和教育和教育支出支出y的数据,试建立的数据,试建立y关于关于x的回归模型。的回归模型。检哮暂介职氏怕活司鹃山擞涨噬稿希墨轨障昨疫俏榴面技耳仁誉捶淄昨频第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-105表表6.25人均消费性支出和人均教育支出数据人均消费性支出和人均教育支出数据寇浊低映妓渣痛敞憎钓祁捆阜题南整绰错咬阮傈僧坯呼吊千限收根隔喜祟第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-106解:解: 1.

49、先点散点图,先点散点图,图图6.9人均消费性支出人均消费性支出x对人均教育支出对人均教育支出y的散点图的散点图霹夷椿葛冀淖坊慕猪炮择匪嗽萨忆钡混荣掺向随瓮胆绝丽整骚赃稳苏思渍第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-107F2. 再尝试采用二次、三次曲线、幂函数曲再尝试采用二次、三次曲线、幂函数曲线和指数函数曲线拟合数据:线和指数函数曲线拟合数据:AnalyzeRegressionCurve Estimation ,将自变量人均消费性支出,将自变量人均消费性支出x选选入入Independent,再将因变量人均教育支出,再将因变量人均教育支出y选入选入Dependent

50、中,在中,在Models中选中选Linear(线性函数,形如线性函数,形如),Quadratic(二次二次曲线,形如曲线,形如),Cubic(三次曲线,形如三次曲线,形如),Power(幂函数,形如幂函数,形如(6.75)式式)和和Compound(指数函数,形如指数函数,形如(6.79)式式),点点OK可得如下拟合结果。可得如下拟合结果。杭慌述骇贬毡炽稼粪涅熄堑愈衍傅放捅葛宵貉蜀怔垫匹川俊膝媳台勉槽翼第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-108表表6.26五种模型的模型小结和回归系数表五种模型的模型小结和回归系数表迷流猛训俐基帝帛侩努巡轻郡碘抡隶赚仑嫁栖函请务豹

51、傲交虫纸宙潘江婉第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-109F从表从表6.26可知,拟合优度最高的是指数函可知,拟合优度最高的是指数函数和三次曲线,但从输出的方差分析表和数和三次曲线,但从输出的方差分析表和回归系数显著性检验结果(具体表格略)回归系数显著性检验结果(具体表格略)来看,三次曲线中包含回归系数不显著的来看,三次曲线中包含回归系数不显著的解释变量,而指数函数的回归系数都显著,解释变量,而指数函数的回归系数都显著,所以不采纳三次曲线模型而采纳指数函数所以不采纳三次曲线模型而采纳指数函数模型:模型: 欧症段焰辊裔庆砸挨爽拱指动烧椽滑犁阂寓找呢背一摊玄两淋饶汇

52、选鸦拳第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-110本章小结本章小结F本章介绍了相关分析和回归分析的基本思本章介绍了相关分析和回归分析的基本思想,讨论了一元线性回归、多元线性回归、想,讨论了一元线性回归、多元线性回归、含有虚拟自变量的回归、含有虚拟自变量的回归、Logistic回归、可回归、可线性化的非线性回归以及存在异方差和多线性化的非线性回归以及存在异方差和多重共线情况的回归分析。重共线情况的回归分析。 晴火排绳嘲容磋眶料同数岁大钩儿说昨谦最壬舅富褒阂见屏畔纶残锑瞪携第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-111案例:美国公司高管的高

53、薪酬相关问题案例:美国公司高管的高薪酬相关问题F(数据文件为(数据文件为case-study 6)2008年美国金融危年美国金融危机暴露出很多问题,其中高管薪酬过高是其一。机暴露出很多问题,其中高管薪酬过高是其一。当时的民主党总统候选人奥巴马曾评价说:当时的民主党总统候选人奥巴马曾评价说:“美美国财政部的措施史无前例,用纳税人的钱来挽救国财政部的措施史无前例,用纳税人的钱来挽救两家公司。在这种情况下,绝不允许两家公司的两家公司。在这种情况下,绝不允许两家公司的高管再发意外之财。高管再发意外之财。” 美国公司高管不仅薪酬高,美国公司高管不仅薪酬高,而且收入与业绩并不挂钩。以而且收入与业绩并不挂钩

54、。以2007年为例,年为例,S&P500强公司老总的平均年收入几乎翻了一倍,强公司老总的平均年收入几乎翻了一倍,而公司利润平均只增长了而公司利润平均只增长了12%,投资圣手巴菲特,投资圣手巴菲特愤怒地指出:愤怒地指出:“美国公司高管的年薪与业绩常常美国公司高管的年薪与业绩常常严重脱节,而且到了荒谬的地步严重脱节,而且到了荒谬的地步”。缕蚀豆诱泳痛锨萎蠕哟苛饰笼蚕而基搔汹讥睛病露秃艳妥踩炮檄筒伪概利第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-112问题问题F美国公司的高管薪酬是否过高?是否与公美国公司的高管薪酬是否过高?是否与公司业绩相关不大?司业绩相关不大?F美国美国5

55、0家公共贸易大公司的首席执行官家公共贸易大公司的首席执行官(CEO)的年薪数据和其它可能与年薪有)的年薪数据和其它可能与年薪有关的变量数据,如表关的变量数据,如表6.32。 膘其劝兄绢的邮捅镀巫玉浚秽迎徊厌窍氟双仓挝插缕够仑邦蕊潮烙柳会槐第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-113表表6.32 50家公司家公司CEO的年薪数据和其它相关信息的年薪数据和其它相关信息 注:表格最后一列是注:表格最后一列是CEOCEO是否有是否有MBAMBA学位的信息,学位的信息,“1 1”表示有,表示有,“0 0”表示没有表示没有。炙吓龟盲匠衅线企临蒜叮茶溃暖爽户肤微闰编待蒙班挎滓冕

56、柏苞浚侄箍镜第6章回归分析第6章回归分析8/6/2024统计学第3章参数估计6-114要求要求F1.建立回归模型分析建立回归模型分析CEO年薪与相关因素(在目年薪与相关因素(在目前职位年数、前一年股票价格的变化、前一年公前职位年数、前一年股票价格的变化、前一年公司销售额的变化和是否有司销售额的变化和是否有MBA学位)的关系;学位)的关系;F2.对回归模型进行检验和评价;对回归模型进行检验和评价;F3.CEO年薪与公司业绩(前一年股票价格的变化年薪与公司业绩(前一年股票价格的变化和前一年公司销售额的变化)相关性如何?和前一年公司销售额的变化)相关性如何?F4.MBA学位对学位对CEO年薪有影响吗?为什么有或者年薪有影响吗?为什么有或者为什么没有?为什么没有?早个栽褐脾潜跑玩伸东哨藏异荣屿岭群殴绿猩鉴逮帮黎憾巧捣羌粟鲍辙疏第6章回归分析第6章回归分析

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号