《应用多元统计》PPT课件

上传人:xian****812 文档编号:281331388 上传时间:2022-04-23 格式:PPT 页数:245 大小:2.03MB
返回 下载 相关 举报
《应用多元统计》PPT课件_第1页
第1页 / 共245页
《应用多元统计》PPT课件_第2页
第2页 / 共245页
《应用多元统计》PPT课件_第3页
第3页 / 共245页
《应用多元统计》PPT课件_第4页
第4页 / 共245页
《应用多元统计》PPT课件_第5页
第5页 / 共245页
点击查看更多>>
资源描述

《《应用多元统计》PPT课件》由会员分享,可在线阅读,更多相关《《应用多元统计》PPT课件(245页珍藏版)》请在金锄头文库上搜索。

1、应用多元统计分析应用多元统计分析第一章第一章 绪绪 论论1.1 多元统计分析的应用多元统计分析的应用n降维问题降维问题降维问题降维问题uu主成分分析主成分分析主成分分析主成分分析uu因子分析因子分析因子分析因子分析n归类问题归类问题归类问题归类问题uu判别分析判别分析判别分析判别分析uu聚类分析聚类分析聚类分析聚类分析n变量间的相互联系变量间的相互联系变量间的相互联系变量间的相互联系uu回归分析回归分析回归分析回归分析 uu典型相关分析典型相关分析典型相关分析典型相关分析n多元数据的统计推断多元数据的统计推断多元数据的统计推断多元数据的统计推断n理论基础理论基础理论基础理论基础n判别实例判别实

2、例u疾病的鉴别疾病的鉴别疾病的鉴别疾病的鉴别u据经验,今天与昨天的湿度差和今天的压温差是据经验,今天与昨天的湿度差和今天的压温差是据经验,今天与昨天的湿度差和今天的压温差是据经验,今天与昨天的湿度差和今天的压温差是预报明天是否下雨的两个重要因素。现根据收集预报明天是否下雨的两个重要因素。现根据收集预报明天是否下雨的两个重要因素。现根据收集预报明天是否下雨的两个重要因素。现根据收集到的一批样本数据预报明天是否会下雨。到的一批样本数据预报明天是否会下雨。到的一批样本数据预报明天是否会下雨。到的一批样本数据预报明天是否会下雨。u红楼梦红楼梦后后4040回是否为高鹗所写?回是否为高鹗所写?u根据人均年

3、消费性支出,将全国所有省、市和自根据人均年消费性支出,将全国所有省、市和自根据人均年消费性支出,将全国所有省、市和自根据人均年消费性支出,将全国所有省、市和自治区进行分类。治区进行分类。治区进行分类。治区进行分类。u对欧洲对欧洲1111种语言进行分类种语言进行分类u服装定型分类服装定型分类n聚类实例聚类实例1.2 多元统计数据的图表示法多元统计数据的图表示法n散布图矩阵n轮廓图n雷达图(蜘蛛图、星座图)n调和曲线图n切尔诺夫脸(脸谱图)姓名 性别 数学 语文 英语 物理Tom 男 80 76 81 90Jack 男 55 67 79 63Rose 女 27 52 53 43Andy 女 62

4、57 66 69Cici 女 94 80 76 71教材:教材: 应用多元统计分析高惠璇应用多元统计分析高惠璇 北京大学出版社北京大学出版社主要参考书目:主要参考书目:1. 应用多元分析王学民应用多元分析王学民 上海财经大学出版社上海财经大学出版社2. 线性统计模型线性统计模型 王松桂王松桂 高等教育出版社高等教育出版社3.统计建模与统计建模与R软件软件 薛毅薛毅 陈立萍陈立萍 编著编著 清华大学出版社清华大学出版社4.多元统计分析及多元统计分析及R语言建模语言建模 王斌会编著王斌会编著 暨南大学出版社暨南大学出版社第二章第二章 随机向量与多元正态分布随机向量与多元正态分布n随机向量随机向量n

5、样本的统计量样本的统计量n多元正态分布的定义与基本性质多元正态分布的定义与基本性质n随机向量的二次型随机向量的二次型2.1 随机向量随机向量n随机向量的联合分布、边缘分布和条件分布随机向量的联合分布、边缘分布和条件分布随机向量的联合分布、边缘分布和条件分布随机向量的联合分布、边缘分布和条件分布均值向量均值向量协方差阵协方差阵相关阵相关阵n随机向量的数字特征随机向量的数字特征n均值向量和协方差阵的性质均值向量和协方差阵的性质设设X,Y是随机向量,是随机向量,A,B是常数矩阵,则是常数矩阵,则随机向量随机向量X的协方差阵是对称非负定矩阵。的协方差阵是对称非负定矩阵。 ,其中,其中L为非负定矩阵。为

6、非负定矩阵。2.2 样本的统计量样本的统计量n样本数据阵样本数据阵uu样本均值向量样本均值向量uu样本离差阵样本离差阵Auu样本协方差阵样本协方差阵uu样本相关阵样本相关阵R例1:统计各国家八项男子径赛运动记录:x1:100米(秒) x2:200米(秒)x3:400米(秒) x4:800米(秒)x5:1500米(分) x6:5000米(分)x7:10000米(分) x8:马拉松(分)计算相关阵。设 为随机向量, 相互独立且均服从N(0,1)分布;设为p维常数向量,A为pq常数矩阵,则称 X=AU+服从p元正态分布,记为 。2.3 正态随机向量正态随机向量 p维正态分布 正态分布的性质正态分布的

7、性质2.4 随机向量X的二次型 第三章第三章 回归分析回归分析例例:为了研究为了研究3岁至岁至8岁男孩身高与年龄的规律,岁男孩身高与年龄的规律,在某地区在在某地区在3岁至岁至8岁男孩中随机抽样,共分岁男孩中随机抽样,共分6个年龄层抽样:个年龄层抽样:3岁,岁,4岁,岁,8岁,每个层岁,每个层抽抽10个男孩,共抽个男孩,共抽60个男孩。资料如下:个男孩。资料如下:年龄年龄3 3岁岁4 4岁岁5 5岁岁6 6岁岁7 7岁岁8 8岁岁身身高高92.592.596.596.5106.0106.0115.5115.5125.5125.5121.5121.597.097.0101.0101.0104.01

8、04.0115.5115.5117.5117.5128.5128.596.096.0105.5105.5107.0107.0111.5111.5118.0118.0124.0124.096.596.5102.0102.0109.5109.5110.0110.0117.0117.0125.5125.597.097.0105.0105.0111.0111.0114.5114.5122.0122.0122.5122.592.092.099.599.5107.5107.5112.5112.5119.0119.0123.5123.596.596.5102.0102.0107.0107.0116.5116

9、.5119.0119.0120.5120.591.091.0100.0100.0111.5111.5110.0110.0125.5125.5123.0123.096.096.0106.5106.5103.0103.0114.5114.5120.5120.5124.0124.099.099.0100.0100.0109.0109.0110.0110.0122.0122.0126.5126.5平均身高平均身高95.495.4101.8101.8107.6107.6113.1113.1120.6120.6124.0124.0n一元线性回归模型一元线性回归模型随机干扰:各种偶然因随机干扰:各种偶然因素

10、、观察误差和其他被素、观察误差和其他被忽视因素的影响忽视因素的影响x对对y的线性影响而形的线性影响而形成的系统部分,反映成的系统部分,反映两变量的平均变动关两变量的平均变动关系,即本质特征。系,即本质特征。在许多经济问题中,一元线性回归只不过是回归分在许多经济问题中,一元线性回归只不过是回归分析中的一种特例,它通常是对影响某种经济现象的析中的一种特例,它通常是对影响某种经济现象的许多因素进行了简化考虑的结果。许多因素进行了简化考虑的结果。若某公司管理人员要预测来年该公司的销售额若某公司管理人员要预测来年该公司的销售额y y时,时,研究认为影响销售额的因素不只是广告宣传费研究认为影响销售额的因素

11、不只是广告宣传费x1,x1,还还有可支配收入有可支配收入x2,x2,价格价格x3,x3,研究与发展费用研究与发展费用x4,x4,各种投各种投资资x5,x5,销售费用销售费用x6.x6.研究我国民航客运量研究我国民航客运量y y的变化趋势及其成因的变化趋势及其成因, ,发现国发现国民收入、消费额、铁路客运量、民航航线里程、来民收入、消费额、铁路客运量、民航航线里程、来华旅游入境人数为影响民航客运量的主要因素。华旅游入境人数为影响民航客运量的主要因素。3.1 多元线性回归模型多元线性回归模型3.2 最小二乘法估计最小二乘法估计n定义定义经验回归方程:经验回归方程:例例1:一元线性回归:一元线性回归

12、例例2:某气象站收集了:某气象站收集了15年关于年初的最高温度年关于年初的最高温度X(从从1月月11日算起日算起)与秋季第一次强冷空气出现与秋季第一次强冷空气出现日期日期Y(从从9月月11日算起日算起)的数据,的数据, 数数数数据据据据1 12 23 34 45 56 67 78 89 9101011111212131314141515x x252517173030313132322828292930302 211111818181828286 61414y y222215152626303034342525272734347 711111919202019199 91414n回归拟合值和残差

13、回归拟合值和残差u回归拟合值回归拟合值u拟合向量拟合向量u残差值残差值u残差向量残差向量作业:p171:4-1 (1)2.证明:n中心化和标准化中心化和标准化u中心化中心化u标准化标准化经验回归方程:经验回归方程:3.2 最小二乘法估计的性质最小二乘法估计的性质例例1:一元线性回归及性质:一元线性回归及性质x取值越分散,系数波动越小取值越分散,系数波动越小例例2:假设我们要求出四个物体的重量:假设我们要求出四个物体的重量一种方法是将每个物体称一种方法是将每个物体称k次,譬如称次,譬如称4次,次,然后求平均。假定称量的误差的方差都为然后求平均。假定称量的误差的方差都为用用yij表示第表示第i个物

14、体第个物体第j次称重时得到的重量次称重时得到的重量, i=1,2,3,4;j=1,2,3,4.(1)写出相应的线性模型写出相应的线性模型(2)求出求出(3)计算计算例例例例3(3(组合称重法组合称重法组合称重法组合称重法) )在天平的两个秤盘上分别放上这四个在天平的两个秤盘上分别放上这四个在天平的两个秤盘上分别放上这四个在天平的两个秤盘上分别放上这四个物体中的几个物体中的几个物体中的几个物体中的几个, ,并在其中的一个秤盘上加上砝码使之达并在其中的一个秤盘上加上砝码使之达并在其中的一个秤盘上加上砝码使之达并在其中的一个秤盘上加上砝码使之达到平衡。则有线性回归模型到平衡。则有线性回归模型到平衡。

15、则有线性回归模型到平衡。则有线性回归模型其中其中其中其中y y为使天平达到平衡所需的砝码重量。约定,如果为使天平达到平衡所需的砝码重量。约定,如果为使天平达到平衡所需的砝码重量。约定,如果为使天平达到平衡所需的砝码重量。约定,如果砝码在左边秤盘上则砝码在左边秤盘上则砝码在左边秤盘上则砝码在左边秤盘上则y y为负值。为负值。为负值。为负值。x xi i的值为的值为的值为的值为0 0,1 1或或或或-1-1,0 0表表表表示第示第示第示第i i个物体没有被称,个物体没有被称,个物体没有被称,个物体没有被称,1 1和和和和-1-1分别表示该物体放在左边分别表示该物体放在左边分别表示该物体放在左边分别

16、表示该物体放在左边和右边秤盘上。回归系数就是相应物体的重量,我们总和右边秤盘上。回归系数就是相应物体的重量,我们总和右边秤盘上。回归系数就是相应物体的重量,我们总和右边秤盘上。回归系数就是相应物体的重量,我们总共称了共称了共称了共称了4 4次,如下:次,如下:次,如下:次,如下:y yx x1 1x x2 2x x3 3x x4 420.220.28.08.09.79.71.91.91 11 11 11 11 1-1-11 1-1-11 11 1-1-1-1-11 1-1-1-1-11 1n线性回归模型的检验线性回归模型的检验 回归方程的显著性检验回归方程的显著性检验方差来源方差来源平方和平方和自由度自由度F F值值回归回归误差误差总计总计RSSRSSESSESSTSSTSSp pn-pn-p-1-1n n-1-1n复相关系数复相关系数决定系数决定系数R2即修正的即修正的R2复相关系数复相关系数n回归系数的检验回归系数的检验n点预测点预测 因变量的预测因变量的预测n区间预测区间预测例:一元预测例:一元预测x0离离平均值越近,预测区间长度越短平均值越近,预测区间长度越短 自变量的选择与逐

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号