一元统计学和多元统计

上传人:宝路 文档编号:48240861 上传时间:2018-07-12 格式:PPT 页数:38 大小:1.26MB
返回 下载 相关 举报
一元统计学和多元统计_第1页
第1页 / 共38页
一元统计学和多元统计_第2页
第2页 / 共38页
一元统计学和多元统计_第3页
第3页 / 共38页
一元统计学和多元统计_第4页
第4页 / 共38页
一元统计学和多元统计_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《一元统计学和多元统计》由会员分享,可在线阅读,更多相关《一元统计学和多元统计(38页珍藏版)》请在金锄头文库上搜索。

1、多元统计分析基础多元统计分析基础生命科学生命科学 社会科学社会科学统计分析方法统计分析方法现象现象 多样性 复杂性 随机性多元统计分析方法多元统计分析方法多元回归分析方法多元回归分析方法 多元判别分析方法多元判别分析方法 聚类分析方法聚类分析方法 目的:目的: 从看起来 杂乱无章 的数据中 发现提炼 规律性的结论为什么学习多元统计分析必备的知识必备的知识 良好的 专业训练 必要的 统计分析工具多元统计研究的内容简化数据结构(降维问题) 将复杂的数据通过变量变化变得互补相关 将高维数据投影到低维空间(问题简化,信息丢失较少) 主成分分析 因子分析 分类与判别(归类问题)按照相似度进行分类 聚类分

2、析 判别分析等 变量间的相互关系 回归分析 典型相关分析 多元数据统计推断 参数估计 假设检验 多元统计的理论基础 多元随机向量的分布及其性质 抽样分布理论等随着计算机的发展,多元统计已经在自然科学 、社会科学的各个领域得到广泛的应用。 教育学 医学 气象学 环境科学 地理学 考古学 服装工业 经济学 农业 社会科学 文学 以及其他各个领域 多元统计的应用一元概率统计回顾一元概率统计回顾主要关注基本概念和基本思想主要关注基本概念和基本思想随机变量随机变量 X X (random variable)(random variable)在自然界中,有些变量在每次观察前,不可能事先确定其取值;经过 大

3、量反复观察,其取值又有一定的规律,这种变量称为随机变量随机变量X X。例 (1). 掷骰子出现某点数的概率为1/6,若掷100次,则出现该点数的 次数X是随机变量;(2). 332路公车每10分钟发一趟车,某人在随机的时间到达车站等 车,则等车时间X是随机变量。1. 1. 随机变量、概率分布随机变量、概率分布离散型随机变量离散型随机变量X的所有可能取值是有限个或可列个。连续型随机变量连续型随机变量最常见的一类非离散型随机变量。对连续型随机变量,考察事件a0均为常数。称X X服从参数为服从参数为 , 的正态分布的正态分布,记 作XN(XN( , 2 2). ).:均值; :方差=0; 2=1时,

4、称为标准正态分布,记为XN(0XN(0,1)1)。遵从正态分布的随机变量X,其正态分布函数为:正态分布的若干性质正态分布的若干性质正态分布完全由其均值和方差2决定;正态分布的概率密度函数曲线呈对称的“钟形”;经验规则(3 准则):6895992323p(x)x3. 3. 总体和样本总体和样本总体总体X X (population)研究对象的某种特征值的全体组成的集合。用X表示。样本样本X1, X2, , Xn (sample)在总体中选取部分有代表性的子集称为(随机)样本。一个样本是来自总体X的一组相互独立同X分布的随机变量 。 样本值样本值x1, x2, , xn从总体X随机抽取的一组观测值

5、,常用x1, x2, , xn来表示 样本或样本值。4. 4. 统计量及其参数估计统计量及其参数估计统计量统计量(statistical quantity)设X1, X2, , Xn为总体X的n个样本,g(x1, x2, , xn)为连 续函数,则称g(X1, X2, , Xn) 为一个统计量。 显然,统计量g(X1, X2, , Xn)也是一个随机变量。总体总体X X的数字特征的数字特征参数参数总体均值:刻划总体的平均取值 总体方差2:刻划总体取值的分散(涨落)程度根据样本值推断总体性质根据样本值推断总体性质参数估计参数估计样本均值 :样本方差s:显然,样本均值、样本方差都属于统计量。通常用

6、样本均值、样本方差作为总体均值、总体方差的无偏估计量。无偏估计:当n取得充分大,样本均值、样本方差分别逼近总体均值 和总体方差。或(当n较大时)5. 5. 统计推断的两类问题统计推断的两类问题 参数估计和假设检验参数估计和假设检验参数估计问题参数估计问题假定总体X的分布函数形式已知,对其中的某些参数进行估计。估计方法:矩估计法、最小二乘法、最大似然法,假设检验问题假设检验问题从样本值出发,判断关于总体分布的某种假设是否成立。1 1、提出原假设(或称零假设)和备选假设(或称对立假设提出原假设(或称零假设)和备选假设(或称对立假设 ) 2 2、指定显著性水平、指定显著性水平 (一般取(一般取 0.

7、05, 0.01, 0.05, 0.01, )值用以衡量(或拒绝)原假设成立所需证据的指标。值越小,否定原假设的条件越高,不容易否定原假设 ;值越大,否定原假设的条件越低,比较容易否定原假 设。3 3、构造构造检验统计量检验统计量W W4 4、进行统计试验进行统计试验收集数据、计算检验统计量及显著收集数据、计算检验统计量及显著 性概率值性概率值p p5 5、根据显著性水平、根据显著性水平 值进行判断值进行判断多元统计数据的图表示法图形有助于对所研究数据的直观了解,一元或二 元的数据都可以用图画出来,给研究人员一个直观 理解。但是对于高维数据,在平面上用图画出来不 是一件容易的事情。许多统计学家

8、给出了多元数据 的图示方法,但是对于这些方面的研究还处于不成 熟的状态,到目前为止还没有公认的方法。书中介 绍的是一些在当今比较流行的方法。设变量的个数为p,观察的次数为n,第k次观 察值记为N次观测数据组成的矩阵记为例:考察北京、上海、陕西、甘肃四个省市人 均消费支出情况,选取以下五项指标,具体 数据如下表肉禽及制品住房医疗保健交通通讯文娱用品 及服务北京563.51227.78147.76253.99510.78上海678.92365.07112.82301.46465.88陕西237.38174.48119.78141.07245.57甘肃253.41136.13102.96108.13

9、212.20轮廓图的作图步骤为: 1.在直角坐标系中,横坐标取p个点,以表示p个 变量; 2.对于给定的一个观测值,在p个点上的纵坐标与 对应的变量值取正比; 3.连接p个点得一折线,既得该次观察值的一条轮 廓线; 4.对于n次观察值,每次都重复上述步骤,可画出n 条折线,构成n次观察值的轮廓图。多元统计数据的图表示法轮廓图雷达图的作图步骤为: 1. 作一个圆,并把此圆分为p等分; 2. 连接圆心和各分点,把这p条半径依次定 义为各变量的坐标轴,并标以适当的刻度; 3. 对给定的一次观测值,把p个观测值分别 标在相应的坐标轴上,然后将它们连成一个 p边形; 4. 对于n次观察值,可画出n个p边

10、形。多元统计数据的图表示法雷达图多元统计数据的图表示法调和曲线图从数学的角度,较为完美的多元数据图表示 的方法可能就是Andcews在1972年提出的三角多 项式法,其思想是把多维空间中的一个点对应于 二维平面上的一条曲线。多元统计数据的图表示法星座图请同学们参考实用多元统计分析由 Richard A. Johnson & Dean W. Wichern 著 清华大学出版社多元统计的难点在于变量太多。研究多元统计的主攻方 向之一就是如何将高维数据投影到二维空间,并且在投 影过程中不会过多地损失原有数据的信息,这样就可以 使用这种方法在平面上画出这些原本属于高维数据的图 形来。THANKSTHANKS

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号