《数理统计及应用》ppt课件

上传人:tian****1990 文档编号:74790473 上传时间:2019-01-29 格式:PPT 页数:57 大小:2.44MB
返回 下载 相关 举报
《数理统计及应用》ppt课件_第1页
第1页 / 共57页
《数理统计及应用》ppt课件_第2页
第2页 / 共57页
《数理统计及应用》ppt课件_第3页
第3页 / 共57页
《数理统计及应用》ppt课件_第4页
第4页 / 共57页
《数理统计及应用》ppt课件_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《《数理统计及应用》ppt课件》由会员分享,可在线阅读,更多相关《《数理统计及应用》ppt课件(57页珍藏版)》请在金锄头文库上搜索。

1、许多实际问题往往需要对数据进行统计分析,建立合适的模型。Excel2007的统计函数和数据分析工具则为人们提供了一个强有力的统计分析工具,第10章 数理统计及应用,第10章 数理统计及应用,本章内容:通过实例,介绍如何使用Excel 2007统计函数和数据分析工具进行数据统计分析与预测。包括描述性统计、假设检验、方差分析和回归分析等 教学目标:掌握利用Excel函数和数据分析工具进行统计分析与预测的基本方法,数理统计是一门对客观不确定现象进行数据搜集、整理和分析的科学其目的是了解客观情况,探索数据内在结构及现象之间的规律性 Excel 2007 能够支持范围广泛的统计计算任务,提供工程和科学统

2、计的基本能力。其中包括: 函数 数据分析工具,第1节 数理统计的基本概念,第1节 数理统计的基本概念,按功能划分统计函数的种类包括: (1)频数分布处理 (2)描述统计量计算 (3)概率计算 (4)参数估计 (5)假设检验 (6)卡方检验 (7)相关、回归分析,第1节 数理统计的基本概念,按功能划分统计函数的种类包括: (1)频数分布处理 (2)描述统计量计算 (3)概率计算 (4)参数估计 (5)假设检验 (6)卡方检验 (7)相关、回归分析,第1节 数理统计的基本概念,数据分析工具的种类: (1)统计绘图、制表 (2)描述统计量计算 (3)参数估计 (4)假设检验 (5)方差分析 (6)相

3、关、回归分析 (7)时间序列分析 (8)抽样 (9)数据变换,第1节 数理统计的基本概念,使用数据分析工具,需加载:,单击“Office按钮”,然后单击“Excel选项” 单击“加载项”,然后在“管理”框中,选择“Excel 加载宏” 单击“转到” 在“可用加载宏”框中,选中“分析工具库”复选框,然后单击“确定” 确定后“数据”选项卡中增加了“数据分析”子项,在进行数据分析的时候,一般首先是从了解数据的基本特征开始的,即先对数据进行描述性统计分析(Descriptive Analysis),以发现其内在的规律,然后再选择进一步分析的方法。描述性统计分析主要包括两类:一类是数据集中趋势分析,表示

4、数量的中心位置;另一类是数据的离散程度分析,表示数量的变异程度(或称离散程度)。两者相互补充,共同反映数据的全貌。,第2节 描述性统计,数据的集中趋势分析是用来反映数据的一般水平,常用的指标有平均值、中位数和众数等: 作用: 指出一数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平; 作为样本或资料的代表数与其它资料进行比较,2.1 数据集中趋势分析,平均数 算术平均数(average) 调和平均数(harmean) 几何平均数(geomean),2.1 数据集中趋势分析,几何平均可用于平均比率的计算,这里变化比率是在相等长度的时间区间内给出的。,如果样本观测值包含某种倒数,则

5、可用调和平均,特别地,调和平均可用于以不同的速度通过各路段,求总的平均速度;或在各种条件下,求不同密度的流体的平均密度的计算。,调和平均数 某人从C到B的平均速度为30km/h,沿同一路线返回时平均速度为60km/h,求整个往返行程的平均速度为多少? 用Excel调和平均数求解: “=HARMEAN(30,60)” 40 即40km/h。,2.1 数据集中趋势分析,几何平均数 一雇员在连续三年内的年薪增长率分别为6%、10%和12%,这里增加的百分数是在上一年的薪金基础上计算的,求其三年内的年薪平均增长率? 用Excel几何平均数求解: “=GEOMEAN(1.06,1.1,1.12)” 1.

6、0930 所以,薪水的年平均增长率为9.3%。,2.1 数据集中趋势分析,中位数(MEDIAN),2.1 数据集中趋势分析,中位数是样本的50分位点,它受极端数值的干扰很小。如果加入一个很大的干扰值,中值数仅可能有很小的移动。 几何均值和调和均值同算术平均值一样,对极端数值也较敏感。它们主要用于数据为对数正态分布或偏斜程度较大时。,下例显示上述几种统计量对极端数值的敏感程度 A1:A7= 1 1 1 1 1 1 100 =geomean(A1:A7) 1.9307 =harmean(A1:A7) 1.1647 =average(A1:A7) 15.1429 =median(A1:A7) 1,2

7、.1 数据集中趋势分析,几何均值,调和均值,算术平均值,中位数,数据的离散程度分析主要是用来反映数据之间的差异程度,常用的指标有极差、方差、标准差、四分位数间距等 作用: 描述变量分布的差异程度 衡量和比较均值指标的代表性高低 为抽选样本单位数提供依据,2.2 数据离散程度分析,极差(max-min):是描述数据分散程度最简单的度量,但如果数据中出现了极端数据,极端数据有可能就是最大值或最小值,因此极差对极端数据非常敏感。 标准差(stdev)和方差(var)是常用的分散程度度量。它们对于正态分布的样本是最优的。但它们对极端数据也是较敏感的。偏离数据整体的一个极端数据可能会使它们的值急剧增大。

8、,2.2 数据离散程度分析,四分位数(quartile ), 四分位数不受两端个别极大值或极小值的影响,基本能反映数据的离散程度。,2.2 数据离散程度分析,语法 : quartile(array,quart) array:为需要求得四分位数值的数组区域 quart:决定返回哪一个四分位值。,下例显示上述几种统计量对极端数值的敏感程度 A1:A7= 1 1 1 1 1 1 100 =max(A1:A7)-min(A1:A7) 99 =stdev(A1:A7) 37.4185 =quartile(A1:A7 ,1) 1,7.2 描述性统计,极差,标准差,四分位间距,2.2 数据离散程度分析,设有

9、甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为: 甲 480 490 500 510 520 乙 440 460 500 540 560,若让你就评价两人的检验技术的好坏,你如何评价?,2.2 数据离散程度分析,设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为: 甲 480 490 500 510 520 乙 440 460 500 540 560 两人计数的均数都是500,能说两人的检验技术相同吗?不能,因为甲的计数结果比较密集,而乙的分散,因此甲的检验精度显然比乙的高。 可以用极差来衡量: 甲计数的极差为52

10、0480=40, 乙的为560-440=120。可见乙的计数较甲的波动大。,2.2 数据离散程度分析,设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为: 甲 480 490 500 510 520 乙 440 460 500 540 560,第3节 假设检验,假设检验是统计推断的基本问题之一,主要是确定关于样本总体特征的判断是否合理的过程。 先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。,假设检验的基本思想和原理 假设检验的步骤 如何利用Excel进行总体均值的检验,先对总体参数的具体数值作陈述,然后利用样本信息判断

11、假设是否成立,首先对几个必要的名词作简要的解释: 零假设:即初始判断 H0:=0 ( =50) 备选假设(也称对立假设): H1:0(或0 或50 或50) 假设检验是在H0 成立的前提下,从样本数据中寻找证据来拒绝H0 ,“接受” H1 .如果证据不足,则只能不拒绝H0,暂且认为 H0正确,第3节 假设检验,提出假设(例题分析),提出假设(例题分析),首先对几个必要的名词作简要的解释: 统计量: 统计理论中用来对数据进行分析、检验的变量。根据样本观测结果计算得到的,并据以对零假设和备择假设作出决策的某个样本统计量 根据不同的推断要求,可以构造不同的统计量,第3节 假设检验,显著性水平:在进行

12、假设检验时应该事先规定一个小概率的标准,作为判断的界限,这个小概率标准称为显著性水平 是一个概率值 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 表示为 常用的=0.05,0.01 , 0.10 由研究者事先确定,第3节 假设检验,P值: P值是在H0成立前提下,比样本统计量更极端的概率 如果P,则拒绝H0,接受H1 如果P,拒绝H0的样本证据不足,就不拒绝H0,暂且认为H0成立 根据统计推断结果,结合相应的专业知识,给出一个专业的结论。,第3节 假设检验,1 假设检验的步骤: (1) 提出统计假设,零假设H0和备选假设H1 (2) 规定显著水平 (3) 选取样本统计量 (4) 在显

13、著水平下,算出统计量服从分布的临界值,确定假设参数的拒绝域,第3节 假设检验,2 总体均值的检验: 单个样本的假设检验(大样本、小样本) (统计函数) 成对观测值的假设检验 (数据分析工具),第3节 假设检验,2 总体均值的检验: 单个样本的总体均值检验,第3节 假设检验,对单个样本的均值检验, 我们可以根据抽样推断的思路, 用相应函数计算临界值, 来判断是接受还是拒绝零假设。 总体均值的检验: (小样本,n 30) ,t 检验 计算t 统计量: 用函数计算临界值: TINV(,n-1),总体均值的检验 (例题分析),【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格

14、的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?,总体均值的检验 (例题分析),2 总体均值的检验: 单个样本的总体均值检验,第3节 假设检验,对单个样本的总体均值检验, 我们可以根据抽样推断的思路, 用相应函数计算临界值, 来判断是接受还是拒绝零假设。 总体均值的检验: (大样本,n 30) ,z检验 计算z 统计量: 用函数计算临界值:NORMSINV(),总体均值的检验 (例题分析),【

15、例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,总体均值的检验 (例题分析),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.0

16、1),左侧检验,总体均值的检验 (例题分析),总体均值的检验 (例题分析),【例】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产量是否有显著提高? (=0.05),右侧检验,总体均值的检验 (例题分析),总体均值的检验 (例题分析),2 总体均值的检验: 成对观测值的假设检验,第3节 假设检验,均值假设检验: t 检验(平均值的成对二样本分析 双样本等方差、双样本异方差) Z 检验(方差已知) 方差检验: F检验,第3节 假设检验,t 检验(平均值的成对二样本分析),用以对两组成对数据进行均

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号