用Excel进行描述统计分析幻灯片

上传人:E**** 文档编号:90113334 上传时间:2019-06-08 格式:PPT 页数:41 大小:1.06MB
返回 下载 相关 举报
用Excel进行描述统计分析幻灯片_第1页
第1页 / 共41页
用Excel进行描述统计分析幻灯片_第2页
第2页 / 共41页
用Excel进行描述统计分析幻灯片_第3页
第3页 / 共41页
用Excel进行描述统计分析幻灯片_第4页
第4页 / 共41页
用Excel进行描述统计分析幻灯片_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《用Excel进行描述统计分析幻灯片》由会员分享,可在线阅读,更多相关《用Excel进行描述统计分析幻灯片(41页珍藏版)》请在金锄头文库上搜索。

1、2019/6/8,西南科技大学生命科学与工程学院周海廷制作,1,用Excel进行 描述统计分析,实验三,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,2,集中趋势的测定与分析,1均值函数 均值函数主要包括算术平均数、调和平均数和几何平均数。 (1)算术平均数 语法:AVERAGE(number1,number2, .) 其中:Number1, number2, .为需要计算平均值的1到30个参数,参数可以是数字,或者是涉及数字的名称、数组和引用,如果数组或单元格引用参数中包含文字、逻辑值或空单元格,这些值将被忽略,但包含零值的单元格将计算在内。,2019/6/8,西南科技大学生命

2、科学与工程学院周海廷制作,3,(2)调和平均数 语法:HARMEAN(number1,number2, .) 其中:Number1,number2,.为需要计算其平均值的 1 到 30 个参数。 (3)几何平均数 语法:GEOMEAN(number1,number2, .) 其中:Number1,number2,.为需要计算其平均值的1到30个参数。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,4,2中位数(中位次数)函数 语法:MEDIAN(number1,number2, .) 如果参数集合中包含有偶数个数字,函数MEDIAN()将返回位于中间的两个数的平均值。 3众数函数

3、 语法:MODE(number1,number2, .) 如果数据集合中不含有重复的数据,则MODE()函数返回错误值N/A。 4最大(小)值函数 语法:MAX(number1,number2,.) MIN(number1,number2, .) 如果参数不包含数字,函数MAX(MIN)返回0。 。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,5,例18-1:某商场家用电器销售情况如图1所示。,图18-1 某商场家用电器销售情况,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,6,(1)计算各种电器的全年平均销售量,如图2所示。,图18-2 家用电器销售量平均数,2

4、019/6/8,西南科技大学生命科学与工程学院周海廷制作,7,(2)计算各种电器销售量的中位数,如图3所示。,图18-3 家用电器销售量中位数,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,8,(3)计算各种电器销售量的众数,如图4所示。,图18-4 家用电器销售量众数,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,9,离中趋势的测定与分析,1样本标准差 语法:STDEV(number1,number2,.) 其中:Number1,number2,.为对应于构成总体样本的 1 到 30 个参数。可以不使用这种用逗号分隔参数的形式,而用单一数组,即对数组单元格的引用。

5、,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,10,2总体标准差 语法:STDEVP(number1,number2,.) 其中:Number1,number2,. 为对应于样本总体的1到30个参数。可以不使用这种用逗号分隔参数的形式,而用单一数组,即对数组单元格的引用。 当样本数较多(n30)时,函数STDEV()和STDEVP()计算结果差不多相等。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,11,例18-2:使用例18-1资料,计算各家电销售量的总体标准差,如图18-5所示。 样本标准差的计算方法与总体标准差相同。,图18-5 计算总体标准差,2019/

6、6/8,西南科技大学生命科学与工程学院周海廷制作,12,3 四分位数与四分位距 语法:QUARTILE(array,quart) array:需要求四分位数值的数组或数字型单元格区域。 quart:决定返回哪一个四分位值。,表1 Quart值与QUARTILE返回值的对应关系,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,13,四分位距是总体中第3四分位数与第1四分位数之差。 例18-3:使用例1资料,计算四分位数和四分位距,如图18-6所示。,图18-6 计算四分位数和四分位距,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,14,分布形态的测定与分析,分析总体次数

7、的分布形态有助于识别整个总体的数量特征。总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。前者的测定参数称为偏度或偏斜度,后者的测定参数称为峰度。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,15,1偏度函数 语法:SKEW(number1,number2,.) 其中:Number1,number2. 为需要计算偏斜度的1到30个参数。 2峰度函数 语法:KURT(number1,number2, .) 其中:Number1,number2,.为需要计算峰值的1到30个参数。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,16,例18-4:

8、使用例18-1资料,计算各家电销售量的偏度和峰度,如图7所示。,图18-7 销售量的偏度和峰度,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,17,偏度为0时为正态分布,正值时为正偏态(峰向左倾),负值时为负偏态(峰向右倾), 峰度为0时为正态峰,正值时为尖峰,负值时为平峰。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,18,参数估计,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,19,总体均值区间估计的基本内容 1总体方差2已知,求的置信区间 当总体方差2已知时,在置信度为的情况下,可以构造总体均值的置信区间为:,利用Excel计算总体均值置信区间

9、,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,20,2总体方差2未知,求的置信区间 当总体服从正态分布,总体方差2未知时,要用样本方差代替2来建立置信区间。这时,新的统计量不服从标准正态分布,而是服从于自由度为的t分布,在置信度为的情况下,可以构造均值的置信区间为:,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,21,例20-1:从某班男生中随机抽取10名学生,测得其身高(cm)分别为170、175、172、168、165、178、180、176、177、164,以95%的置信度估计本班男生的平均身高。 (1)建立工作表,将以上数据录入。 (2)分别计算样本个数、

10、样本的平均数、样本标准差、样本标准误差、对应于置信度95%的概率度、抽样极限误差、置信区间的上、下限。计算结果如图20-1所示。 。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,22,图20-1 总体均值置信区间的计算,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,23,必要抽样容量的计算公式 在其他条件相同的情况下,抽样单位数越多,抽样误差越小,抽样单位数越少,抽样误差越大。 确定抽样数目,应考虑以下几个问题: (1)被调查总体的标志变动程度 (2)对推断精确度的要求,即被允许的抽样误差范围。 (3)对推断把握程度的要求。 (4)抽取调查单位的方式。,利用Exc

11、el计算必要样本单位数,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,24,用样本均值估计总体均值时所允许的最大绝对误差是抽样极限误差,它表示抽样误差的可能范围,又称允许误差。 如果用表示抽样极限误差,则 那么样本容量n 的大小则为,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,25,例20-2:某县进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样极限误差为5元,计算应抽取的样本户数? (1)建立“样本容量计算”工作表。 (2)分别计算与置信度95.45%对应的z值、样本容量并对其取整。计算结果如图20-2所示。,2

12、019/6/8,西南科技大学生命科学与工程学院周海廷制作,26,图20-2 必要样本容量计算,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,27,总体标准差及方差的估计,方差估计的内容和工作表函数 1大样本情况下总体标准差的区间估计 只要样本足够大,样本标准差s就服从正态分布,其均值近似等于总体标准差,其标准差 , 所以在置信度为时,的置信区间为:,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,28,2小样本情况下正态总体方差的置信区间 设为来自均值为、方差为2的正态总体,、2均为未知,则2的点估计量为,且, 那么置信度为时总体方差的置信区间为,2019/6/8,西

13、南科技大学生命科学与工程学院周海廷制作,29,Excel提供了两个用于方差估计的工作表函数。 (1)卡方分布函数 语法:CHIDIST(x,degrees_freedom) 其中:x为用来计算分布的数值,degrees_freedom为自由度。 (2)卡方分布反函数 语法:CHIINV(probability,degrees_freedom) 其中:probability为卡方分布的单尾概率,degrees_freedom 为自由度。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,30,总体方差的置信区间 例3:对某机床生产的一批模具随机抽取20件进行尺寸检测,其尺寸的标准差为0

14、.5毫米,假定总体服从正态分布,以95%的置信度估计这批模具尺寸的方差的置信区间。 由于总体方差未知,且又是小样本,所以使用分布进行区间估计。在95%的置信度下,分布的右侧置信度为0.025,左侧置信度为0.975。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,31,(1)建立“方差区间估计”工作表,输入相关数据。 (2)分别计算卡方右侧临界值、卡方左侧临界值、总体方差上限、总体方差下限、总体标准差上限、总体标准差下限。计算结果如下图所示。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,32,假设检验,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,3

15、3,假设检验的基本思想和步骤,1 假设检验的基本思想 假设检验是根据样本的信息来判断总体分布是否具有指定的特征。 在数理统计中,把需要用样本判断正确与否的命题称为一个假设。根据研究目的提出的假设称为原假设,记为H0;其对立面假设称为备择假设(或对立假设),记为HA。 提出假设之后,要用适当的统计方法决定是否接受假设,称为假设检验或统计假设检验。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,34,例21-1:某厂为了提高其产品的寿命进行了工艺改革,从生产的一大批产品中随机抽取10只,测得其样本均值小时,已知旧工艺条件下的产品寿命服从正态分布N(200, 52),试问新产品的寿命与

16、旧产品的寿命是否一致。 一般说来,工艺条件的变化只影响均值,而对方差影响不大。因此,可以认为新产品寿命服从正态分布N(, 52),是未知的,而=200是否成立也是未知的。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,35,如果原假设=200成立,那么x N(200, 52),从而由单个总体的抽样分布的结论可知: ,统计量,对于给定的=0.05,令, 或,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,36,由于观测值 ,因此统计量z的观测值z0满足 而由前可知,是一个小概率。,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,37,2 假设检验的基本步骤 (1)构造假设 (2)确定检验的统计量及其分布 (3)确定显著性水平 (4)确定决策规则 (5)判断决策,2019/6/8,西南科技大学生命科学与工程学院周海廷制作,38,1 构造检验统计量 设总体X服从正态分布N(, 2),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号