Excel在统计分析中的应用 教学课件 ppt 作者 陈斌 第5章

上传人:E**** 文档编号:89431878 上传时间:2019-05-25 格式:PPTX 页数:36 大小:2.87MB
返回 下载 相关 举报
Excel在统计分析中的应用 教学课件 ppt 作者 陈斌 第5章_第1页
第1页 / 共36页
Excel在统计分析中的应用 教学课件 ppt 作者 陈斌 第5章_第2页
第2页 / 共36页
Excel在统计分析中的应用 教学课件 ppt 作者 陈斌 第5章_第3页
第3页 / 共36页
Excel在统计分析中的应用 教学课件 ppt 作者 陈斌 第5章_第4页
第4页 / 共36页
Excel在统计分析中的应用 教学课件 ppt 作者 陈斌 第5章_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《Excel在统计分析中的应用 教学课件 ppt 作者 陈斌 第5章》由会员分享,可在线阅读,更多相关《Excel在统计分析中的应用 教学课件 ppt 作者 陈斌 第5章(36页珍藏版)》请在金锄头文库上搜索。

1、第五章 抽样与参数估计,重点内容: 简单随机抽样 周期抽样 参数估计的基本概念 总体均值的区间估计 总体方差的区间估计 两个总体参数的区间估计,一、简单随机抽样,1. 使用随机数函数 Excel2010提供了RAND函数与RANDBETWEEN函数产生随机数,通过在单元格中直接输入公式或者通过“插入函数”命令均可实现。 (1)RAND函数 RAND函数的功能是产生0-1之间(不包含1)的的均匀分布随机小数,每次计算工作表时都会返回一个新的数值,其语法格式是:RAND()。 (2)RANDBETWEEN函数 RANDBETWEEN函数的功能是产生介于两个指定数之间的随机数,其语法格式是:RAND

2、BETWEEN(Bottom,Top),其中,参数Bottom是返回的最小整数,Top是返回的最大整数。,一、简单随机抽样,2. 实例应用:对员工工号的简单随机抽样 (1)实例的数据说明 元旦将至,某公司想从100名员工中随机抽取10名参加公司组织的元旦晚会合唱演出,员工工号从001至100,试用Excel的函数功能随机抽选出10名员工的工号。 (2)实例的操作步骤 新建“对员工工号的简单随机抽样” 工作簿; 使用RAND函数随机抽取员工工号; 使用RANDBETWEEN函数随机抽取员工工号。,一、简单随机抽样,2. 实例应用:对员工工号的简单随机抽样 (3)实例的结果分析 在该实例中,我们采

3、用Excel自带的函数功能RAND函数和RANDBETWEEN函数对参加元旦晚会合唱演出的员工进行了简单随机抽样,从图中可以看出,输出的结果均是介于0与100之间,对单元格格式稍加设置,便可以当作工号的抽样结果。,一、简单随机抽样,3. 使用随机数发生器 Excel2010的加载项“数据分析”中的“随机数发生器”提供了随机数产生的功能,利用此功能可以产生多种类型和条件的随机数。 在工具栏中选择“数据”“数据分析”命令,随即弹出“数据分析”对话框,选择“随机数发生器”选项,单击“确定”按钮,随即弹出 “随机数发生器”对话框。用户根据情况对该对话框进行相应的设置即可产生所需要的随机数。,一、简单随

4、机抽样,4. 实例应用:某活动中幸运观众的随机抽样 (1)实例的数据说明 在某娱乐活动中,主持人准备从现场400名观众中随机抽取10名为幸运观众。试使用随机抽样发生器抽出这10名幸运观众。 (2)实例的操作步骤 新建“某活动中幸运观众的随机抽样”工作簿; 设置单元格格式; 执行“数据”“数据分析” “随机数发生器”命令; 设置“随机数发生器”对话框。,一、简单随机抽样,4. 实例应用:某活动中幸运观众的随机抽样 (3)实例的结果分析 该实例是采用数据分析工具中的随机数发生器进行随机抽样的,该工具不但简单易用,而且能够产生多个分布的随机数,在分析各种不同分布对应的分布图时也会用到。用户可以根据实

5、际情况选择合适的分布。,一、简单随机抽样,5. 使用抽样分析工具 Excel2010给用户提供了“抽样”分析工具,“抽样”分析工具以数据源区域为总体,从而为其创建一个样本。当总体太大而不能进行处理或绘制时,可以选用具有代表性的样本。如果确认数据源区域中的数据是周期性的,还可以仅对一个周期中特定时间段中的数值进行采样。例如,如果数据源区域包含季度销售量数据,则以四为周期进行采样,将在输出区域中生成与数据源区域中相同季度的数值。 “抽样”分析工具属于加载项“数据分析”中的基本功能之一,如果用户还没有安装“数据分析”加载项,请先安装,安装方法见4.4.1节。,一、简单随机抽样,6. 实例应用:31个

6、地区资本形成总额的随机抽样 (1)实例的数据说明 下表显示的是2009年我国内地31个地区的资本形成总额数据,试采用抽样工具随机抽出8个样本。 (2)实例的操作步骤 新建“31个地区的资本形成总额的随机抽样” 工作簿; 执行“数据”“数据分析” “抽样”命令; 设置“抽样”对话框。,一、简单随机抽样,6. 实例应用:31个地区资本形成总额的随机抽样 (3)实例的结果分析 该实例是采用数据分析工具中的抽样分析工具进行随机抽样的。抽样分析工具是从已知总体中抽取指定数量的样本,相对而言,该工具比随机数发生器操作起来更为简便,但是随机数发生器能够产生多种分布的随机数,所以抽样分析工具和随机数发生器的功

7、能侧重点不同,用户可以根据实际需要选择最佳的抽样工具。,二、周期抽样,1. 使用抽样分析工具 上节内容中所介绍的“抽样”分析工具除了可以进行随机抽样外,还可以进行周期抽样。如果确认数据源区域中的数据是周期性的,就可以对一个周期中特定时间段中的数值进行采样,以更好地反映总体样本的特征。,二、周期抽样,2. 实例应用:社会消费品零售总额的周期抽样 (1)实例的数据说明 右图显示的是2005年7月份至2011年6月份我国社会消费品零售总额数据,试采用周期抽样法从中抽取样本。 (2)实例的操作步骤 新建“社会消费品零售总额的周期抽样”工作簿; 执行“数据”“数据分析” “抽样”命令; 设置“抽样”对话

8、框。,二、周期抽样,2. 实例应用:社会消费品零售总额的周期抽样 (3)实例的结果分析 如果对该数据绘制折线图并添加趋势线,如图所示,则可以一目了然地看出社会消费品零售总额呈现周期循环特征。因此对该总体应采用周期抽样,以准确反映样本总体的周期性特征。 虽然各月份我国社会消费品零售总额不尽相同,与其他月份相比春节前后总额更大,但我国社会消费品零售总额是逐年同比增长的,如图所示。,三、参数估计的基本概念,1. 估计量与估计值 (1)估计量。对总体参数进行估计时相对应的样本统计量称为估计量。常用的估计量有:样本均值、样本方差(或样本标准差)和样本比率。 (2)估计值。估计值是统计量中的一个具体数值,

9、也就是样本估计量的具体观察值。 点估计与区间估计 (1)点估计。点估计就是用样本统计量的某个取值直接作为总体参数 的估计值,亦称为定值估计。 (2)区间估计。区间估计是在一定的概率保证下,用以点估计值为中心的一个区间范围来估计总体指标值的一种估计方法。,三、参数估计的基本概念,估计量的优良 (1)无偏性。无偏性是指样本统计量的期望值等于该统计量所估计的总体参数。若以表示被估计的总体参数, 表示的无偏估计量,则有( )=。 (2)一致性。当样本容量n增大时,如果估计量越来越接近总体参数的真值时,就称这个估计量为一致估计量。估计量的一致性是从极限意义上讲的,它适用于大样本的情况。如果一个估计量是一

10、致估计量,那么采用大样本则更加可靠。 (3)有效性。有效性的概念是指估计量的离散程度。对给定的样本容量而言,如果两个估计量都是无偏的,其中方差较小的估计量相对来说更有效。,四、总体均值的区间估计,1. 总体方差已知下的估计 当总体服从正态分布且方差已知时,样本均值 的抽样分布仍为正态分布,其数学期望为总体均值,方差为 2 。而样本均值经过标准化以后的随机变量则服从标准正态分布,即:z= 0,1 ,则总体均值所在的 1 置信水平下的置信区间为: 2 。 对于服从正态分布或者大样本容量的总体,Excel2010提供了CONFIDENCE.NORM函数用于构建总体平均值的置信区间,其语法格式为CON

11、FIDENCE.NORM(alpha, standard_dev, size) 。,四、总体均值的区间估计,2. 实例应用:所购入原材料平均重量的区间估计 (1)实例的数据说明 某企业生产车间采购负责人希望估计购入的一批5000包原材料的平均重量,已知原材料的总体标准差 =15kg,在随机抽取的250个样本称重后计算出的每包平均值 =65kg。试在95%的置信水平下对该批原材料的平均重量进行区间估计。 (2)实例的操作步骤 新建“所购入原材料平均重量的区间估计” 工作簿; 计算 2 ; 计算置信上限与置信下限。,四、总体均值的区间估计,2. 实例应用:所购入原材料平均重量的区间估计 (3)实例

12、的结果说明 通过插入“CONFIDENCE.NORM” 函数对该实例进行了总体均值估计,从计 算结果可以得出,该企业有95%的把握认 为购入的这批原材料的平均重量介于 63.1406kg66.8594kg之间。虽然本例 的数据说明中并未说明总体是否服从正 态分布,但因为样本容量较大(为5000), 亦可以按照正态分布的情况进行估计。,四、总体均值的区间估计,3. 总体方差未知且为小样本下的估计 当总体均值、总体方差均未知时,可以计算样本标准差并用它来代替总体标准差 。但此时新的统计量不再服从正态分布,而是服从自由度为(n-1 )的t分布: = (1 。因此,在小样本情况下,我们可借用t分布来估

13、计总体均值。根据t分布建立的总体均值在1的置信水平下的置信区间为: 2 ,式中, 2 是自由度为(1)时,t分布中右侧面积为 2 的t 值。 对于总体方差未知且为小样本下的均值估计,Excel2010提供T.INV.2T函数用于计算 ,其语法格式为T.INV.2T(probability, deg_freedom) 。,四、总体均值的区间估计,4. 实例应用:所生产产品平均重量的区间估计 (1)实例的数据说明 某企业生产车间负责人希望估计一批产品的平均重量,该批产品的总体方差未知,对随机抽取的24个样本称重结果如表所示。试在95%的置信水平下对该批产品的平均重量进行区间估计。 (2)实例的操作

14、步骤 新建“所生产产品平均重量的区间估计” 工作簿; 计算样本均值和样本标准差; 计算 2 ; 计算置信上限与置信下限。,四、总体均值的区间估计,4. 实例应用:所生产产品平均重量的区间估计 (3)实例的结果分析 在该实例中,虽然总体方差未给定,但采用了可计算的样本方差来代替,然后又通过插入“T.INV.2T”函数,我们对该企业生产的这批产品的平均重量进行了估计。从计算结果可以得出,该企业生产车间负责人有95%的把握认为生产的这批产品的平均重量介于74.8793kg77.1207kg之间。,四、总体均值的区间估计,5. 总体方差未知且为大样本下的估计 当总体方差未知且样本容量大于30,即为大样

15、本时,可用标准正态分布近似地当作 分布。因此,在实际工作中,只有在小样本的情况下,才应用t分布,而对于大样本,则通常采用正态分布来构造总体均值的置信区间。 因为总体方差未知,所以用样本方差来代替。这时,总体均值在1的置信水平下的置信区间为: 2 这里仍然利用Excel2010提供的CONFIDENCE.NORM函数来构建总体平均值的置信区间,只不过总体标准差要用样本标准差代替。,四、总体均值的区间估计,6. 实例应用:销售人员日均销量的区间估计 (1)实例的数据说明 某电器公司管理人员希望估计销售部门的销售情况,日均销量的总体方差未知,从中随机抽取的50名销售人员日均销量如表所示。试在95%的

16、置信水平下对销售部门的日均销量进行区间估计。 (2)实例的操作步骤 新建“销售人员日均销量的区间估计” 工作簿; 计算样本均值、样本标准差和 2 ; 计算置信上限与置信下限。,四、总体均值的区间估计,6. 实例应用:销售人员日均销量的区间估计 (3)实例的结果说明 在该实例中,因为总体方差未知,所以首先通过计算样本方差以代替总体方差进行均值估计,然后通过插入“CONFIDENCE.NORM”函数得到了销售部门日均销量的区间范围。从计算结果可以得出,该公司有95%的把握可以认为销售部门的日均销量介于83台89台之间。,五、总体方差的区间估计,1. 总体方差的区间估计 由抽样分布的知识可知,样本方差服

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号