excel在统计中的应用教学课件作者肖文博第4章抽样与抽样分布

上传人:E**** 文档编号:102543164 上传时间:2019-10-03 格式:PPT 页数:24 大小:660.50KB
返回 下载 相关 举报
excel在统计中的应用教学课件作者肖文博第4章抽样与抽样分布_第1页
第1页 / 共24页
excel在统计中的应用教学课件作者肖文博第4章抽样与抽样分布_第2页
第2页 / 共24页
excel在统计中的应用教学课件作者肖文博第4章抽样与抽样分布_第3页
第3页 / 共24页
excel在统计中的应用教学课件作者肖文博第4章抽样与抽样分布_第4页
第4页 / 共24页
excel在统计中的应用教学课件作者肖文博第4章抽样与抽样分布_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《excel在统计中的应用教学课件作者肖文博第4章抽样与抽样分布》由会员分享,可在线阅读,更多相关《excel在统计中的应用教学课件作者肖文博第4章抽样与抽样分布(24页珍藏版)》请在金锄头文库上搜索。

1、第4章 抽样与抽样分布,4. 1抽样方法和统计量 4. 2概率与概率分布,返回,4. 1 抽样方法和统计量,4. 1. 1重置抽样 重置抽样,又称有放回的抽样或重复抽样,是指从总体N个单位中随机抽取一个容量为n,的样本,每次抽中的总体单位经登录其有关标志值后又放回总体中重新参加下一次的样本单位抽选。 【例1】设祥龙机械厂15名应聘人员有关资料如图4一1所示。 (1)新建一工作表,按图4一1所示输入数据 (2)单击一空白单元格,然后单击菜单选项【工具(T)】,选择【数据分析(D)】,进入到“数据分析”对话框,选择“抽样”分析工具,单击“确定”,进入“抽样”对话框,如图4一2所示。 (3)在“输入

2、区域(I) ;”右侧文本框输入$A$1; $A$16(注意:在从总 体中抽取样本单位之前,必须对所有总体单位编号,在输入区域应该输入总体单位编号所在单元格区域,不能是其他内容)。由于从A1开始,所以选择“标志(L)”。,下一页,返回,4. 1 抽样方法和统计量,(4)抽样方法 (5)在“输出选项”中选择单选框“输出区域(0);,然后单击确定,则 显示出5个样本单位编号,为“6, 3, 9,15、3”(注意:每次抽样,都会显示不同的结果,属正常情形)。 (6)在J1中输入“编号”,单击菜单选项【数据(D)】一【筛选(F)】, 选择其中的【高级筛选(A).】,则显示高级筛选对话框,如图4一3所示。

3、 (7)高级筛选有两种方式:“在原有区域显示筛选结果(F)”和“将筛选结果复制到其他位置(0)。为了保证总体不被破坏,选择第二项,即“将筛选结果复制到其他位置(0)。 (8)“列表区域(L)“:表示总体单位所在单元格区域,将光标置于其右侧 文本框中后,选择单元格区域A1;H16,上一页,下一页,返回,4. 1 抽样方法和统计量,(9)“条件区域(C)”表示进行筛选条件所在单元格区域,将光标置于其 右侧文本框中后,选择单元格区域J1 ; J6 (10)单击“复制到(T):”右侧文本框,将光标置于其中,选择一空白单元格,本例中选择K1。 (11)选择“选择不重复的记录(旦)”,然后单击“确定”,即

4、将单位编号为“3, 6, 9, 15”的4个单位筛选出来,编号为“3”的单位只选了一个。 4.1.2不重置抽样 不重置抽样,又称不重复抽样或无放回的抽样,是指从全集总体N个单位中随机抽取一个容量为n,的样本,每次抽中的单位登录其有关标志值后不再放回总体中参加下一次的抽选。经过连续,次不重置抽选,得到,个总体单位构成的样本,实质上相当于一次性同时从总体中抽中,个总体单位构成样本。,上一页,下一页,返回,4. 1 抽样方法和统计量,4.1.3统计量 样本是总体的代表与反映,样本被抽取出来之后,根据样本单位的观察值计算出的统计量对总体指标进行推断样本单位的观测值往往随着样本的变化而变化,根据样本单位

5、观测值计算的统计量是一个随机变量,样本统计量均用小写英文字母常见的统计量有样本平均数:x、抽样成数p、样本标准差S和样本方差矛等,其计算方法与总体对应指标基本相同,只不过说明对象不同而已。,上一页,返回,4. 2 概率与概率分布,4. 2. 1概率 在不同的条件下由于各种因素影响,有些变量会取各种不同的值,具有不确定性和随机性,此类变量称为随机变量随机变量可以是离散型的,一也可以是连续型的。随机变量取某一个值,就是一个随机事件,概率是对随机事件发生的可能性的度量。概率是表示一个随机事件发生的可能性大小的数,又称或然率、机会率或几率、可能性,是数学概率论的基本概念,是一个在n到1之间的实数. 在

6、大量的调查试验中,随机变量的取值具有一定的规律,所以随机事件出现的可能性大小,即事件发生的概率是遵循一定的统计规律的,我们把这种规律称作概率分布。如果掌握了一个随机变量的概率分布,就能认识随机现象的统计规律性了。常见的概率分布有二项分布、正态分布、泊松分布。,下一页,返回,4. 2 概率与概率分布,4. 2. 2二项分布 将某随机试验重复进行n次,若各次试验结果互不影响,即每次试验结果出现的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的。 对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与A之一,在每次试验中出现A的概率是常数p (o p 1),因而出现对立事件A的概率是1

7、 -P =a,则称这一串重复的独立试验为n重贝努利试验,简称贝努利试验( Bernoulli trials。一般,在n重贝努利试验中,事件A恰好发生k (0kn)次的概率为:,上一页,下一页,返回,4. 2 概率与概率分布,在社会经济领域中,我们经常碰到这一类离散型随机变量,如在生产产品过程中,产品是合格品还是废品等这就可用贝努利试验来概括。 统计函数对话框如图4一4所示。 【例3】接【例2】,参照图4一5,在A1;A10, B1, C1中输入如图所示数据。 (1)单击B2单元格,输入“= BINOMDIST (A2 , 8 , 0. 2 , 0 ) 按回车键,再单击B2单元格,将鼠标移至B2

8、单元格右下角,鼠标变为“+”按住鼠标左键,拖至B10单元。 (2)点C2单元格,输入“= B2 “,按回车键,在C3中输入“=1 +C2“, 按回车键;再单击C3单元格,将鼠标移至C3单元格右下角,鼠标变为“+”,按住鼠标左键,拖至C10单元,可以看出最多3次航班晚点包括了“没有航班晚点、一次航班晚点、两次航班晚点”这三种情况。,上一页,下一页,返回,4. 2 概率与概率分布,(3)根据A1;B10可绘制二项分布,如图4一6所示: 4. 2. 3正态分布 正态分布是应用最广的一种分布,许多自然界和社会经济领域的随机变量都反映为正态分布正态分布曲线呈“中间高,两边低,左右对称”的钟形,以正态分布

9、的平均数为中心,左右两边对称,两边曲线降低的急缓取决于正态分布数列的标准差,平均数和标准差是正态分布的两个特征值。在Excel的统计函数中,有4个用于正态分布的函数: 一对是用于标准正态分布的函数NORMSDIST()及其逆函数NOEMSINV()(注意:标准正态分布是平均数为0,标准差为1的正态分布,不受计量单位影响,任何正态分布都可以转化为标准正态分布)。,上一页,下一页,返回,4. 2 概率与概率分布,一对是用于非标准正态分布的函数NORMDIST()及其逆函数NORMINV()。遇到非标准正态分布,可以直接用NORMDIST()函数 图4 -7是一个正态分布,以平均数拜为对称轴,它是由

10、正态分布密度曲线和横轴围成的一个区域,其面积为1, X轴上方的曲线为正态分布密度曲线,其公式为: 正态分布是概率论中最重要的一种分布,它在客观世界中有着广泛的体现,如学生成绩的分布、入的身高和体重的分布等都服从正态分布。在Excel中,可以直接计算出形式如P(Xx)的概率(即只能计算变量值小于等于某一个数的概率),即计算如图4 -8所示中阴影部分的面积。,上一页,下一页,返回,4. 2 概率与概率分布,在插入函数NORMDIST)后,进入如图4 -9所示的“函数参数”对话框NORMDIST()共有4个函数参数需要设置,其分别是: (1)参数X对应的文本框中输入区间点,即X小于等于的某一个数;

11、(2)参数Mean对应的文本框中输入正态分布的平均数; (3)参数Standard dev对应的文本框中输入正态分布的标准差; (4)参数Cumulative对应的文本框中输入0或1,即False或True,代表计算的是概率密度或累积分布函数;概率密度是为X轴到正态分布曲线的距离,不是计算概率;累积分布函数是为概率密度、正态分布曲线、X轴所围成的区域面积。,上一页,下一页,返回,4. 2 概率与概率分布,4. 2. 4泊松分布 泊松分布是一种常见的离散概率分布,若随机变量x只取非负整数值,取入值的概率为: k通常表明一段时间内某一事件出现的次数。 4. 2. 5抽样分布 统计量的分布称为抽样分

12、布,它是统计学中的核心概念之一。从一个总体中可以抽取多个样本,样本的平均数是一个随机变量,一也是一个统计量,所有样本平均数的取值有没有规律,对于正确理解样本的平均数这一概念,对于理解参数估计和假设检验中的有关方法至关重要,Excel提供的随机数发生器可以使我们对样本平均数分布进行计算机模拟,对抽样分布有更加直观的理解。,上一页,下一页,返回,4. 2 概率与概率分布,1. X2分布 X2分布是指n个独立的标准正态分布变量的平方和服从自由度为n的卡方分它主要适用于对拟合优度检验和独立性检验以及对总体方差的估计和检验在Excel中,CHIDIST()函数可计算P (X x)的概率布等。 2. t分

13、布 t分布是对称分布,且其均值为0,当样本容量n较小时,t分布的方差大于1;当n增大到大于或等于30时,t分布的方差就趋近于1, t分布一也就趋近于标准正态分布。 t分布是小样本分布,小样本分布一般是指n 30,它适用于由样本平均数推断总体平均数以及两个小样本之间差异的显著性检验等。,上一页,下一页,返回,4. 2 概率与概率分布,计算双尾概率时TDIST的返回值为P(|t1|x),即图4一13中阴影的面 积;计算单尾概率时TDIST的返回值为P(|t1|x),即图4一13中右侧阴影的面积这一点与正态分布相差很大t累积分布函数与正态分布的另一点不同是t分布要求输入的x为正值。 3. F分布 F

14、DIST ( x, degrees freedom1 , degrees freedom2)的3个参数分)I为x的值、分子的自由度和分母的自由度。F分布的返回值为FDIST = P ( F x)。 4.中心极限定理 中心极限定理是指在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。它是数理统计学和误差分析的理论基础,指出了随着样本容量增大,样本平均数的频数分布越来越接近正态分布。,上一页,返回,图4一1样龙机械厂应聘人员基本情况,返回,图4一2抽样分析工具,返回,图4一3高级筛选,返回,图4 -4二项分布函数参数,返回,图4一5二项分布的概率,返回,图4 -6飞天航空公司航班晚点次数及概率,返回,图4一7正态分布,返回,图4一8 P (Xx)概率,返回,图4 -9 NORMDIST()函数参数,返回,图4一13 t分布,返回,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号