《信用社评估工作与抽样统计知识》由会员分享,可在线阅读,更多相关《信用社评估工作与抽样统计知识(119页珍藏版)》请在金锄头文库上搜索。
1、6 - 1统计学6 - 2参数估计在统计方法中的地位参数估计在统计方法中的地位6 - 3统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方差差差总体均值、总体均值、总体均值、总体均值、比例、方差比例、方差比例、方差比例、方差6 - 4第一部分第一部分 抽样推断抽样推断第一节 抽样推断概述第二节 抽样误差和抽样估计第三节 抽样的组织方式第四节 样本容量的确定和总量指标的推算第一节第一节 抽样推断概述抽样推断概述一、抽样推断的意义 抽样推断是在抽样调查的基础上,运用数理统计
2、方法,根据样本的实际资料对总体作出具有一定可靠程度推断的一种统计方法。 特点:1 1由样本的已知资料去由样本的已知资料去估计估计未知的未知的总体总体数量数量特征特征。 2 2选取样本必须遵循选取样本必须遵循随机原则随机原则。 3 3抽样推断中产生的抽样推断中产生的误差误差可以事先可以事先控制控制。 二、抽样推断的作用1.对不可能进行全面调查的现象总体进行推断。2.对于某些不必要进行全面调查的总体进行推断。3.可以对全面调查的数据进行补充或修正。4.可以用于大批量生产过程中产品的质量检验和控制。5.可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍。三、抽样推断中的几个基本概念(一
3、)全及总体和抽样总体(一)全及总体和抽样总体(一)全及总体和抽样总体(一)全及总体和抽样总体1 1全及总体全及总体是指所要研究对象的全部单位构成是指所要研究对象的全部单位构成的整体,的整体,简称总体简称总体。单位数通常用。单位数通常用N N表示。表示。 2 2抽样总体抽样总体是指从全及总体中按照随机原则抽是指从全及总体中按照随机原则抽取的那部分单位组成的整体,取的那部分单位组成的整体,简称样本简称样本。 样本单位数也叫样本单位数也叫样本容量样本容量,用,用n n表示。表示。 全及总体是全及总体是唯一确定唯一确定的,而抽样总的,而抽样总体是体是随机的随机的。从一个全及总体中可以抽取一个。从一个全
4、及总体中可以抽取一个样本,也可以抽取多个样本。样本,也可以抽取多个样本。 (二)全及指标和抽样指标(二)全及指标和抽样指标(二)全及指标和抽样指标(二)全及指标和抽样指标1 1全及指标。全及指标。全及指标是根据全及总体各单位标志值计算的综合指标,又称总体指标。常用的全及指标常用的全及指标 :(1 1)全及平均数:)全及平均数:全及总体各单位标志值的平均数。 (2 2)全及成数:)全及成数:全及总体中具有某一相同标志表现的单位数占全及总体单位数的比重,用P或者Q表示。 若以若以N N1 1代表具有某种相同标志表现的单位数,代表具有某种相同标志表现的单位数, N N0 0代表不具有某种相同标志表现
5、的单位数,代表不具有某种相同标志表现的单位数,N=NN=N1 1+N+N0 0,则总体成数为:,则总体成数为: 成数是是非标志的平均数。所谓是非标志就成数是是非标志的平均数。所谓是非标志就是指只能取两种标志表现的标志。假定具有某种是指只能取两种标志表现的标志。假定具有某种相同标志表现的变量值记为相同标志表现的变量值记为1 1,不具备该种标志表,不具备该种标志表现的变量值记为现的变量值记为0 0,那么成数,那么成数 可以看作是这两个可以看作是这两个变量的加权算术平均数,即变量的加权算术平均数,即 是是非标志的平均数:是是非标志的平均数:(3 3)总体数量标志标准差。)总体数量标志标准差。总体数量
6、标志标准差是指全及总体中根据各单位标志值计算的标准差。总体标准差的平方叫做总体方差,记作总体标准差的平方叫做总体方差,记作 。(4 4)总体是非标志标准差。)总体是非标志标准差。总体是非标志标准差是指全及总体中根据是非标志计算的标准差。总体是非标志的标准差为 ,方差为 。2 2抽样指标。抽样指标。抽样指标是根据抽样总体各单位标志值计算的综合指标,也称样本指标。抽样指标是一个随机变量。常用的抽样指标:常用的抽样指标:(1 1)抽样平均数。)抽样平均数。抽样平均数是抽样总体各单位标志值的平均数。(2 2)抽样成数。)抽样成数。抽样成数是样本中具有某一相同标志表现的单位数占样本单位数的比重,用p表示
7、或者q表示。 若以若以n n1 1代表具有某种相同标志表现的单位数,代表具有某种相同标志表现的单位数, n n0 0代表不具有某种相同标志表现的单位数,代表不具有某种相同标志表现的单位数,n=nn=n1 1+n+n0 0,则抽样成数为:,则抽样成数为:同理可知,p是样本是非标志的平均数。(3 3)样本数量标志标准差。)样本数量标志标准差。样本数量标志标准差是指样本中根据各单位标志值计算的标准差,记作S。样本标准差的平方叫做样本方差,记作样本标准差的平方叫做样本方差,记作S2 。(4 4)样本是非标志标准差。)样本是非标志标准差。样本是非标志标准差是指样本中根据是非标志计算的标准差。样本是非标志
8、的标准差为 ,方差为 。 在抽样估计中,样本指标又称为统计量,总体指标又称为参数 。 (三)抽样框与抽样方法(三)抽样框与抽样方法(三)抽样框与抽样方法(三)抽样框与抽样方法1抽样框 抽样之前,必须根据预定的要求将总体划分成一个个抽样单位,这些单位互不重叠,原来的总体单位只能属于某一个抽样单位。抽样单位可以是原来的总体单位,也可以不是原来的总体单位。 全部抽样单位所构成的名单称为抽样框。全部抽样单位所构成的名单称为抽样框。抽样框的作用是:抽样框的作用是:抽样框的作用是:抽样框的作用是:(1 1)易于贯彻随机原则和进行抽选工作,)易于贯彻随机原则和进行抽选工作,提高抽提高抽样效率样效率。(2 2
9、)确定了调查对象确定了调查对象即全及总体的范围。即全及总体的范围。2抽样方法重复抽样:重复抽样:也称重置抽样或有放回抽样,是指从总体中随机抽选第一个样本单位后,将它的标志记录下来后放回总体再次参加抽选,重复这个步骤,直到抽满n个样本单位为止。不重复抽样:不重复抽样:也称不重置抽样或无放回抽样,是指从总体单位数为N的总体中随机抽选第一个样本单位后,将它的标志记录下来后不放回总体,再从N-1个单位中抽选第二个样本单位,将它的标志记录下来后也不放回总体,重复这个步骤,直到抽满n个样本单位为止。抽样方法特点比较抽样方法特点比较重复抽样重复抽样不重复抽样不重复抽样每次抽选时,总体单位数每次抽选时,总体单
10、位数不变逐渐减少各单位被抽中的可能性各单位被抽中的可能性前后相同前后不断变化各单位有无重复抽中的可能各单位有无重复抽中的可能有没有第二节第二节 抽样误差和抽样估计抽样误差和抽样估计一、抽样误差的概念一、抽样误差的概念一、抽样误差的概念一、抽样误差的概念登记性误差登记性误差是指在登记汇总过程中由于测量、记录、转抄、计算等错误而产生的误差。代表性误差代表性误差是指排除登记性误差后,用样本指标推断总体指标时所产生的误差。由于没有遵循随机原则而产生的误差,称为偏差。偏差。在没有登记性误差的前提下,又遵循了随机原则,纯粹是由样本指标推断总体指标时产生的误差,称为抽样抽样误差误差。抽样实际误差抽样实际误差
11、是指样本指标与总体实际指标的差数。抽样平均误差抽样平均误差是所有样本指标的标准差。统计误差统计误差抽样平均误差抽样平均误差抽样实际误差抽样实际误差抽样误差抽样误差偏差偏差代表性误差代表性误差登记性误差登记性误差二、抽样平均误差的计算二、抽样平均误差的计算二、抽样平均误差的计算二、抽样平均误差的计算(一)重复抽样的抽样平均误差1.1.抽样平均数的抽样平均误差抽样平均数的抽样平均误差 表示总体的标准差,n为样本容量。2.2.抽样成数的抽样平均误差抽样成数的抽样平均误差P(1-P)表示总体是非标志的方差,n为样本容量。(二)不重复抽样的抽样平均误差1.1.抽样平均数的抽样平均误差抽样平均数的抽样平均
12、误差 表示总体的标准差,n为样本容量,N为总体单位数。2.2.抽样成数的抽样平均误差抽样成数的抽样平均误差P(1-P)表示总体是非标志的方差,n为样本容量,N为总体单位数。三、抽样平均误差的影响因素三、抽样平均误差的影响因素三、抽样平均误差的影响因素三、抽样平均误差的影响因素(1 1)样本容量。)样本容量。样本容量越小,抽样平均误差越大;样本容量越大,抽样平均误差越小。(2 2)总体标志变异指标。)总体标志变异指标。总体标志变异指标越大,抽样平均误差越大;总体标志变异指标越小,抽样平均误差也越小。当总体标志变异程度为零时,说明总体各单位之间无差异,此时,抽样平均误差为零。(3 3)抽样的方式方
13、法。)抽样的方式方法。在其他条件相同的条件下,重复抽样的抽样平均误差大于不重复抽样的抽样平均误差。四、抽样估计四、抽样估计四、抽样估计四、抽样估计 抽样估计就是利用所取得的样本资料,抽样估计就是利用所取得的样本资料,采用一定的估计方法,对总体进行估计和推断。采用一定的估计方法,对总体进行估计和推断。(一)抽样估计的优良标准(一)抽样估计的优良标准1 1无偏性。无偏性。用样本指标估计总体指标时,所有可能样本指标的平均数等于被估计的总体指标。2 2一致性。一致性。用样本指标估计总体指标时,若样本容量充分的大,则样本指标充分靠近总体指标,即随着样本容量的无限增大。3 3有效性。有效性。有效性要求样本
14、指标估计总体指标时,作为无偏估计量的方差比其他估计量的方差小。(二)抽样估计的方法(二)抽样估计的方法1 1点估计。点估计。点估计就是用实际样本指标数值代替总体指标数值的一种估计方法。2 2区间估计。区间估计。区间估计就是根据样本指标和抽样平均误差估计总体指标的可能范围,并同时给出总体指标落在该范围的可靠程度。 由于未知的全及指标是一个确定的量,而抽样指标则是围绕着全及指标出现的随机变量,它与全及指标可能产生正负离差,这种变动范围的最大绝对值就是抽样极限误差,也称为允许误差。用 和 分别表示平均数和成数的抽样极限误差,则有:变换后,得: 抽样极限误差要用抽样平均误差为标准来抽样极限误差要用抽样
15、平均误差为标准来衡量,把抽样极限误差除以抽样平均误差,表示抽样衡量,把抽样极限误差除以抽样平均误差,表示抽样极限误差是抽样平均误差的倍数,它是测量抽样估计极限误差是抽样平均误差的倍数,它是测量抽样估计可靠程度的一个参数,称为概率度,通常用可靠程度的一个参数,称为概率度,通常用t t表示。表示。 上述公式表明,在一定抽样平均误差的条件下,概率度越大,则抽样极限误差越大,总体指标落在误差范围内的概率越大,从而抽样估计的可靠程度也就越高;反之,概率度越小,则抽样极限误差越小,总体指标落在误差范围内的概率也越小,从而抽样估计的可靠程度也就越低。 那么如何衡量总体指标落在误差范围内的概率大小哪?数理统计
16、证明,概率度和概率之间存在一定的函数关系,若用P表示概率,即表示抽样估计的可靠程度或者概率保证程度,则其函数关系可表示为: P与t的值是一一对应的。常用的P与t的对应值如表8-1,其他概率与概率度的对应关系可查正态分布概率表。概率P(%)概率度 t概率P(%)概率度 t68.271951.96801.2895.452901.6499.733例:某企业对某批电子元件寿命进行检验,随机抽取100只,测得平均耐用时间为1000小时,标准差为50小时,合格率为94%,试计算:以耐用时间的允许误差范围 小时,估计该批产品平均耐用时间的区间及其概率保证程度。解:下限: 上限: 由 ,查概率表得 答:估计该
17、批产品的平均耐用时间在9901010小时之间,有95.45%的概率保证程度。第三节第三节 抽样的组织方式抽样的组织方式一、简单随机抽样一、简单随机抽样一、简单随机抽样一、简单随机抽样1.1.概念:概念:简单随机抽样也叫纯随机抽样,它是指在进行抽样时,对全及总体不经过任何形式的处理,不进行排队或分类,按照随机原则从总体中抽取样本单位的抽样方式。2.2.取样方法取样方法 A 直接抽选法 B 抽签法 C 随机数表法 D 计算取随机数法3.3.抽样平均误差的计算抽样平均误差的计算估计总体平均数时 估计总体成数时重复抽样不重复抽样二、类型抽样二、类型抽样二、类型抽样二、类型抽样1.1.概念:概念:类型抽
18、样也叫分层抽样,它是运用统计分组法,把全及总体按主要标志划分为几个类型组,然后在各组中再按随机原则抽取样本单位的组织形式。2.2.分类分类 A 等比例类型抽样 B 不等比例类型抽样 3.3.抽样平均误差的计算抽样平均误差的计算重复抽样重复抽样估计总体平均数时估计总体成数时不重复抽样不重复抽样估计总体平均数时估计总体成数时例:某乡种小麦6000亩,其中平原3600亩,丘陵2400亩,现采用等比例类型抽样抽查了100亩,资料如表,试在95.45%的概率保证程度下估计该乡粮食亩产量的范围。解:概率保证程度为概率保证程度为95.45%95.45%时,对应的概率度时,对应的概率度t=1.64t=1.64
19、,则抽样,则抽样极限误差为:极限误差为:总平均亩产的估计值为:总平均亩产的估计值为:即小麦亩产量的估计值在即小麦亩产量的估计值在259.39259.39公斤公斤276.61276.61公斤之间。公斤之间。按地形分类播种面积(亩) 抽样面积(亩) 抽样平均亩产(公斤) 抽样标准差(公斤) 平原丘陵3600240060402802506040合计6000100268三、等距抽样三、等距抽样三、等距抽样三、等距抽样1.1.概念:概念:等距抽样又称机械抽样,它先将总体单位按一定标志排列起来,而后按固定顺序和一定距离来抽取样本单位的抽样方式。2.2.分类分类 A 根据排队依据的标志标志不同,分为无关标志
20、排队无关标志排队和有关标志排队有关标志排队。B 按样本单位抽选的方法方法不同,分为随机起点等距随机起点等距抽样抽样、半距起点等距抽样半距起点等距抽样和对称等距抽样对称等距抽样。3.3.抽样平均误差计算抽样平均误差计算 如果总体是按无关标志排队,抽样平均误差如果总体是按无关标志排队,抽样平均误差可采用简单随机不重复抽样公式去近似计算;可采用简单随机不重复抽样公式去近似计算; 如果总体是按有关标志排队,则可用等比例如果总体是按有关标志排队,则可用等比例类型抽样的公式去近似计算。类型抽样的公式去近似计算。四、整群抽样四、整群抽样四、整群抽样四、整群抽样1.1.概念:概念:整群抽样是将总体划分成由总体
21、单位所组成的若干群,然后以群作为抽样单位,从中随机抽取一些群,对中选群内的所有单位进行全面调查的抽样方式。2.2.特点:特点:组织工作比较方便,但抽样误差较大,代表性较低。3.3.抽样平均误差的计算抽样平均误差的计算整群抽样均采用不重复抽样整群抽样均采用不重复抽样抽样平均数的抽样误差:抽样成数的抽样误差:第四节第四节 样本容量的确定样本容量的确定一、影响样本容量的因素一、影响样本容量的因素一、影响样本容量的因素一、影响样本容量的因素1.总体标志的变异程度2.允许误差3.概率保证程度4.抽样的方法和方式二、简单随机抽样的样本公式二、简单随机抽样的样本公式二、简单随机抽样的样本公式二、简单随机抽样
22、的样本公式 估计总体平均数时 估计总体成数时重复抽样不重复抽样三、确定必要样本容量时应注意的问题三、确定必要样本容量时应注意的问题三、确定必要样本容量时应注意的问题三、确定必要样本容量时应注意的问题1在实际的抽样调查时,可先进行小规模的试验调查求得样本的方差和成数来代替总体的方差和成数,也可用历史的资料来代替2利用公式计算的样本容量不一定是整数,如果带有小数,则用“只入不舍”的原则。3如果进行抽样调查时,同时要对总体平均数和总体成数进行样本容量估计,选择较大者为样本容量。4在对总体成数进行推断前,如果计算样本容量时缺少成数的资料,则可以直接假定成数P为0.5,这样P(1-P)等于0.25为是非
23、标志方差的最大值,这样可以保证抽样估计的精确度。5公式中的样本容量是最低的,也是最必要的样本容量。四、总量指标的推算四、总量指标的推算四、总量指标的推算四、总量指标的推算目的:用抽样指标去推断全及指标(一)直接推算法(一)直接推算法 直接换算法是用样本指标值或者总体指标(总体平均数或者总体成数)的区间估计值乘以总体单位数来推算总量指标的方法。例:某地在10万户居民中随机抽选500户居民,经调查有90%的居民家中拥有两台以上的彩电。试以95.45%的概率保证程度推断,该地区有多少户居民拥有两台以上的彩电?解:已知 ,则由 ,可得 该地有两台以上彩电的用户数在87320户到92680户之间(二)修
24、正系数法(二)修正系数法 修正系数法是先将抽样调查资料与全面调查资料对比计算差错比率,即修正系数,然后用差错比率修正全面调查结果。步骤:步骤:1.1.计算差所比率计算差所比率 2.2.用差错比率修正全面调查结果用差错比率修正全面调查结果例8.10 某市人口普查结束后,过了一个月后又对某区进行抽样复测。已知,该市普查时的人口数为2005600人,所抽中的地区其普查时的人口数为120253人,一个月后抽样复测时,其人口数为120290人。如果在这一个月中,该区出生人数为68人,死亡人数为56人,试计算该市普查的人数。解:先把某区的人口数还原到普查时点的人数:120290-68+56=120278(
25、人) 修正后的该市人口数=2005600(1+0.02%)=2006001(人)所以,该市的普查人数为2006001人。6 - 35第二部分第二部分 抽样与参数估计抽样与参数估计第一节第一节第一节第一节 抽样与抽样分布抽样与抽样分布抽样与抽样分布抽样与抽样分布 第二节第二节第二节第二节 参数估计基本方法参数估计基本方法参数估计基本方法参数估计基本方法第三节第三节第三节第三节 总体均值和总体比例的区间估计总体均值和总体比例的区间估计总体均值和总体比例的区间估计总体均值和总体比例的区间估计第四节第四节第四节第四节 两个总体均值及两个总体比例之差的估计两个总体均值及两个总体比例之差的估计两个总体均值
26、及两个总体比例之差的估计两个总体均值及两个总体比例之差的估计第五节第五节第五节第五节 正态总体方差及两正态总体方差比的区间估计正态总体方差及两正态总体方差比的区间估计正态总体方差及两正态总体方差比的区间估计正态总体方差及两正态总体方差比的区间估计6 - 36学习目标学习目标1.了解抽样和抽样分布的基本概念了解抽样和抽样分布的基本概念2.理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系3.了解点估计的概念和估计量的优良标准了解点估计的概念和估计量的优良标准4.掌握总体均值、总体比例和总体方差的区掌握总体均值、总体比例和总体方差的区间估计间估计6 - 37 抽样与抽样分布抽样与抽样分布一一
27、. 总体、个体和样本总体、个体和样本二二. 关于抽样方法关于抽样方法三三.样本均值的分布与中心极限定理样本均值的分布与中心极限定理四四.样本方差的分布样本方差的分布五五.两个样本方差比的分布两个样本方差比的分布六六.六六. T 统计量的分布统计量的分布6 - 38总体、个体和样本总体、个体和样本(概念要点)(概念要点)总体总体总体总体(Population)(Population):调查研究的事物或现象的全体调查研究的事物或现象的全体个体个体个体个体(Item unit)(Item unit):组成总体的每个元素组成总体的每个元素样本样本样本样本(Sample)(Sample):从总体中所抽取
28、的部分个体从总体中所抽取的部分个体样本容量样本容量样本容量样本容量(Sample size)(Sample size):样本中所含个体的数量样本中所含个体的数量6 - 39抽样方法抽样方法(概念要点)(概念要点)1.1.概率抽样:根据已知的概率选取样本概率抽样:根据已知的概率选取样本 简单随机抽样:简单随机抽样:完全随机地抽选样本完全随机地抽选样本 分层抽样:分层抽样:总体分成不同的总体分成不同的“ “层层” ”,然后在每一层内进行,然后在每一层内进行抽样抽样 整群抽样:整群抽样:将一组被调查者(群)作为一个抽样单位将一组被调查者(群)作为一个抽样单位 等距抽样等距抽样:在样本框中每隔一定距离
29、抽选一个被调查者在样本框中每隔一定距离抽选一个被调查者2.2.非概率抽样:不是完全按随机原则选取样本非概率抽样:不是完全按随机原则选取样本 非随机抽样非随机抽样:由调查人员自由选取被调查者由调查人员自由选取被调查者 判断抽样:判断抽样:通过某些条件过滤来选择被调查者通过某些条件过滤来选择被调查者3.3.配额抽样:选择一群特定数目、满足特定条件的被调配额抽样:选择一群特定数目、满足特定条件的被调查者查者6 - 40样本均值的抽样分布样本均值的抽样分布6 - 411.所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布2.是一种理论概率分布3.随机变量是 样本统计量样本统计量n n样本均值
30、样本均值, , 样本比例等样本比例等4.结果来自容量相同的所有可能样本抽样分布抽样分布(概念要点)(概念要点)6 - 42样本均值的抽样分布样本均值的抽样分布(一个例子)(一个例子)【例例例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4=4。4 4 个个个个体体分分别别为为X X1 1=1=1、X X2 2=2=2、X X3 3=3 =3 、X X4 4=4 =4 。总体的均值、方差及分布如下。总体的均值、方差及分布如下均值和方差均值和方差均值和方差均值和方差总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3
31、.36 - 43样本均值的抽样分布样本均值的抽样分布 (一个例子)(一个例子) 现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样样条条件件下下,共共有有4 42 2=16=16个个样样本本。所所有有样样本本的的结结果果如下表如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的所有可能的所有可能的n n = 2 = 2 的样本(共的样本(共的样本(共的样本(共1616个)个)个)个)6 - 44样本均值的抽样分布样本均值的抽
32、样分布 (一个例子)(一个例子) 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x)样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P ( ( x x ) )1.51.53.03.04.04.03.53.52.02.02.52.5x x6 - 45所有样本均值的均值和方差所有样本均值的均值和方差
33、式中:式中:MM为样本数目为样本数目比较及结论:比较及结论:1. 1. 样本均值的均值(数学期望)等于总体均值样本均值的均值(数学期望)等于总体均值 2. 2. 样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n6 - 46样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较抽样分布抽样分布抽样分布抽样分布 = 2.5 2 =1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3P P ( ( x x ) )1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x
34、6 - 47样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 = 50= 50= 50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n = 4 = 4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n =16 =16当当总总体体服服从从正正态态分分布布N N ( ( , , 2 2 ) )时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 X X也也服服从从正正态态分分布布, X X 的的数学期望为数学期望为 ,方差为,方差为 2 2/ /n n。即。即 X XN N( ( , , 2 2/ /n n) )
35、6 - 48中心极限定理中心极限定理(图示)(图示)当样本容量足够当样本容量足够大时大时( (n n 30) 30) ,样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布中中中中心心心心极极极极限限限限定定定定理理理理:设设从从均均值值为为 ,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样分布近似服从均值为样分布近似服从均值为 、方差为、方差为 2 2/ /n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体X X6 - 49样本方差的抽样分布样本方差的抽样分布6 -
36、 50样本方差的分布样本方差的分布设总体服从正态分布N (,2 ), X1,X2,Xn为来自该正态总体的样本,则样本方差 s2 2 的分布为将 2(n 1)称为自由度为(n-1)的卡方分布6 - 51卡方卡方 (c c2) 分布分布 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2 = (n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布c c c c c c2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体6
37、 - 52均值的标准误均值的标准误1.所有可能的样本均值的标准差,测度所有样本均值的离散程度2.小于总体标准差3.计算公式为6 - 53两个样本方差比的抽样分布两个样本方差比的抽样分布6 - 54两个样本方差比的抽样分布两个样本方差比的抽样分布 设设X X1 1,X X2 2, ,X Xn1n1是是来来自自正正态态总总体体N N( 1 1, , 1 12 2 ) )的的一一个个样样本本, Y Y1 1,Y Y2 2, ,Y Yn2n2是是来来自自正正态态总总体体N N ( ( 2 2, , 2 22 2 ) )的的 一一 个个 样样 本本 , 且且 X Xi i( (i i=1,2,=1,2,
38、, n n1 1) ),Y Yi i( (i i=1,2, =1,2, ,n n2 2) )相互独立,则相互独立,则将将F F( (n n1 1-1 -1 , , n n2 2-1 -1 ) )称称为为第第一一自自由由度度为为( (n n1 1-1)-1),第第二二自由度为自由度为( (n n2 2-1)-1)的的F F分布分布6 - 55两个样本方差比的抽样分布两个样本方差比的抽样分布 不同样本容量的抽样分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)6 - 56T 统计量的分布统计量的分布6 - 57T 统计量的分布统计量的分布 设设X X1 1,X
39、 X2 2,X Xn1n1是是来来自自正正态态总总体体N N( 1 1, , 1 12 2 ) )的的一一个个样本,样本, 称称为统计量为统计量, ,它服从自由度为它服从自由度为( (n n-1)-1)的的t t 分布分布X X Xt t 分布与正态分布的比较分布与正态分布的比较正态分布正态分布t t 分布分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t ( (dfdf = 13) = 13)t t ( (dfdf = 5) = 5)Z Z6 - 58第二节第二节 参数估计基本方法参数估计基本方法一一. 点估计点估计二二. 点估计的优良性准则点估计的优良性准则三三
40、.区间估计区间估计6 - 59参数估计的方法参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计6 - 60被估计的总体参数被估计的总体参数总体参数总体参数总体参数总体参数符号表示符号表示符号表示符号表示用于估计的用于估计的用于估计的用于估计的样本统计量样本统计量样本统计量样本统计量一个一个一个一个总总体体体体均均值值比例比例方差方差两个总体两个总体两个总体两个总体均均值值之差之差比例之差比例之差方差比方差比6 - 61
41、点点 估估 计计6 - 62点估计点估计(概念要点)(概念要点)1.从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例例如如: : 用用样样本本均均值值作作为为总总体体未未知知均均值值的的估估计计值值就是一个点估计就是一个点估计2. 点估计没有给出估计值接近总体未知参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等6 - 631. 用于估计总体某一参数的随机变量n n如样本均值,样本比例、样本中位数等如样本均值,样本比例、样本中位数等n n例如例如: : 样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量n n如果样本
42、均值如果样本均值 x x = 3 = 3 ,则,则 3 3 就是就是 的的估计值估计值2.理论基础是抽样分布估计量估计量 (概念要点)(概念要点)二战中的点估计二战中的点估计二战中的点估计二战中的点估计6 - 64估计量的优良性准则估计量的优良性准则(无偏性)(无偏性)无偏性:无偏性:无偏性:无偏性:估计量的数学期望等于被估计的总体估计量的数学期望等于被估计的总体 参数参数P P( ( X X ) )X XC CA A 无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏6 - 65估计量的优良性准则估计量的优良性准则(有效性)(有效性)AB 中位数的抽样分布中位数的抽样分布中位数的抽样分布中位数
43、的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布X XP P( (X X ) )有效性:有效性:有效性:有效性:一个方差较小的无偏估计量称为一个更一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量,样本均值是一个更有效的估计量6 - 66估计量的优良性准则估计量的优良性准则(一致性)(一致性)一致性:一致性:一致性:一致性:随着样本容量的增大,估计量越来越接随着样本容量的增大,估计量越来越接 近被估计的总体参数近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大
44、的样本容量较大的样本容量较大的样本容量较大的样本容量 P P( (X X ) )X X6 - 67区间估计区间估计6 - 68区间估计区间估计(概念要点)(概念要点)1.1.根据一个样本的观察值给出总体参数的估计范围根据一个样本的观察值给出总体参数的估计范围2.给出总体参数落在这一区间的概率给出总体参数落在这一区间的概率3.例如例如: : 总体均值落在总体均值落在50705070之间,置信度为之间,置信度为 95%95%样本统计量样本统计量样本统计量样本统计量 ( (点估计点估计点估计点估计) )置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限6
45、 - 69置信区间估计置信区间估计(内容)(内容) 2 2 已知已知 2 2未知未知 均均 值值方方 差差比比 例例置置 信信 区区 间间6 - 70落在总体均值某一区间内的样本落在总体均值某一区间内的样本 x_XX = Z x95% 95% 的样本的样本的样本的样本 -1.96 -1.96 x x +1.96+1.96 x x99% 99% 的样本的样本的样本的样本 - 2.58- 2.58 x x + 2.58+ 2.58x x90%90%的样本的样本的样本的样本 -1.65 -1.65 x x +1.65+1.65 x x6 - 711.总体未知参数落在区间内的概率2.表示为 (1 -
46、n n 为显著性水平,是总体参数为显著性水平,是总体参数未在未在区间内区间内的概率的概率 3.常用的显著性水平值有 99%, 95%, 90%n n相应的相应的相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平 6 - 72区间与置信水平区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1 - (1 - ) % ) % 区间包含了区间包含了区间包含了区间包含了 % % 的区间未包含的区间未包含的区间未包含的区间未包含 1 - 1 - / /2 2 / /2 26 - 73影响区间宽度的因素影响区间宽度的因素1. 数据的离散程度,用来测
47、度2.样本容量,3.3.置信水平 (1 - ),影响 Z 的大小6 - 74第三节第三节 总体均值和总体比例总体均值和总体比例 的区间估计的区间估计一一. 总体均值的区间估计总体均值的区间估计二二. 总体比例的区间估计总体比例的区间估计三三.样本容量的确定样本容量的确定6 - 75总体均值的区间估计总体均值的区间估计 ( 已知已知)6 - 76总体均值的置信区间总体均值的置信区间 ( 已知已知)1.1.假定条件假定条件n n总体服从正态分布总体服从正态分布, ,且总体方差(且总体方差( )已知已知n n如果不是正态分布,可以由正态分布来近似如果不是正态分布,可以由正态分布来近似 ( (n n
48、30) 30)2.使用正态分布统计量使用正态分布统计量3.总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为6 - 77总体均值的区间估计总体均值的区间估计(正态总体:实例)(正态总体:实例)解解解解:已已知知 N N( ( ,0.150.152 2) ), x x2.14, 2.14, n n=9, =9, 1-1- = 0.95 = 0.95, /2/2=1.96=1.96 总体均值总体均值 的置信区间为的置信区间为我我们们可可以以9595的的概概率率保保证证该该种种零零件件的的平平均长度在均长度在21.30221.30221.498 mm21.498 mm之间之
49、间【例例例例】某某种种零零件件长长度度服服从从正正态态分分布布,从从该该批批产产品品中中随随机机抽抽取取件件,测测得得其其平平均均长长度度为为21.421.4 mmmm。已已知知总总体体标标准准差差 =0=0. .1515mmmm,试试建建立立该该种种零零件件平平均均长长度度的的置置信信区区间间,给给定定置置信信水水平平为为0.950.95。6 - 78总体均值的区间估计总体均值的区间估计(非正态总体:实例)(非正态总体:实例)解解解解:已已知知 x x26, 26, =6=6,n n=100, =100, 1-1- = = 0.950.95, /2/2=1.96=1.96我我们们可可以以95
50、95的的概概率率保保证证平平均均每每天天参参加加锻锻炼炼的的时时间间在在24.82424.82427.176 27.176 分钟之间分钟之间【例例例例】某某大大学学从从该该校校学学生生中中随随机机抽抽取取100100人人 , 调调 查查 到到 他他们们平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间为为2626分分钟钟。试试以以9595的的置置信信水水平平估估计计该该大大学学全全体体学学生生平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间(已已知知总总体体方方差为差为3636小时)。小时)。6 - 79总体均值的区间估计总体均值的区间估计 ( 未知未知)6 - 80总体均值的置信区间总
51、体均值的置信区间 ( 未知未知)1.1.假定条件假定条件n n总体方差(总体方差( )未知未知n n总体必须服从总体必须服从正态分布正态分布正态分布正态分布2.使用使用 t t 分布统计量分布统计量3. 3. 3. 总体均值总体均值总体均值 在在在1-1-1- 置信水平下的置信水平下的置信水平下的置信区间为置信区间为置信区间为6 - 81总体均值的区间估计总体均值的区间估计(实例)(实例)解解解解:已已知知 N N( ( , 2 2) ), x x= =50, 50, s s=8=8, n n=25, =25, 1-1- = = 0.950.95,t t /2/2=2.0639=2.0639。
52、我我们们可可以以9595的的概概率率保保证证总总体体均均值值在在46.6946.6953.30 53.30 之间之间【例例例例】从从一一个个正正态态总总体体中中抽抽取取一一个个随随机机样样本本, n n = = 2525 ,其其均均值值 x x = = 5050 ,标标准准差差 s s = = 8 8。 建建立立总总体体均均值值 的的95%95%的的置置信信区区间。间。6 - 82总体比例的区间估计总体比例的区间估计6 - 83总体比例的置信区间总体比例的置信区间1.1.假定条件假定条件n n两类结果两类结果n n总体服从二项分布总体服从二项分布n n可以由正态分布来近似可以由正态分布来近似2
53、.2.使用正态分布统计量使用正态分布统计量3. 3. 3. 总体比例总体比例总体比例 的置信区间为的置信区间为的置信区间为6 - 84总体比例的置信区间总体比例的置信区间(实例)(实例)解解解解:已已知知 n n=200 =200 , 0.7 0.7 , , n n = =140140 5 5, , n n(1- )=605(1- )=605, = 0.95= 0.95, /2/2=1.96=1.96p p p p p p 我我们们可可以以9595的的概概率率保保证证该该企企业业职职工工由由于于同同管管理理人人员员不不能能融融洽洽相相处处而而离开的比例在离开的比例在63.6%76.4%63.6
54、%76.4%之间之间【例例例例】某某企企业业在在一一项项关关于于职职工工流流动动原原因因的的研研究究中中,从从该该企企业业前前职职工工的的总总体体中中随随机机选选取取了了200200人人组组成成一一个个样样本本。在在对对其其进进行行访访问问时时,有有140140人人说说他他们们离离开开该该企企业业是是由由于于同同管管理理人人员员不不能能融融洽洽相相处处。试试对对由由于于这这种种原原因因而而离离开开该该企企业业的的人人员员的的真真正正比比例例构构造造95%95%的置信区间。的置信区间。6 - 85样本容量的确定样本容量的确定6 - 861.根据均值区间估计公式可得样本容量n为估计总体均值时样本容
55、量的确定估计总体均值时样本容量的确定 2.样本容量n与总体方差2、允许误差、可靠性系数Z之间的关系为 与总体方差成正比与总体方差成正比 与允许误差成反比与允许误差成反比 与可靠性系数成正比与可靠性系数成正比其中:其中:6 - 87样本容量的确定样本容量的确定(实例)(实例)解解解解 : :已已 知知 2 2=1800000=1800000, =0.05=0.05, Z Z /2/2=1.96=1.96, =500=500 应抽取的样本容量应抽取的样本容量为为【例例例例】一一家家广广告告公公想想估估计计某某类类商商店店去去年年所所花花的的平平均均广广告告费费用用有有多多少少。经经验验表表明明,总
56、总体体方方差差约约为为 18000001800000元元 。 如如置置信信度度取取95%95%,并并要要使使估估计计处处在在总总体体平平均均值值附附近近500500元元的的范范围围内内,这这家家广广告告公公司司应应抽抽多多大大的的样样本?本?6 - 881.根据比例区间估计公式可得样本容量根据比例区间估计公式可得样本容量n n为为估计总体比例时样本容量的确定估计总体比例时样本容量的确定 2.若总体比例若总体比例P P未知时,可用样本比例未知时,可用样本比例 来代替来代替 p p 其中:其中:6 - 89样本容量的确定样本容量的确定(实例)(实例)【例例例例】一一家家市市场场调调研研公公司司想想
57、估估计计某某地地区区有有彩彩色色电电视视机机的的家家庭庭所所占占的的比比例例。该该公公司司希希望望对对比比例例p p的的估估计计 误误 差差 不不 超超 过过0.050.05,要要求求的的可可靠靠程程度度为为95%95%,应应抽抽多多大大容容量量的的样样本本(没没有有可可利利用的用的p p估计值)。估计值)。解解解解: : 已已知知 =0.05=0.05, =0.05=0.05,Z Z /2/2=1.96=1.96,当当p p未知时用最大方差未知时用最大方差0.250.25代替代替 应抽取的样本容量应抽取的样本容量应抽取的样本容量为为为6 - 90第四节第四节 两个总体均值及两个两个总体均值及
58、两个 总体比例之差估计总体比例之差估计一一. 两个总体均值之差估计两个总体均值之差估计二二. 两个总体比例之差估计两个总体比例之差估计6 - 91两个总体均值之差的估计两个总体均值之差的估计6 - 92两个样本均值之差的抽样分布两个样本均值之差的抽样分布 m m m m1 1 1 1总体总体1 2 2m m m m2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2m m m m1-1-1-1-m m m m2 22 2抽样分布
59、抽样分布抽样分布抽样分布6 - 93两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2 已知已知)1.1.假定条件假定条件 两个样本是独立的随机样本两个样本是独立的随机样本 两个两个总体都服从正态分布总体都服从正态分布 若不是正态分布若不是正态分布, , 可以用正态分布来近似可以用正态分布来近似( (n n1 1 3030和和n n2 2 30)30)2.2.两两个个独独立立样样本本均均值值之之差差的的抽抽样样分分布布服服从从正正态态分分布布,其其期期望望值为值为其标准误差为其标准误差为6 - 94两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2
60、 22 2 已知已知)4.4.两个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信水平下的置信区间为置信区间为3.使用正态分布统计量Z6 - 95两个总体均值之差的估计两个总体均值之差的估计(实例)(实例)【例例例例】一一个个银银行行负负责责人人想想知知道道储储户户存存入入两两家家银银行行的的钱钱数数。他他从从两两家家银银行行各各抽抽取取了了一一个个由由2525个个储储户户组组成成的的随随机机样样本本,样样本本均均值值如如下下:银银行行A A:45004500元元;银银行行B:B:32503250元元。设设已已知知两两个个总总体体服服从从方方差差分分别别为为 A
61、 A2 2=2500=2500和和 B B2 2=3600=3600的的正正态态分分布布。试试求求 A A- - B B的区间估计的区间估计(1 1)置信度为)置信度为95%95%(2 2)置信度为)置信度为99%99%BA6 - 96两个总体均值之差的估计两个总体均值之差的估计(计算结果)(计算结果)解解解解: :已知已知 X XA A N N( ( A A,2500),2500) X XB B N N( ( B B,3600),3600) x xA A=4500=4500, x xB B=3250=3250, A A2 2 =2500 =2500 B B2 2 =3600 =3600 n
62、nA A= = n nB B =25=25(1)(1) A A- - B B置信度为置信度为95%95%的置信区间为的置信区间为(2)(2) A A- - B B置信度为置信度为99%99%的置信区间为的置信区间为6 - 97两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2未知,但相等未知,但相等)1.假定条件假定条件n n两个两个总体都服从正态分布总体都服从正态分布n n 1 12 2、 1 12 2未知,但未知,但 1 12 2 1 12 22.总体方差总体方差 2 2的联合估计量为的联合估计量为3.估计量估计量 x x1 1- - x x2 2的标准差为的标
63、准差为6 - 98两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2未知,但相等未知,但相等)使用使用 t t 分布统计量分布统计量两个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信置信水平下的置信 区间为区间为6 - 99两个总体均值之差的估计两个总体均值之差的估计(实例)(实例)【例例例例】为为比比较较两两位位银银行行职职员员为为新新顾顾客客办办理理个个人人结结算算账账目目的的平平均均时时间间长长度度,分分别别给给两两位位职职员员随随机机安安排排了了1010位位顾顾客客,并并记记录录下下为为每每位位顾顾客客办办理理账账单单所所需
64、需的的时时间间(单单位位:分分钟钟),相相应应的的样样本本均均值值和和方方差差分分别别为为: x x1 1= =22.222.2,s s1 12 2=16.63=16.63, x x2 2= =28.528.5,s s2 22 2=18.92=18.92。假假定定每每位位职职员员办办理理账账单单所所需需时时间间均均服服从从正正态态分分布布,且且方方差差相相等等。试试求求两两位位职职员员办办理理账账单单的的服服务务时时间间之之差差的的95%95%的区间估计。的区间估计。2 21 16 - 100两个总体均值之差的估计两个总体均值之差的估计(计算结果)(计算结果)解解解解: :已知已知 X X1
65、1 N N( ( 1 1, , 2 2) ) X X2 2 N N( ( 2 2, , 2 2) ) x x1 1=22.2=22.2, x x2 2=28.5=28.5, s s1 12 2=16.63=16.63 s s2 22 2=18.92=18.92 n n1 1= = n n2 2=10=10 1 12 2= = 1 12 2 1 1- - 2 2置信度为置信度为95%95%的置信区间为的置信区间为6 - 101两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2 、 2 22 2未知,且不相等未知,且不相等)1.假定条件 两个两个总体都服从正态分布总体都服从正态分布 1
66、 12 2、 1 12 2未知,且未知,且 1 12 2 1 12 22.使用的统计量为自由度自由度6 - 102两个总体均值之差的估计两个总体均值之差的估计 ( 1 12 2、 2 22 2未知,且不相等未知,且不相等) 两个总体均值之差1-2在1- 置信水平下的置信区间为6 - 103两个总体均值之差的估计两个总体均值之差的估计(续前例)(续前例)【例例例例】为为比比较较两两位位银银行行职职员员为为新新顾顾客客办办理理个个人人结结算算账账目目的的平平均均时时间间长长度度,分分别别给给两两位位职职员员随随机机安安排排了了1010位位顾顾客客,并并记记录录下下了了为为每每位位顾顾客客办办理理账
67、账单单所所需需的的时时间间(单单位位:分分钟钟),相相应应的的样样本本均均值值和和方方差差分分别别为为: x x1 1= =22.222.2,s s1 12 2=16.63=16.63, x x2 2= =28.528.5,s s2 22 2=18.92=18.92。假假定定每每位位职职员员办办理理账账单单所所需需时时间间均均服服从从正正态态分分布布,但但方方方方差差差差不不不不相相相相等等等等。试试求求两两位位职职员员办办理理账账单单的的服服务务时时间间之之差差的的95%95%的区间估计。的区间估计。1 12 26 - 104两个总体均值之差的估计两个总体均值之差的估计(计算结果)(计算结果
68、) 自由度自由度 f f 为为 1 1- - 2 2置信度为置信度为95%95%的置信区间为的置信区间为解解解解: :已知已知 X X1 1 N N( ( 1 1, , 2 2) ) X X2 2 N N( ( 2 2, , 2 2) ) x x1 1=22.2=22.2, x x2 2=28.5=28.5, s s1 12 2=16.63=16.63 s s2 22 2=18.92=18.92 n n1 1= = n n2 2=10=10 1 12 21 12 26 - 105两个总体比例之差的估计两个总体比例之差的估计6 - 1061. 假定条件 两个总体是独立的两个总体是独立的 两个两个
69、总体服从二项分布总体服从二项分布 可以用正态分布来近似可以用正态分布来近似2. 两个总体比例之差P1-P2在1-置信水平下的置信区间为两个总体比例之差的区间估计两个总体比例之差的区间估计6 - 107两个总体比例之差的估计两个总体比例之差的估计(实例)(实例)【例例例例】某某饮饮料料公公司司对对其其所所做做的的报报纸纸广广告告在在两两个个城城市市的的效效果果进进行行了了比比较较,它它们们从从两两个个城城 市市 中中 分分 别别 随随 机机 地地 调调 查查 了了10001000个个成成年年人人,其其中中看看过过广广告告 的的 比比 例例 分分 别别 为为 p p1 1=0.18=0.18和和p
70、 p2 2=0.14=0.14。试试求求两两城城市市成成年年人人中中看看过过广广告告的的比比例例之之差差的的95%95%的置信区间。的置信区间。 绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品6 - 108两个总体比例之差的估计两个总体比例之差的估计(计算结果)(计算结果)P P1 1- - P P2 2置信度为置信度为95%95%的置信区间为的置信区间为解解解解: :已知已知 p p1 1=0.18=0.18, p p2 2=0.14=0.14,1-1- =0.95=0.95, n n1 1= = n n2 2=1000=1000 我我们们有有95%95%的的把把握握估估计计两两城城市市成
71、成年年人人中中看看过过该该广广告的比例之差在告的比例之差在0.79% 7.21%0.79% 7.21%之间之间6 - 109第五节第五节 正态总体方差及两正正态总体方差及两正 态总体方差比的估计态总体方差比的估计一一. 正态总体方差的区间估计正态总体方差的区间估计二二. 两个正态总体方差比的区间估计两个正态总体方差比的区间估计6 - 110正态总体方差的区间估计正态总体方差的区间估计6 - 111正态总体方差的区间估计正态总体方差的区间估计(要点)(要点)1. 估计一个总体的方差或标准差2. 假设总体服从正态分布3.总体方差 2 2 的点估计量为S2 2,且4. 总体方差在1-置信水平下的置信
72、区间为6 - 112正态总体方差的区间估计正态总体方差的区间估计(实例)(实例)【例例】对某种金属的10个样品组成的一个随机样本作抗拉强度试验。从实验数据算出的方差为4。试求2的95%的置信区间。6 - 113正态总体方差的区间估计正态总体方差的区间估计(计算结果)(计算结果)解解:已知n10,s2 4,1-95% 2置信度为95%的置信区间为6 - 114两个正态总体方差比的区间估计两个正态总体方差比的区间估计6 - 115两个正态总体方差比的区间估计两个正态总体方差比的区间估计(要点)(要点)1.1.比较两个总体的方差比比较两个总体的方差比2.用两个样本的方差比来判断用两个样本的方差比来判
73、断 如果如果S S1 12 2/ / S S2 22 2接近于接近于1 1, ,说明两个总体方差很接近说明两个总体方差很接近 如果如果S S1 12 2/ / S S2 22 2远离远离1 1, ,说明两个总体方差之间存在差异说明两个总体方差之间存在差异3.总体方差比在总体方差比在1-1- 置信水平下的置信区间为置信水平下的置信区间为6 - 116两个正态总体方差比的区间估计两个正态总体方差比的区间估计(实例)(实例)【例例例例】用用某某一一特特定定工工序序生生产产的的一一批批化化工工产产品品中中的的杂杂质质含含量量的的变变异异依依赖赖于于操操作作过过程程中中处处理理的的时时间间长长度度。某某
74、生生产产商商拥拥有有两两条条生生产产线线,为为了了降降低低产产品品中中杂杂质质平平均均数数量量的的同同时时降降低低杂杂质质的的变变异异,对对两两条条生生产产线线进进行行了了很很小小的的调调整整,研研究究这这种种调调整整是是否否确确能能达达到到目目的的。为为此此从从两两条条生生产产线线生生产产的的两两批批产产品品中中各各随随机机抽抽取取了了2525个样品,它们的均值和方差为个样品,它们的均值和方差为 x x1 1=3.2 =3.2 ,S S1 12 2 =1.04=1.04 x x2 2=3.0 =3.0 , S S2 22 2 =0.51=0.51试确定两总体方差比试确定两总体方差比 1 12
75、 2/ / 1 12 2的的90%90%的置信区间。的置信区间。6 - 117两个正态总体方差比的区间估计两个正态总体方差比的区间估计(计算结果)(计算结果)解解解解: :已知已知 x x1 1=3.2=3.2,S S1 12 2 =1.04=1.04 x x2 2=3.0=3.0,S S2 22 2 =0.51=0.51 F F1-1- /2 /2 (24, 24)(24, 24) = =F F0.95 0.95 =1.98=1.98 F F /2 /2 (24, 24)(24, 24) = =F F0.050.05=0.51=0.51 1 12 2/ / 2 22 2置置信信度度为为90%90%的的置置信信区间为区间为6 - 118本章小结本章小结1. 抽样的有关概念抽样的有关概念2.抽样分布抽样分布3.点估计和区间估计的有关概念点估计和区间估计的有关概念4. 确定样本容量确定样本容量5. 区间估计区间估计结结 束束