统计推断专项课程－金锄头文库

资源描述

《统计推断专项课程》由会员分享，可在线阅读，更多相关《统计推断专项课程（272页珍藏版）》请在金锄头文库上搜索。

1、本资料来源,统计推断,抽样与分布估计与检验方差分析回归分析时间序列列联分析,第四章抽样与抽样分布第一节常用的抽样方法,基本概念总体和样本概率抽样和非概率抽样抽样误差概率抽样的组织方式简单随机抽样分层抽样等距抽样整群抽样,（一）总体与样本,总体总体：根据研究目的确定的所要研究的同类事物的全体，是所要说明其数量特征的研究对象。总体单位/个体：构成总体的个别事物（基本单元）。总体容量：总体单位的数量。总体指标/总体参数：在抽样估计中，用来反映总体数量特征的指标。总体平均数、总体比例P、总体标准差、总体方差2 样本样本：从总体中抽取的部分总体单位所构成的整体

2、。样本容量：样本所包含的总体单位个数。在实际工作中，通常把n30的样本称为大样本，把n30的样本称为小样本。样本指标/样本统计量/估计量：根据样本资料计算的、用以估计和推断相应总体指标的综合指标。样本平均数、样本比例p、样本标准差s、样本方差s2 总体参数是唯一的，往往未知的；样本统计量是不唯一的，随着抽取的样本的不同而不尽相同。,（二）概率抽样与非概率抽样,概率抽样/随机抽样定义：按照随机原则抽取样本的抽样方法。组织方式：简单随机抽样、分层抽样、等距抽样、整群抽样特点：抽样推断必须遵循抽样调查的随机原则抽样推断是以样本指标数值去推断总体指标数值抽样推断中产生的误差可以事

3、先计算加以控制。作用：对于不可能进行全面调查的总体数量特征的推断对于某些不必要进行全面调查的总体数量特征的推断对于全面调查的资料进行评价和修正非概率抽样定义：从研究目的出发，根据调查者的经验或判断，从总体中有意识地抽取若干单位构成样本的抽样方法。组织方式：典型调查、重点调查、配额抽样、方便抽样等,（三）抽样误差,登记性误差：在调查和汇总过程中由于观察、测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差。代表性误差：用样本指标推断总体指标时，由于样本结构与总体结构不一致、样本不能完全代表总体而产生的误差。系统误差：由于非随机因素引起的样本代表性不足而产生的误差。随

4、机误差/偶然性误差：由于随机因素（偶然性因素）引起的代表性误差。抽样估计中的抽样误差，即这种误差。,二、概率抽样的组织方式,简单随机抽样/纯随机抽样在从总体抽取n个单位作为样本时，要使得每个总体单位都有相同的机会被抽中的抽样方式。重复抽样和不重复抽样分层抽样/分类抽样在抽样之前先将总体的单位划分为若干层（类），然后从各个层中抽取一定数量的单位组成一个样本，这样的抽样方式称为分层抽样。在分层或分类时，应使层内各单位的差异尽可能小，而使层与层之间的差异尽可能大。等距抽样/系统抽样/机械抽样在抽样中，先将总体各单位按某种顺序排列，并按某种规则确定一个随机起点，然后，每个一定的间隔抽取

5、一个单位，直至抽取n个单位形成一个样本。样本在总体中的分布一般较均匀。整群抽样调查时先将总体划分成若干群，然后在以群作为调查单位从中抽取部分群，进而对抽中的各个群中所包含的所有个体单位进行调查或观察，这样的抽样方式称为整群抽样。群内结构特征与总体越接近，抽样推断效果越好。,第二节抽样分布,一、抽样分布的概念由样本统计量的全部可能取值和与之相应的概率（频率）组成的分配数列。在实际应用中，统计量的抽样分布是通过教学推导或在计算机上利用程序进行模拟而得到的。,分析,总体是什么？总体均值等于多少？总体是4个学生。总计均值即4名学生的平均成绩=（1+2+3+4）/4=2.5 总体容量？

6、样本容量？样本个数？总体容量=4，样本容量=2 样本个数=42=16 计算各个样本的均值？总体均值与样本均值的区别？总体均值是唯一的，样本均值是随机的。样本均值的概率分布？,样本均值的抽样分布的特点,抽样分布的形式与原有总体的分布和样本容量n的大小有关。如果原有总体是正态分布，那么，无论样本容量的大小，样本均值的抽样分布都服从正态分布；如果原有总体分布是非正态分布，而样本容量n30，则随着样本容量的增大，样本均值的抽样分布将趋于正态分布；如果原有总体分布是非正态分布，而样本容量n30，则样本均值的抽样分布不是正态分布。,第五章参数估计第一节参数估计的一般问题,估计量与估计值抽

7、样估计/参数估计：用样本统计量估计总体参数的特征值；估计量：用来估计总体参数的统计量的名称；估计值：用来估计总体参数是计算出来的估计量的具体数值。点估计与区间估计点估计：用样本估计量的值直接作为总体参数的估计值；区间估计：在点估计的基础上，给出总体参数估计的一个范围。置信区间置信区间：在区间估计中，用样本统计量所构成的总体参数的估计区间；置信下限：置信区间的最小值；置信上限：置信区间的最大值。,评价估计量的标准无偏性：样本统计量的均值等于被估计总体参数的真值，即有效性：作为优良的估计量，除了满足无偏性外，其方差应比较小。设、都是参数的无偏估计量，若，则称是较有

8、效的估计量一致性/相合性：指当n时，估计量依概率收敛于总体参数的真实值。设是参数的估计量，对于任意的0，当n时，，则称是的一致估计量。,点估计的方法,点估计是直接以样本统计量作为相应总体参数的估计量。因此我们希望样本统计量应尽可能满足优良估计量的标准。经数学证明，样本平均数是总体平均数的优良估计量；样本成数是总体成数的优良估计量；样本方差是总体方差的无偏估计量。点估计完全正确的概率通常为0。因此，我们更多的是考虑用样本统计量去估计总体参数的范围区间估计,第二节一个总体参数的区间估计,参数区间估计的含义：估计总体参数的区间范围，并给出区间估计成立的概率值。其中： 1-(0

9、1)称为置信度/置信水平，称为区间估计的显著性水平，其取值大小由实际问题确定，经常取1%、5%和10%。,注意：对置信度的理解！,区间估计的内容：总体均值的区间估计总体成数P的区间估计总体方差2的区间估计区间估计的计算步骤计算样本指标计算抽样平均误差查表得统计量临界值计算抽样极限误差计算置信区间总体均值区间估计的要素：总体分布是否正态？总体方差是否已知？大样本还是小样本？,要素影响抽样分布,例1,某企业从长期实践得知，其产品直径x是一随机变量，服从方差为0.05的正态分布。从某日产品中随机抽取6个，测得其直径分别为14.8，15.3，15.1，15，14.7，15

10、.1（单位：厘米）。在0.95的置信度下，试求该产品直径的均值的置信区间。计算样本指标计算抽样平均误差查表得统计量计算抽样极限误差计算置信区间,解：正态总体、方差已知、小样本,计算样本指标计算抽样平均误差查表得统计量计算抽样极限误差计算置信区间,例2,对某型号的电子元件进行耐用性能检查，抽查资料分组如下表，要求估计该批电子元件的平均耐用时数的置信区间（置信度95%）。计算样本指标计算抽样平均误差查表得统计量计算抽样极限误差计算置信区间,解：正态总体、方差未知、大样本,计算样本指标计算抽样平均误差查表得统计量计算抽样极限误差计算置信区间,例3,某商场从一批袋装

11、食品中随机抽取10袋，测得每袋重量（单位：克）分别为：789、780、794、762、802、813、770、785、810、806，要求以95%的把握程度，估计这批食品的平均每袋重量的区间范围。计算样本指标计算抽样平均误差查表得统计量计算抽样极限误差计算置信区间,解：正态总体、方差未知、小样本,计算样本指标计算抽样平均误差查表得统计量计算抽样极限误差计算置信区间,总体成数的区间估计,由于总体的分布是（0，1）分布，只有在大样本的情况下，样本成数才服从正态分布。总体成数可以看成是一种特殊的平均数，类似于总体平均数的区间估计，总体成数的区间估计的上下限是：注意：在实践中，由于

12、总体成数常常未知，这时，抽样平均误差公式中的总体成数用样本成数代替。大样本的条件：np5且n(1-p) 5,例:,某厂对一批产品的质量进行抽样检验，采用重复抽样抽取样品200只，样本优质品率为85%，试计算当把握程度为90%时优质品率的区间范围。计算样本指标计算抽样平均误差查表得统计量计算抽样极限误差计算置信区间,解：,计算样本指标计算抽样平均误差查表得统计量计算抽样极限误差计算置信区间,总体方差的区间估计,大样本情况下，样本标准差s的分布近似服从正态分布N（，2/2n），所以，总体标准差的置信度为1-的置信区间近似为小样本情况下，若总体呈正态分布而其均值和方差未知，则总

13、体方差的置信区间由如下的统计量的分布确定。所以，总体方差2的置信度为1- 的置信区间为,例,从某车间加工的同类零件中抽取了16件，测得零件的平均长度为12.8厘米，方差为0.0023。假定零件的长度服从正态分布，试求方差的置信区间（置信度为95%）。,解,所以，总体方差2的置信区间为,四、抽样样本容量确定,问题的提出确定样本容量公式：,四、抽样样本容量确定,确定样本容量应注意的问题 1、计算样本容量时，一般总体的方差与成数都是未知的，可用有关资料替代：一是用历史资料已有的方差与成数代替；二是在进行正式抽样调查前进行几次试验性调查，用试验中方差的最大值代替总体方差；三是成数方差在完全缺

14、乏资料的情况下，就用成数方差的最大值0.25代替。 2、如果进行一次抽样调查，同时估计总体均值与成数，用上面的公式同时计算出两个样本容量，可取一个最大的结果，同时满足两方面的需要。 3、上面的公式计算结果如果带小数，这时样本容量不按四舍五入法则取整数，取比这个数大的最小整数代替。,例：,对某批木材进行检验，根据以往经验，木材长度的标准差为0.4米，而合格率为90%。现采用重复抽样方式，要求在95.45%的概率保证程度下，木材平均长度的极限误差不超过0.08米，抽样合格率的极限误差不超过5%，问必要的样本单位数应该是多少？,解：,样本平均数的单位数：,样本成数的单位数：,根据计算结果，取样本数较

15、大者。即n=144棵。,第六章假设检验第一节假设检验的基本问题,假设检验/显著性检验事先对总体参数或总体分布形式作出一个假设，然后利用样本信息来判断原假设是否合理，即判断样本信息与原假设是否有显著差异，从而决定应接受或否定原假设。假设检验分为两类：参数检验、非参数检验/自由分布检验假设检验的基本思想假设检验所采用的逻辑推理方法是带有概率性质的反证法。假设检验中的合理与否，所依据的是“小概率事件实际不可能发生的原理”。,第一节假设检验的基本问题,假设检验的步骤提出原假设和备择假设；选择适当的统计量，并确定其分布形式；选择显著性水平，确定临界值；作出结论假设检验的两类错

16、误第一类错误/拒真错误：当原假设为真，但由于样本的随机性使样本统计量落入了拒绝区域；第二类错误/取伪错误：当原假设为不真，但由于样本的随机性使样本统计量落入了接受区域。,第二节一个总体参数的检验,例：消费者协会接到消费者投诉，指控品牌纸包装饮料存在容量不足，有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品，测试发现平均含量为248毫升，小于250毫升。这是生产中正常的波动，还是厂商的有意行为？消费者协会能否根据该样本数据，判定饮料厂商欺骗了消费者呢？另根据历史资料，该品牌饮料容量总体的标准差是4毫升。我们通过检验总体均值是否小于250毫升，来判断饮料厂商是否欺骗了消费者。,第一步：确定原假设与备择假设,： 250；： 250,原假设H0：通常是研究者想收集证据予以反对的假设，也称为零假设,备择假设H1：通常是研究者想收集证据予以支持的假设，也称为研究假设。,原假设和备择假设是一

展开阅读全文

统计推断专项课程

最新文档