概率分布及总体平均数的推断

上传人:枫** 文档编号:586567988 上传时间:2024-09-05 格式:PPT 页数:61 大小:813.53KB
返回 下载 相关 举报
概率分布及总体平均数的推断_第1页
第1页 / 共61页
概率分布及总体平均数的推断_第2页
第2页 / 共61页
概率分布及总体平均数的推断_第3页
第3页 / 共61页
概率分布及总体平均数的推断_第4页
第4页 / 共61页
概率分布及总体平均数的推断_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《概率分布及总体平均数的推断》由会员分享,可在线阅读,更多相关《概率分布及总体平均数的推断(61页珍藏版)》请在金锄头文库上搜索。

1、p理解抽样分布的意义理解抽样分布的意义p了解抽样分布的形成过程了解抽样分布的形成过程p平均数抽样分布的定理平均数抽样分布的定理p样本平均数与总体平均数离差统计量的形态样本平均数与总体平均数离差统计量的形态p总体平均数的估计总体平均数的估计p假设检验的基本原理假设检验的基本原理p总体平均数的显著性检验总体平均数的显著性检验第六章第六章 抽样分布及总体平均数的推断抽样分布及总体平均数的推断一、分布的类型一、分布的类型o总体分布:总体内个体数值的频数分布。o样本分布:样本内个体数值的频数分布。o抽样分布:某一样本统计量的概率分布。频率分布与概率分布的区别频率分布与概率分布的区别经验分布:经验分布:频

2、率分布是经频率分布是经资料整理而来资料整理而来;频率分布随样频率分布随样本不同而不同本不同而不同;频率分布有对频率分布有对应的频数分布。应的频数分布。理论分布:理论分布:概率分布是先概率分布是先验的;概率分验的;概率分布是唯一的;布是唯一的;概率分布无频概率分布无频率分布所对应率分布所对应的频数分布。的频数分布。p样本统计量的概率分布,是一种理论分布 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。 p结果来自容量相同容量相同的所有所有可能样本p提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据二、抽样分布二、抽样分布(sampling

3、 distribution)抽抽样分布的形成分布的形成过程程总体总体计算样本统计计算样本统计计算样本统计计算样本统计量量量量如:样本均值、如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差比例、方差样样本本1. 概念概念p在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布p一种理论概率分布p推断总体均值的理论基础三、三、样本均本均值的抽的抽样分布分布例例题分析分析例例例例:设设一一个个总总体体,含含有有4 4个个元元素素( (个个体体) ) ,即即总总体体单单位位数数N N=4=4。4 4 个个个个体体分分别别为为x x1 1=1=1,x x2 2=2

4、=2,x x3 3=3=3,x x4 4=4 =4 。总体的均值、方差及分布如下。总体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差 现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能

5、的n = 2 的样本(共的样本(共16个)个) 计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值值的抽样分布的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P ( ( x x ) )1.51.53.03.04.04.03.53.52.02.02.52.5 = 2.5 2 =1

6、.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P ( ( x x ) )1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x2. 中心极限定理中心极限定理 = 50= 50= 50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n = 4 = 4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n =16 =16p 当当总总体体服服从从正正态态分分布布N N( ( , , 2 2) )时时,来来自自该该总总体

7、体的的所所有有容容量量为为n n的的样样本本的的均均值值 x x也也服服从从正正态态分分布布, x x 的的数数学学期望为期望为 ,方差为,方差为 2 2/ /n n。即。即 x xN N( ( , , 2 2/ /n n) )当样本容量足当样本容量足够大时够大时( (n n 30) 30) ,样本均值的,样本均值的抽样分布逐渐抽样分布逐渐趋于正态分布趋于正态分布中中中中心心心心极极极极限限限限定定定定理理理理:设设从从均均值值为为 ,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样分布近似服从均

8、值为样分布近似服从均值为 、方差为、方差为 2 2/ /n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体x x3. 抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布非正态分布非正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布非正态分布非正态分布非正态分布非正态分布p样本均值的数学期望p样本均值的方差n重复抽样n不重复抽样4. 4. 样本均值抽样分布的数学期望与方差

9、样本均值抽样分布的数学期望与方差样本均值抽样分布的数学期望与方差样本均值抽样分布的数学期望与方差比较及结论:比较及结论:比较及结论:比较及结论:1. 1. 样本均值的均值样本均值的均值( (数学期望数学期望) ) 等于总体均值等于总体均值 2. 2. 样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n例题例题o假设有一所大学声称它近期的毕业生所挣的平均年收入为30000元。我们有理由对这个声称的真实性提出质疑,从而决定通过一个最近两年毕业的校友的随机样本来检验它。在这个过程中,我们得到的样本均值只有28200元。我们现在要问:如果实际的总体均值真的为30000元,我们有多大

10、的可能性获得一个均值小于或等于28200元的样本呢?这所大学的说法是真的吗?(假设抽样分布的标准差为800元)5. 标准误标准误 (standard error) 1.样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差,也称抽样标准差。2.标准误衡量的是统计量的离散程度,它测度了用样本统计量估计总体参数的精确程度。3.以样本均值的抽样分布为例,在重复抽样条件下,样本均值的标准误为 4. 标准差的英文为:standard deviation6. 总体标准差总体标准差的无偏估计量的无偏估计量p 总体标准差在一般情况下是未知的,它需要用样本标准差 来估计。7. 平均数标准误的估计值平均

11、数标准误的估计值1.当计算标准误时涉及的总体参数未知时,用估计量S来代替,于是在重复抽样条件下,样本平均数标准误 的估计值为练习练习o1、标准化的智商测验的总体均值为100,总体标准差为15.如果抽取一个规模为10的样本,求样本均值的标准误 。o2、假设一个呈正态分布的标准化成就测验的总体标准差为7.2。如果我们抽取一个16个成绩的样本,样本均值的标准误 是多少?练习练习o3、下面的样本是30名被调查者在一个七点式量表的得分,用来测量对一个极端组织是否应该被允许举行游行(1=强烈反对,7=强烈赞成)的态度,请估计其均值的标准误 ?o3 5 1 4 3 3 6 6 2 3 3 1 1 2 2 1

12、 5 2 1 3 4 3 1 4 5 2 2 3 3 4练习练习o3、下面的样本是30名被调查者在一个七点式量表的得分,用来测量对一个极端组织是否应该被允许举行游行(1=强烈反对,7=强烈赞成)的态度,请估计其均值的标准误 ?o3 5 1 4 3 3 6 6 2 3 3 1 1 2 2 1 5 2 1 3 4 3 1 4 5 2 2 3 3 48. 样本平均数与总体平均数离差统计量的形态样本平均数与总体平均数离差统计量的形态o当总体标准差已知时,一切可能样本平均数与总体平均数的离差统计量呈标准正态分布。8. 样本平均数与总体平均数离差统计量的形态样本平均数与总体平均数离差统计量的形态o当总体标

13、准差未知时,一切可能样本平均数与总体平均数的离差统计量用t表示,呈t分布。1 定义:由小样本统计量形成的概率分布。 2 t分布的特点o t分布是对称分布。平均数位于曲线中央,在这一点上有一个单峰,从中央向两侧逐渐下降,尾部无限延长,但不与基线相交。o 分布曲线的形状易变,曲线不是一条而是一族,其曲线形状随着样本容量即随自由度的大小而有规律地变动。t分布分布t分布分布o当n时,分布曲线以标准正态曲线为极限,即呈正态分布。通常把自由度较大的t分布当作正态分布来处理。当n逐渐减少时,分布的离散程度逐渐增大,曲线逐渐与标准正态分离;其峰顶逐渐下降,尾部抬高。ot分布的值及对应的概率值(p)是根据自由度

14、的大小由理论模型推导出来的,构成t分布临界值。 ot分布的自由度df=n1。标准正态分布与t分布图图图 标准正态分布与标准正态分布与t t分布分布t分布表中的概率图图 df=20df=20时时t t分布的双侧概率分布的双侧概率 四、参数估计四、参数估计参数估计在统计方法中的地位定义 当总体参数不清楚时,用一个特定值(一般常用样本统计量)进行估计,这类问题就是点估计。统计量为数轴上某一点值,所以称为点估计。n例如:用样本均值直接作为总体均值的估计n例如:用两个样本均值之差直接作为总体均值之差的估计(一)点估计(一)点估计 (1)无偏性。指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有

15、的偏小,而偏差的平均数为0,这时,这个统计量就是无偏估计量。如果用某个统计量估计总体的误差平均数大于0或小于0,这个统计量就是有偏统计量。总体参数的良好估计值,应具备无偏性。 (2)一致性。所谓一致性是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。 (3)有效性。是指当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。 标准标准 缺点:没有给出估计值接近总体参数程度的信息。(二)区间估计(二)区间估计 区间估计是用数轴上的一段距离表示未知参数可能落入的范围,它虽不具体指出总体参数等于什么,但能指出总体的未知参数落入某一区间的概率有多大。 根据样

16、本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。n比如,某班级平均分数在7585之间,置信水平是.95样本统计量样本统计量样本统计量样本统计量 ( (点估计点估计点估计点估计) )置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限1.由样本统计量所构造的总体参数的估计区间称为置信区间;2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间; 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值;n我们只能是希望这个区间是大量包含总体参数真值的区间中

17、的一个,但它也可能是少数几个不包含参数真值的区间中的一个。相关概念:置信区间相关概念:置信区间置信区间 (95%的置信区间)重复构造出重复构造出重复构造出重复构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 点估计值点估计值点估计值点估计值 统计分析中一般规定:正确估计的概率,也即置置信信水水平平 为.95或.99,那么显显著著性性水水平平 则为.05或.01,这是依据.05或.01属于小概率事件,而小概率事件在一次抽样中是不可能出现的原理规定的。 置信度:又称显著性水平,意义阶段,信任系数等,是指估计总体参数落在某一区间时,可能犯错误的概率,用符号表示。(0.05Z*、0.0

18、1 Z* 、0.001 Z* ) 置信区间:或称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。相关概念:置信水平、置信度、置信区间相关概念:置信水平、置信度、置信区间区间估计的具体步骤区间估计的具体步骤 确定样本平均数的分布形态Z或T; 计算样本分布的标准误; 查表确定置信度; 计算一定置信度前提下的置信区间o假定条件n总体服从正态分布n如果不是正态分布,可由正态分布来近似 (n30)2.使用正态分布统计量 zp总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为(三)总体均值的区间估计(三)总体均值的区间估计1. 总体方差已知条件下的总体平均数的区间

19、估计练习:练习: 有一个49名学生的班级,某学科历年考试成绩的=5,又知今年某次考试成绩是85分,试推论该班某学科学习的真实成绩分数。 2. 总体方差未知条件下总体平均数的区间估计总体方差未知条件下总体平均数的区间估计o假定条件n总体服从正态分布,且方差() 未知n小样本 (n 30)p使用正态分布统计量pp总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为【例例例例】一一家家保保险险公公司司收收集集到到由由3636投投保保个个人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄( (周周岁岁) )数数据据如如下下表表。试建立投保人年龄试建立投保

20、人年龄90%90%的置信区间的置信区间 36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532解解解解:已已知知n n=36, =36, 1-1- = = 90%90%,z z /2/2=1.645=1.645。根根据据样样本本数数据据计算得:计算得: 总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁总体分布总体分布样本容量样本容量已知已

21、知未知未知正态分布正态分布大样本大样本小样本小样本非正态分布非正态分布大样本大样本总体分布为非正态时,若n30,不能用概率对其样本分布进行推论。1、某班49人期末考试成绩为85分,标准差为6,假设此项考试能反映学生的学习水平,试推论该班学生学习的真实成绩分数。(=0.05) 2、一位研究吸烟的人员想知道吸烟者第一次吸烟的平均年龄。通过对25名吸烟者的随机样本的调查,其得出的样本均值为16.8岁,标准差为1.5岁。请计算开始吸烟的平均年龄的95%的置信区间。练习练习练习练习3、一位教育研究人员想要估计一所大学里的学生在入学第一年里所交朋友的平均数量。通过随机调查50名完成了第一年学业的学生,得到

22、样本均值为3,标准差为1.在95%的置信水平下估计这所大学学生在第一年交朋友数的均值。作业作业1、一所大学的本科教育主管想要估计教师所需要的平均数本书。他随机抽取了26门课程的任课教师,发现样本均值为2.8本,标准差为0.4。通过95%的置信区间来估计大学教师所指定的平均数本书。2、下面的样本是30名被调查者在一个七点式量表的得分,用来测量对一个极端组织是否应该被允许举行游行(1=强烈反对,7=强烈赞成)的态度。请分别计算95%和99%的置信区间? 3 5 1 4 3 3 6 6 2 3 3 1 1 2 2 1 5 2 1 3 4 3 1 4 5 2 2 3 3 4总体比率的区间估计总体比率的

23、区间估计o比率的抽样分布比率的抽样分布 在实际调研中,我们经常会遇到一系列的计数变量,这些变量的比较往往是就其发生频率及其所占某一总体的比率的比较。而且实际调研中,为考察某一类事件的发生频率,还可以将其所在的总体划分为事件A和事件非A两大类,这样就可以使用二分变量的比率来对之进行研究了。o二项分布的标准差为:二项分布的标准差为: o例:从男女各占例:从男女各占1/2的学校中随机抽的学校中随机抽10名学生,从名学生,从理论上说,平均应抽到男生理论上说,平均应抽到男生5人,标准差为人,标准差为1.58人。人。o比率的抽样分布的标准差为:比率的抽样分布的标准差为: o假设在一个100名大学生的随机样

24、本中有45%报告说他们赞同各种毒品的合法化。则标准误为 比率的抽样分布形态比率的抽样分布形态o同二项分布同二项分布n当n趋近于无限大时,二项分布接近于正态分布;n当p=q,不管n多大,二项分布呈对称形;n当pq,且n相当小时,图形呈偏态,pq与pq偏斜方向相反;n当pq且np5,或者pq且nq5时,二项分布近似正态分布。总体比率的区间估计总体比率的区间估计o例:假设本地的一家调查组织通过电话联系了400名本地的登记选民,询问他们倾向于投票给候选人A还是候选人B。他发现有60%倾向于候选人A。在95%的置信区间下,确定对候选人A的倾向。练习练习1、一名政治调查专家调查了一个500名登记选民的随机

25、样本,询问他们是倾向于投票给候选人A还是候选人B。他发现有54%倾向于候选人A。在95%的置信区间下,确定这位专家预测候选人A将会获胜是否公正。2、为了估计一所大学里支持在校园里全面禁酒的学生比例,因为研究人员调查了大学里的一个50名学生的随机样本。他发现样本的36%支持禁酒。在这种情况下,计算总体比例95%的置信区间。练习练习3、一家调查机构在纽约通过电话对400名随机选取的成年人进行了调查,询问他们关于对出租车司机进行随机毒品测试的态度。结果发现有38%的人赞同这个制度。计算总体比率的99%置信区间。4、一所学校想调查家长对于一项取消学生课外体育活动以削减成本的建议的态度。学校委员会采取电

26、话调查的方式,在120名被询问的家长中,74名支持这项取消体育活动的计划。计算总体比例的95%和99%置信区间。作业作业o一所学校想调查家长对于一项取消学生课外体育活动以削减成本的建议的态度。学校委员会采取电话调查的方式,在120名被询问的家长中,74名支持这项取消体育活动的计划。计算总体比例的95%和99%置信区间。附:希腊字母表附:希腊字母表 大写 小写 读音 A Alpha B Beta Gamma Delta Epsilon Zeta Nu Xi Omicron Pi Rho Sigma Theta Iota Kappa Lambada Mu Tau Upsilon Phi Chi Psi Omega Eta

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号