第三章第三次课-统计数的分布

上传人:鲁** 文档编号:504491157 上传时间:2022-11-19 格式:DOC 页数:8 大小:245.50KB
返回 下载 相关 举报
第三章第三次课-统计数的分布_第1页
第1页 / 共8页
第三章第三次课-统计数的分布_第2页
第2页 / 共8页
第三章第三次课-统计数的分布_第3页
第3页 / 共8页
第三章第三次课-统计数的分布_第4页
第4页 / 共8页
第三章第三次课-统计数的分布_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《第三章第三次课-统计数的分布》由会员分享,可在线阅读,更多相关《第三章第三次课-统计数的分布(8页珍藏版)》请在金锄头文库上搜索。

1、第三节 统计数的分布研究总体与从总体中抽取样本之间的关系:1:总体-样本,了解从总体中抽取样本的变异特点即抽样分布也称统计数的分布;2样本-总体,要根据样本统计数去推断总体即统计推断问题.一、抽样试验与无偏估计根据样本对总体做出估计和推断,并不是直接用样本本身,而是用样本的统计量来对总体做出估计和判断。但由于从总体中抽取的样本提供的信息仅是总体的一部分,因此它不能提供完全准确的信息,必然存在着一定的误差。即,对于样本容量相同的多次随机抽样,得到样本函数的观察值也是不同的,且其取值有一定的概率,即统计量也是一个随机变量,因而也有它的分布,称为抽样分布(sampling distribution)

2、。现有一N=3的近似正态总体,具有变量3,4,5,可以求出=4, 20.6667, 0.8165。现以n=2作独立的有放回式抽样。总共可得到Nn329个样本样本编号 样本值 x s2 s 1 3,3 3.0 0.0 0.0000 2 3,4 3.5 0.5 0.7071 3 3,5 4.0 2.0 1.4142 4 4,3 3.5 0.5 0.7071 5 4,4 4.0 0.0 0.0000 6 4,5 4.5 0.5 0.7071 7 5,3 4.0 2.0 1.4142 8 5,4 4.5 0.5 0.7071 9 5,5 5.0 0.0 0.0000 36.0 6.0 5.6568 平

3、均 4.0 0.6667 0.6258如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。1样本平均数是总体平均数的无偏估计值。2样本方差是总体方差的无偏估计值。3样本标准差s不是总体标准差的无偏估计值。二、样本平均数的分布由于从总体中抽出的样本为每一个可能样本,且每个样本中的变量均为随机变量,所以其样本平均数也为随机变量,也形成一定的理论分布,这种理论分布称为样本平均数的概率分布,或称样本平均数的分布。样本平均数的平均数:样本平均数的方差:对N=3(3,4,5),n=2抽样试验所得的9个样本平均数,整理成次数分布表。x f f x f x 23.0

4、 1 3 9.03.5 2 7 24.54.0 3 12 48.04.5 2 9 40.5 5.0 1 5 25.0 9 36 147.0 如果对这个N=3(3,4,5) 所组成的总体,再进行n=4的抽样试验,则可得81个样本平均数,将其整理成次数分布表。x f f x f x 23.00 1 3 9.003.25 4 13 42.253.50 10 35 122.503.75 16 60 225.004.00 19 76 304.004.25 16 68 289.004.50 10 45 202.504.75 4 19 90.255.00 1 5 25.00 81 324 1309.50(1

5、)样本平均数分布的平均数总体平均数。(2)样本平均数分布的方差总体方差除以样本容量。样本平均数的标准误差(标准误)标准误反映了样本平均数 x 的抽样误差,即精确性的高低。标准误大,各样本平均数间差异程度大,样本平均数的精确性低。标准误小,各样本平均数间差异程度小,样本平均数的精确性高。标准误的大小与原总体的标准差 成正比,与样本含量n的平方根成反比。从某特定总体抽样,因为是一定值,所以只有增大样本容量,才能降低样本平均数的抽样误差。(3)如果从正态分布总体N(,2)进行抽样,其样本平均数x是一具有平均数 ,方差2/n的正态分布,记作N(,2/n)。(4)如果被抽总体不是正态分布总体,但具有平均

6、数和方差2 ,当随样本容量n的不断增大,样本平均数 x 的分布也越来越接近正态分布,且具有平均数,方差2 /n ,这被称为中心极限定理不论总体为何种分布,只要是大样本,就可运用中心极限定理,认为样本平均数的分布是正态分布,在计算样本平均数出现的概率时,样本平均数可按下式进行标准化。三、样本平均数差数的分布变量3,6 1=4.5 12= 2.25 n1=3 8个样本 x2=0.75变量2,4,6 2=4 22= 2.6667 n2=2 9个样本 x2=1.333 x1-x2 f f(x1-x2) f(x1-x2)24 1 4 163 5 15 452 12 24 481 18 18 180 18

7、 0 0-1 12 -12 12-2 5 -10 20-3 1 -3 9 72 36 1681=4.5x12= 0.75 (1)样本平均数差数的平均数 = 总体平均数的差数.(2)样本平均数差数的方差 = 两样本平均数方差之和.(3)从两个独立正态分布总体中抽出的样本平均数差数的分布,也是正态分布。四 t 分 布 由样本平均数抽样分布的性质知道: 若xN(, 2), 则N(, 2/n)。 将随机变量标准化得:,则uN(0,1)。 当总体标准差未知时, 以样本标准差S代替所得到的统计量记为t。在计算时,由于采用S来代替,使得t 变量不再服从标准正态分布,而是服从t分布(tdistribution

8、)。它的概率分布密度函数如下: (4-26) 式中,t的取值范围是(-,+);df=n-1为自由度。t分布的平均数和标准差为:图4-13 不同自由度的t分布密度曲线 t0 (df1), (df2) (4-27) t分布密度曲线如图4-13所示,其特点是: 1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。 2、t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大值。 3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与

9、标准正态分布相同;n时,t 分布与标准正态分布完全一致。 t分布的概率分布函数为: (4-28)因而t在区间(t1,+)取值的概率右尾概率为1-F t (df)。由于t分布左右对称,t在区间(-,-t1)取值的概率也为1-F t (df)。于是t分布曲线下由-到- t 1和由t 1到+两个相等的概率之和两尾概率为2(1-F t (df)。对于不同自由度下t分布的两尾概率及其对应的临界t值已编制成附表3,即t分布表。该表第一列为自由度df,表头为两尾概率值,表中数字即为临界t值。 例如,当df=15时,查附表3得两尾概率等于0.05的临界t值为 =2.131,其意义是:P(-t-2.131)=

10、P(2.131t+)=0.025;P(-t-2.131)+ P(2.131t30时,卡方分布已接近正态分布。六、F 分布设从一正态总体N(,2) 中随机抽取样本容量为n1、n2的两个独立样本,其样本方差为s12、 s22,则定义其比值:F=S12/S22此值具有s12的自由度df1=n1-1和s22的自由度df2=n2-1。如果对一正态总体在特定的df1和df2进行一系列随机独立抽样,则所有可能的值就构成一个分布。分布的概率密度函数是两个独立2变量的概率密度所构成的联合概率密度。分布是随自由度df1和df2进行变化的一组曲线。分布的概率累积函数F分布的特征 1分布的平均数F=1 ,的取值区间为0,+)2分布曲线的形状仅决定于df1和df2。在df11或2时,分布曲线呈严重倾斜的反向型,当df1 3时,转为左偏曲线。内容小结、布置作业、复习及预习内容(5)习 题课后回忆(经验教训、效果估计或反应,存在问题):内容小结、布置作业、复习及预习内容1、什么是随机试验?它具有那三个特征?

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号