社会统计学1015

上传人:简****9 文档编号:111918061 上传时间:2019-11-04 格式:PPT 页数:52 大小:724.50KB
返回 下载 相关 举报
社会统计学1015_第1页
第1页 / 共52页
社会统计学1015_第2页
第2页 / 共52页
社会统计学1015_第3页
第3页 / 共52页
社会统计学1015_第4页
第4页 / 共52页
社会统计学1015_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《社会统计学1015》由会员分享,可在线阅读,更多相关《社会统计学1015(52页珍藏版)》请在金锄头文库上搜索。

1、社会统计学 陈磊 哲学与社会学学院 假设检验的步骤 (1)根据实际问题作出原假设和备择假设。 (2)根据样本容量选择合适的统计量,并在H0 成立的条件下确定统计量的分布。 (3)根据需要确定显著性水平,并计算出临界 值和拒绝域。 (4)计算与统计量对应的样本观测值,若观测 值落入拒绝域,则拒绝零假设;否则接受 零假设。 二、小样本假设检验 1. 总体均值的检验 例4:大多数的水处理厂会每小时监控饮用水 。监控的指标之一是pH值,它是衡量水的酸 碱度的指标。pH值小于7.0的液体呈酸性,大 于7.0的为碱性,等于7.0的是中性,饮用水的 理想pH值为8.5。现有一水处理厂一小时内的 17个水样本

2、的pH值的均值和标准差分别为 x = 8.42,s = 0.16。这一结果是否说明该厂饮 用水的pH值不是8.5? 解:我们设零假设H0 : = 8.5 备择假设H1: 8.5 问题(1) 当样本容量较小时,我们不能从中心 极限定理得出样本均值 x 是满足正态分布的。 因此我们必须假设所检验的总体是满足正态分 布的。这样,当总体方差已知时,x 满足正态 分布。 问题(2) 若总体标准差未知,当样本容量较小 时,我们无法保证 s 是的较好估计。因此, 我们在对总体均值作估计时,用t分布而不用 正态分布。 我们知道对于小样本观测量,统计量 t = 满足自由度k =171= 16的t分布。 x s/

3、n t t分布 = 0.025 2.1199 = 0.025 -2.1199 因此,拒绝域为(-, -2.1199)和(2.1199, +)。由 于样本均值 x = 8.42,样本标准差s = 0.16,所 以样本统计量 t = = -2.05。由于-2.05没 有落入拒绝域,因此,我们接受零假设,认为 该厂的饮用水的pH值为8.5。 注:如果我们用正态分布来检验这个问题,我 们可查得临界值为1.96,则拒绝域为(-, -1.96) 和(1.96, +)。这样,样本统计量 t = -2.05将落 入拒绝域,我们将认为该厂饮用水的pH值不是 8.5。因此,我们要仔细检验和理解统计过程中 所用到的

4、统计量以及假设。许多统计“谎言”都 是由于错误地使用了不合适的统计分布或统计 量等。 8.42 8.5 0.16/17 例5:一个汽车制造厂想要测试一种新的发动机 以确定它是否符合新颁布的空气污染标准。已 知这一型号的发动机的排气标准为小于20个立 方单位二氧化碳/升。这一型号的所有发动机的 排气量水平满足正态分布。现生产10台发动机 用以测试它们的排气量。所得数据如下: 15.6 16.2 22.5 20.5 16.4 19.4 16.6 17.9 12.7 13.9 上述数据是否能够使得厂家得出如下结论:这 种发动机符合符合标准?假设显著性水平= 0.01。 解法1:我们设零假设H0 :

5、= 20 备择假设H1: 20 当= 0.01时,单边检验的拒绝域为( 2.8214, + )。 通过计算,我们有 x = i =17.17,s = (i x )= 2.98 计算统计量的值得:t = = = -3.00 由于-3.00在拒绝域外,因此我们否定备择假 设,即20 。 x s/n 17.17 20 2.98/10 1 n n i=1 1 n-1 n i=1 我们知道对于小样本观测量,统计量 t = 满足自由度k =101= 9的t分布。 x s/n 为了进一步研究,调查结果支持= 20还是 20,我们再作一次假设: 零假设H0 : = 20 备择假设H1: 20 统计量 t =

6、满足自由度k =101= 9的t 分布。当= 0.01时,单边检验的拒绝域为(- , -2.8214)。 统计量的观测值为 t = -3.00,落入拒绝域。 因此我们拒绝零假设,接受备择假设,即 20,这种发动机的尾气排放量符合符合标 准。 解法2:设零假设H0 : 20 备择假设H1: 20 x s/n 统计量 t = 满足自由度k =101= 9的t 分布。当= 0.01时,单边检验的拒绝域为 (2.8214, +)。 将x, s, , 代入统计量公式,观测量 t = t = x s/n x s/n x s/n 注: (1) 若用解法2,由于 20,因此t不能具体 算出,无法检验。但我们知

7、道,用= 20计 算得到的观测量t落入拒绝域,则t也必定落 入拒绝域。因此,在单边检验中,我们都采 用解法1的假设方法。 (2) 在单边检验中,通常将零假设设为已知的 总体参数,备择假设按照实际要检验的问题 进行设置。 2. 正态总体方差2的检验 例6:某研究人员为了证实六年级小学生智商 (IQ)的标准差是小于15。从总体中随机抽查了 共30名学生。其结果有:平均智商X = 105, 样本方差:S2 = 196。 问该研究人员的看法能否被证实(= 0.01)? 解:设H0:= 15 H1: 14.257,因此,我们拒绝备择假设 15,认为该研究人员的看法不能被证实。 2 = 0.01 14.2

8、57 n1 2 301 152 假设检验和参数估计 共同点: (1)假设检验和构造置信区间都是以样本数据 为基础,作出关于参数值的结论。 (2)都将考虑情况分为大样本和小样本两类。 对于每类情况,两种方法使用的统计量都相 同。 不同点: 假设检验的焦点是一个特殊的值,而参数估 计是用一个区间来“网”真值。在许多方面置 信区间比假设检验提供的信息更多,但假设 检验还是被广泛地利用。 例7:海洋中最可怕的肉食动物之一是大白鲨 。据调查,大白鲨的平均身长为21英尺。然 而,一位海洋生物学家认为,由于不寻常的 进食习惯,从百慕大群岛游出的大白鲨的身 长不同于一般的大白鲨。为了证实他的断言 ,科学家冒险

9、捕获3只从百慕大海域游出的成 年大白鲨,测量完身长后将它们放生。三只 大白鲨的身长分别为24英尺、20英尺和22英 尺。这些数据能够验证这位海洋生物学家的 观点吗? = 0.10 解:我们分别假设检验和区间估计的方法分 别对这个问题进行解答。 假设检验: H0: = 21 H1: 21 由于样本数量很少(n =3),且大白鲨身长分 布符合正态分布, 则统计量 t = 满足自由度为2的t分布。 当= 0.10时,查表得 t (0.1/2) (2) = 2.9200,即 拒绝域为(-, -2.9200.)和(2.9200, +)。 样本均值 x = = 22,S2 = (24 22)2+(2022

10、)2+(2222)2 = 4, 而样本统计量t = =0.8662.9200 x s/n 24+20+22 3 1 2 2221 2/3 区间估计: 该问题为小样本情况下,总体满足正态分布, 但2未知,则 t (n1), 显著性水平= 0.10,则置信度1=0.90。 x (S/n) 我们知道: P( x t/2( ) x +t/2( ) )= 1, 其中(t/2) =/2,即置信度为0.90的总体均值 的置信区间为: 222.9200( ),22+2.9200( ), S n S n 2 3 2 3 这样,我们不能接受备择假设,即我们不能认 为从百慕大海域游出的大白鲨的身长不同于其 他大白鲨

11、。 即19.63,25.37。由于一般大白鲨的体长均值 21 19.63,25.37,因此我们认为从百慕大 群岛游出的大白鲨的身长与一般的大白鲨相同 。 前五章小结 第一章 知识点:变量的层次 掌握重点:各类层次变量之间的区别,联系 和使用原则。 第二章 知识点:统计表、统计图;集中趋势测量 法,离散趋势测量法 定类变量 定序变量 定距变量 (定比变量) 掌握重点: 1. 变量取值的两个原则 2. 各类变量对应的统计图和统计表的做法。尤 其对于连续型定距变量,要掌握变量的分组 规则、分点精度(使用真实组界)。 3. 掌握直方图和折线图的画法,尤其当变量采 用非等距分组时,注意纵轴应表示(相对)

12、频 次密度。 4. 掌握众值、中位值和均值的计算方法及它 们的适用范围和表现力。 5. 掌握异众比率、极差、四分互差和方差(标 准差)的计算、它们的适用范围和表现力及 它们与上述三种集中趋势测量法的呼应。 完备性 互斥性 难点: 1. 对连续型定距变量进行分组时分点精度的 确定,分清真实组限和标定组限。 2. 用(相对)频次密度表示直方图中纵轴的距 离。 3. 中位值及四分互差的计算。 练习 剑鱼的身体吸收水银,水银含量超过1.00ppm ( 即百万分之一)的剑鱼对人体有害。在28条剑鱼 的样本中,我们发现其水银含量如下: 0.07 0.24 0.39 0.54 0.61 0.72 0.81

13、0.82 0.84 0.91 0.95 0.98 1.02 1.08 1.14 1.20 1.20 1.26 1.29 1.31 1.37 1.40 1.44 1.58 1.62 1.68 1.85 2.10 1. 根据所给的数据做出统计表并画出直方图和 折线图。 2. 以0.07 0.54;0.61 0.98;1.02 1.20; 1.26 1.44;1.58 2.10为分组办法做出统计 表及直方图。 解:R = LS = 2.100.07 = 2.03 把数据分成4组,组距h = = 0.509 0.51 根据组距和分点精度比原统计数据精度高 一位的原则,将数据分为如下4组: 0.065

14、0.575;0.575 1.085;1.085 1.595; 1.595 2.105 2.03 4 组组 号i 真实组实组 界限 (ppm) 中心值值 (ppm) 频频次 (条) 相对频对频 次 = ni /n i 频频次密 度= ni /组组 距 1 2 3 4 0.065 0.575 0.575 1.085 1.085 1.595 1.595 2.105 0.32 0.83 1.34 1.85 4 10 10 4 0.14 0.36 0.36 0.14 7.84 19.61 19.61 7.84 总总 和 n i = 281.00 银鱼体内水银含量统计表1 0 0.065 0.575 1.

15、085 1.595 2.105 ppm 频次 密度 21 14 7 0 0.065 0.575 1.085 1.595 2.105 ppm 频次 12 8 4 组组 号 i 真实组实组 界限 (ppm) 中心 值值 (ppm) 频频 次 (条) 累计频计频 次 cf( 条) 相对频对频 次 = ni /n i 频频次密度 = ni /组组距 1 2 3 4 0.065 0.545 0.545 0.985 0.985 1.205 1.205 1.445 1.445 2.105 0.315 0.765 1.095 1.325 1.775 4 8 5 6 5 4 12 17 23 28 0.14 0.29 0.18 0.21 0.18 8.33 18.18 22.73 25 7.58 总总 和 n i = 281.00 2. 解:银鱼体内水银含量统计表2 频次 密度 25 20 15 10 5 0.065 0.545 0.985 1.205 1.4

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号