统计学第四版

上传人:wt****50 文档编号:50599596 上传时间:2018-08-09 格式:PPT 页数:37 大小:532KB
返回 下载 相关 举报
统计学第四版_第1页
第1页 / 共37页
统计学第四版_第2页
第2页 / 共37页
统计学第四版_第3页
第3页 / 共37页
统计学第四版_第4页
第4页 / 共37页
统计学第四版_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《统计学第四版》由会员分享,可在线阅读,更多相关《统计学第四版(37页珍藏版)》请在金锄头文库上搜索。

1、【例例】某商场甲、乙、丙三种商品某商场甲、乙、丙三种商品20072007年和年和20082008年的资料年的资料 。要求计算三种商品的销售量总指数,以综合反映市场商品。要求计算三种商品的销售量总指数,以综合反映市场商品 销售数量的变化销售数量的变化 加权综合指数 (例题分析) 加权综合指数 (例题分析)拉氏指数为拉氏指数为帕氏指数为帕氏指数为中位数 (位置和数值的确定)位置确定位置确定数值确定数值确定数值型数据的四分位数(9个数据的算例) 【例】:9个家庭的人均月收入数据(4种方法计 算)原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 7

2、50 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9离散系数(例题分析)某管理局所属8家企业业的产产品销销售数据企业编业编 号产产品销销售额额(万元) x1销销售利润润(万元) x2 1 2 3 4 5 6 7 8170 220 390 430 480a 650 950 10008.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0【 例例 】某管理局抽查了所属的某管理局抽查了所属的8 8家企业,其产品销售数家企业,其产品销售数 据如表。试比较产品销售额与销售利润的离散程度据如表。试比较产品销售额与销售

3、利润的离散程度离散系数(例题分析)结论:结论: 计算结果表明,计算结果表明,v v1 10总体均值的检验 (检验统计量)总体 是否已知 ?用样本标准差S代替t 检验小小 样本量n否否是是z 检验z 检验大大2 已知均值的检验 (例题分析)【例】某机床厂加工一种零件, 根据经验知道,该厂加工零件的 椭圆度近似服从正态分布,其总 体均值为0=0.081mm,总体标 准差为= 0.025 。今换一种新机 床进行加工,抽取n=200个零件 进行检验,得到的椭圆度为 0.076mm。试问新机床加工零件 的椭圆度的均值与以前有无显著 差异?(0.05)H0: = 0.081 H1: 0.081 = 0.0

4、5 n = 200双侧检验双侧检验检验统计量检验统计量: :决策决策: :在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H0H0结论结论: : 有证据表明新机床加工的零件的椭圆度与以有证据表明新机床加工的零件的椭圆度与以 前有显著差异前有显著差异2 未知小样本均值的检验(例题分析) 【例】某机器制造 出的肥皂厚度为 5cm,今欲了解机 器性能是否良好, 随机抽取10块肥皂 为样本,测得平均 厚度为5.3cm,标 准差为0.3cm,试 以0.05的显著性水 平检验机器性能良 好的假设。 双侧检验双侧检验H0: = 5 H1: 5 = 0.05 df = 10 - 1 = 92 未知小样本

5、均值的检验(例题分析) H0: = 5 H1: 5 = 0.05 df = 10 - 1 = 9 临界值(s):检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:结论:结论:t t0 02.2622.262-2.262-2.262.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025一个总体比例的检验(例题分析) 【例】一项统计结果声称 ,某市老年人口(年龄在 65岁以上)的比重为 14.7%,该市老年人口研 究会为了检验该项统计是 否可靠,随机抽选了400 名居民,发现其中

6、有57人 年龄在65岁以上。调查结 果是否支持该市老年人口 比重为14.7%的看法? (= 0.05)双侧检验双侧检验一个总体比例的检验(例题分析) H0: = 14.7% H1: 14.7% = 0.05 n = 400 临界值(s):检验统计量检验统计量: :在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策: :结论结论: :Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0. .025025方差的卡方 (2) 检验 (例题分析) 【例】某厂商生产

7、出一种 新型的饮料装瓶机器,按 设计要求,该机器装一瓶 一升(1000cm3)的饮料误差 上下不超过1cm3。如果达 到设计要求,表明机器的 稳定性非常好。现从该机 器装完的产品中随机抽取 25瓶,分别进行测定(用样 本减1000cm3),得到如下 结果。检验该机器的性能 是否达到设计要求 (=0.05)0.3-0.4 -0.71.4-0.6 -0.3 -1.50.6-0.91.3 -1.30.71-0.50 -0.60.7-1.5 -0.2 -1.9 -0.51-0.2 -0.61.1双侧检验双侧检验方差的卡方 (2) 检验 (例题分析) H0: 2 = 1 H1: 2 1 = 0.05 d

8、f = 25 - 1 = 24 临界值(s):统计量统计量: :在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该机器的性能未达到不能认为该机器的性能未达到 设计要求设计要求 2 20 039.3639.3612.4012.40 /2 =.05/2 =.05决策决策: :结论结论: :构造检验的统计量 (例题分析)构造检验的统计量 (计算总误差平方和 SST) 全部观察值 与总平均值 的离差平方和 反映全部观察值的离散状况 其计算公式为 前例的计算结果前例的计算结果SST SST = (57-47.869565)= (57-47.869565)2 2+ +(58-

9、47.869565)(58-47.869565)2 2=115.9295 =115.9295构造检验的统计量 (计算组间平方和 SSA) 各组平均值 与总平均值 的离 差平方和 反映各总体的样本均值之间的差异程度 该平方和既包括随机误差,也包括系统误差 计算公式为 前例的计算结果前例的计算结果 SSA SSA = 1456.608696= 1456.608696构造检验的统计量 (计算组内平方和 SSE ) 每个水平或组的各样本数据与其组平均值的离差 平方和 反映每个样本各观察值的离散状况 该平方和反映的是随机误差的大小 计算公式为 前例的计算结果前例的计算结果 SSE SSE = 2708=

10、 2708构造检验的统计量 (三个平方和的关系)总离差平方和(SST)、误差项离差平方和 (SSE)、水平项离差平方和 (SSA) 之间的 关系SST SST = = SSA SSA + + SSESSE 前例的计算结果前例的计算结果4164.608696=1456.608696+2708 4164.608696=1456.608696+2708 构造检验的统计量 (计算均方 MS) 组间方差:SSA的均方,记为MSA,计算公 式为2.2. 组内方差:组内方差:SSESSE的均方,记为的均方,记为MSEMSE,计算公计算公 式为式为构造检验的统计量 (计算检验统计量 F ) 将MSA和MSE进

11、行对比,即得到所需要的检 验统计量F 当H0为真时,二者的比值服从分子自由度为k -1、分母自由度为 n-k 的 F 分布,即 关系强度的测量 变量间关系的强度用自变量平方和(SSA) 占总 平方和(SST)的比例大小来反映 自变量平方和占总平方和的比例记为R2 ,即 其平方根R就可以用来测量两个变量之间的关 系强度 关系强度的测量 (例题分析) R=0.591404 结论 行业(自变量)对投诉次数(因变量)的影响效应 占总效应的34.9759%,而残差效应则占65.0241% 。即行业对投诉次数差异解释的比例达到近35%, 而其他因素(残差变量)所解释的比例近为65%以上 R=0.59140

12、4,表明行业与投诉次数之间有中 等以上的关系 利用 P 值进行检验 (决策准则) 单侧检验若p-值 ,不拒绝 H0 若p-值 /2, 不拒绝 H0 若p-值 /2, 拒绝 H0总体均值的区间估计 (大样本) 1.假定条件 总体服从正态分布,且方差() 已知 如果不是正态分布,可由正态分布来近似 (n 30) 使用正态分布统计量 z3.3. 总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为总体均值的区间估计 (例题分析)【 例例 】一家食品生产企业以生产袋装食品为主,为对一家食品生产企业以生产袋装食品为主,为对食品食品质质 量进行监测,企业质检部门经常要进行抽检,以分

13、析每袋重量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了量是否符合要求。现从某天生产的一批食品中随机抽取了2525 袋,测得每袋重量如下表所示。已知产品重量的分布服从正袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为态分布,且总体标准差为10g10g。试估计该批产品平均重量的试估计该批产品平均重量的 置信区间,置信水平为置信区间,置信水平为95%95%25袋食品的重量 112.5101.0103.0102.0100.5 102.6107.5 95.0108.8115.6 100.0123.5102.0101.6

14、102.2 116.6 95.4 97.8108.6105.0 136.8102.8101.5 98.4 93.3总体均值的区间估计 (例题分析)解:解:已知已知 N N( ( ,10102 2) ),n n=25, =25, 1-1- = = 95%95%,z z /2/2=1.96=1.96 。根据样本数据计算得:根据样本数据计算得: 。由于是正态总。由于是正态总 体,且方差已知。体,且方差已知。总体均值总体均值 在在1-1- 置信水平下的置信水平下的 置信区间为置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g101.44g109.28g总体均值的

15、区间估计 (例题分析)【例例】一家保险公司收集到由一家保险公司收集到由3636个个投保人组成的随投保人组成的随 机样本,得到每个投保人的年龄机样本,得到每个投保人的年龄( (单位:周岁单位:周岁) )数据如数据如 下表。试建立投保人年龄下表。试建立投保人年龄90%90%的置信区间的置信区间 36个投保人年龄龄的数据 233539273644 364246433133 425345544724 342839364440394938344850343945484532总体均值的区间估计 (例题分析)解:解:已知已知n n=36, =36, 1-1- = = 90%90%,z z /2/2=1.645=1.645。根据样本数根据样本数 据计算得:据计算得: ,总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁总体均值的区间估计(小样本) 1.假定条件 总体服从正态分布,但方差() 未知 小样本 (n 30) 使用 t 分布统计量3.3. 总体均值总

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号