统计学原理串讲

上传人:子 文档编号:41640336 上传时间:2018-05-30 格式:DOC 页数:53 大小:784.50KB
返回 下载 相关 举报
统计学原理串讲_第1页
第1页 / 共53页
统计学原理串讲_第2页
第2页 / 共53页
统计学原理串讲_第3页
第3页 / 共53页
统计学原理串讲_第4页
第4页 / 共53页
统计学原理串讲_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计学原理串讲》由会员分享,可在线阅读,更多相关《统计学原理串讲(53页珍藏版)》请在金锄头文库上搜索。

1、考试题型:单选 15 题-15 分多选 5 题-10 分填空 10 题-10 分判断改错 5 题-10 分简答题 4 题-20 分计算题 4 题-35 分计 算 题重中之重第二章 统计数据的整理(一)基本概念及计算公式1)组距连续变量分组的组距:( )abba2)组中值(1)分组()2abab的组中值为:1 2(2)上开口组(如“80以上“)的组中值=本组下限+邻组(较小组)组距1102(3)下开口组(如“以下“)的组中值=本组上限-邻组(较大组)组距第三章 统计数据的描述与显示(一)基本概念及计算公式1)有关指标概念)有关指标概念 时期指标数量指标=绝对指标=总量指标时点指标部分1)结构相对

2、指标=全部 2)比较相对指标=两个的指标之比 指标部分1相对指标3)比例相对指标=质量指标部分2 4)强度相对指标=但的指标之比 5)动同类现象性质不同 不同时间态相对指标=同两个有联 一事物的指标之比平均指系标2)反映集中趋势的指标)反映集中趋势的指标(1)众数 (分组数据)01ML+12d (2)中位数 (分组数据)-12ML+me mfS df (3)算术平均数 ()xxnn适用于个离散数据()xffxxff 适用于分组数据(适合绝对数的平均)(适合绝对数的平均)(4)几何平均数 12.nnaaa(适合相对数的平均)(适合相对数的平均)3)反映离散程度的指标)反映离散程度的指标(1)极差

3、(全距):数列中的最大值)极差(全距):数列中的最大值最小值最小值(2)平均差)平均差 |. .()xxM Dnn适用于个离散数据|. .()xx fM Df适用于分组数据(3)方差 22()xx nn 适用于个离散数据22()xxff 适用于分组数据(4)标准差 2()xx nn 适用于个离散数据2()xxff 适用于分组数据(5)离散系数(变异系数,标准差系数) vx(6)成数的方差和标准差设成数为 p, 则方差 2(1)pqpp标准差 (1)pp(二)应用举例1. 现有甲、乙两国钢产量和人口资料如下:甲 国乙 国2000 年2001 年2000 年2001 年钢产量(万吨)年平均人口数(

4、万人)30006000330062005000714352507192试计算动态相对指标、强度相对指标和比较相对指标。1 解解甲国乙国比较相对指标(甲 :乙)2000 年2001 年动态相对指标(发展速度)2000 年2001 年动态相对指标(发展速度)2000 年2001 年钢产量(万吨)30003300110%50005250105%6062.85年人口数(万人)6000620010333 %71437192100.69%84%8621%强度相对指标(人均钢产量,吨/ 人人)05053070732.已知甲、乙两个班学生的成绩资料如下:甲班的平均成绩为 78.5分,成绩标准差是 9.58 分

5、;乙班的资料见下表: 按成绩分组人数60 以下60707080809090 以上6122084合 计50计算:(1)计算乙班分组数据的众数和中位数;(2)乙班学生的平均成绩、方差、标准差和离散系数;(3)哪个班的平均成绩更具有代表性?为什么?(2 解解(1)众数众数 018ML+701074128 12d 中位数中位数 -1501822ML+701073.520me mfS df (2)乙班学生的平均成绩、成绩标准差和标准差系数乙班学生的平均成绩、成绩标准差和标准差系数: :按成绩分组人数()f组中值()xxf2 xxfxx260 以下60707080809090 以上612208455657

6、585953307801500680380338.5670.562.56134.56466.562031.36846.7251.201076.481866.24合 计503670-5872.00(注:在表的右边增加(注:在表的右边增加 4 列)列)平均值:)( 4 .73503670分乙fxfx方差: 225872117.4450xxff 乙分标准差: 分乙84.1044.1175058722 ffxx离散系数 10.840.1573.4vx乙 乙 乙(3) 78.59.58xQ甲甲,9.580.1278.5x甲 甲 甲0.15v乙而乙甲 甲班学生的平均成绩比乙班学生的平均成绩更具有代表性!第

7、四章第四章 抽样调查抽样调查(一)计算公式1)抽样的平均误差(P104)(a)= (有放回(重置)抽样)xS nn(b)= (无放回(不重置)抽x1Nn Nn 11nSn NNnn样)221()1)xx SxxfSnfS 适注意计算时, 总体的标准差用样用本的标准差代于n个离散数据适用于分组数据替(2)总体成数的抽样平均误差(1)(1)()ppppp nnn有放回(重置)抽样(1)-1()1pppN nn NNnn无放回(不重置)抽样2)抽样的极限误差(P105)(1)(2)xxpptt 总体的极限误差: 总体的平均数成数极限误差: 3)区间估计(P111)(1)总体平均数的区间估计的步骤(对

8、于连续分组数据):(a)求组中值ix(b)求样本平均数和样本标准差x()S代替(c)求抽样的平均误差: (根据“重置”与否选择公式)x(d)求极限误差: ((xxtt 由题目给出)(e)写出平均数的估计区间:(,)xxxx (2)总体成数的区间估计的步骤 (P113)成数区间估计的适应范围(P111)(a)求出成数 p 和样本标准差(1)Spp(b)求抽样的平均误差: (根据“重置”与否选择公式)p(c)求出极限误差:ppt (d)写出成数的估计区间:(,)pppp (二)应用举例3某地有八家银行,共有职工 2000 人, 现按重置和不重置方式从所有职工中随机抽取 600 人进行调查,得知其中

9、的 486 人在银行里有个人储蓄存款,存款金额平均每人 3400 元,标准差 500 元,试以 95.45%的可靠性推断(若 F(t)为 95.45%, 则 t=2) ( 1)全体职工中有储蓄存款者所占比率的区间范围 (估计区间)(2)平均每人存款金额的区间范围(估计区间)3 解解1)因为要求的是“有储蓄存款者所占比率的区间范围“,属总体成数的区间估计问题重置方式(1)已知:n=600,成数(存款者比例)p=81%,486 600F(t)=95.45%, 则 t=2,(1)(1)0.81 (1 0.81)1.6%600ppppp nnn而抽样平均误差所以,抽样极限误差=ppt (1)2 1.6

10、%3.2%pptn故全体职工中有储蓄者所占比率 p 的估计区间为(,)pppp即:(81%-3.2%,81%+3.2%) 或( 77.8% , 84.2% )(2)因为要求的是“平均每人存款金额的区间范围” ,属总体平均数的区间估计问题。元, 500 元3400x S平均每人存款金额的抽样极限误差=20.41xn500 60040.82xxt 平均每人存款金额的估计区间为平均每人存款金额的估计区间为( ,+)(3400-40.82,3400+40.82)=(3359.183440.82xxxx,)2)不重置方式(1)已知:n=600,存款者比例(成数) p=81%,486 600F(t)=95

11、.45%, 则 t=2,-(1- 110.81 (1 0.81)2000-6001.34%6002000 1pN nppN n NnNn而抽样平均误差1.34%2.68%ppt 2(81%-2.68%,81%+2.68%) 或( 78.32% , 83.68% )(2)平均每人存款金额的抽样极限误差)平均每人存款金额的抽样极限误差=17.08x1Nn Nn 5002000-600 2000-16002 17.0834.16xxt 平均每人存款金额的估计区间为( ,+)(3400-34.16,3400+34.16)=(3365.843434.16xxxx,)3*某进出口公司出口一种名茶,抽样检验

12、结果如表所示。每包重量 x(克)包数 f(包)xf148149149150150151151152102050201485299075253030合计 10015030又知这种茶叶每包规格重量不低于 150 克,试以 99.73%的概率(t=3):(1)确定每包重量的极限误差;(2)估计这批茶叶的重量范围,确定是否达到规格重量要求。4* 解每包重量 x(克)包数 f(包)组中值 xxf2()xx2()xxf(1) 由表资料计算得: 2222150.30.770.0881xXSSnnnxfxf ,(克)1533076 100100-1F(t)=0.9973 t3所以,30.0880.26(克)

13、xxt (2) 这批茶叶的平均重量为 150.30.26 克,即平均重量落在(150.04,150.56)内,符合这种茶叶每包规格重量不低于 150 克的要求,因此,可认为这批茶叶的重量是合格的。第五章第五章 相关分析与回归分析相关分析与回归分析(一)基本概念及计算公式(一)基本概念及计算公式1)相关系数)相关系数148149 149150 150151 15115210 20 50 20148.5 149.5 150.5 151.51485 2990 7525 30303.24 0.64 0.04 1.4432.4 12.8 2 28.8合计100150307622222222221()()

14、 = 11()()()()= (-11)(-11) ()()xyxyxyxyxxyyxxyynr xxyyxxyynnrxynxyxyrr nxxnyy 协方差(对的标准差) (对的标准差)简化形式(用于计算)2)相关分类)相关分类 正相关按相关方向分类 负相关线性相关相关分类按相关形式分类 非线性相关单相关(两个变量,变量对等,不分自变量和因变量)按相关因素的个数分类 复相关(两个以上变量)3)线性回归方程)线性回归方程 yabx2222= ,- =- ()xyxnxyxyyxbaby bxnxxnn xy22 xxxyxyybrb (相关系数与回归系数的关系:同号)(二)应用举例(二)应用举例4. 从某一行业中随机抽取从某一行业中随机抽取 5 家企业,所得产品产量与生产费用的数家企业,所得产品产量与生产费用的数据如下:据如下:产品产量(台)产品产量(台)x4050507080生产费用(万元)生产费用(万元)y130140145150156要求:要求: (1) 计算相关系数计算相关系数r ;(2) 利用最小二乘法求出回归方程利用最小二乘

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号