基础统计复习资料

上传人:wt****50 文档编号:39840637 上传时间:2018-05-20 格式:DOC 页数:10 大小:117KB
返回 下载 相关 举报
基础统计复习资料_第1页
第1页 / 共10页
基础统计复习资料_第2页
第2页 / 共10页
基础统计复习资料_第3页
第3页 / 共10页
基础统计复习资料_第4页
第4页 / 共10页
基础统计复习资料_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《基础统计复习资料》由会员分享,可在线阅读,更多相关《基础统计复习资料(10页珍藏版)》请在金锄头文库上搜索。

1、1基础统计复习资料第一章概论第三节统计学中的常用基本概念总体 X 有 X1,X2,X3,XN个单元随机抽取 n 个组成样本单元:x1,x2,x3,xn则: N总体容量 n样本容量第三章 统计资料整理一、数据的分组、整理1.写出最大值 Xmax、最小值 Xmin2.求出极差 d = Xmax Xmin3.分组,算出组距、组中值据样本的单元数,求出分组数的经验值为:样本单元数40-5050-100100-200200-500500 分组数6-87-109-1212-1717-20上限:每一组数据中最大的变量值下限:每一组数据中最小的变量值组距 = 极差分组数 = 上限 下限组中值 = ( 上限 +

2、 下限 ) 24.计算频数和频率频数 = 各组分配的统计单元数频率 = 各组单元数占总体单元数的比重 = 频数 各单元数之和(n)5.作频率分布图二、 例题例:设以不重复抽样方式从 1600 块面积为 0.4 公顷的林地所组成的总体中等概地抽取 50块林地组成样本,样本各单元的蓄积量值为: 1.5 0 10.3 4.3 4.17 11.1 8.5 0 11.8.5 8.8 11.8 12.5 312.3 2.7 8.7 3.5 .17.4 10 5.4 11.3 1.60 10.7 5.4 .7 7.64.9 7.6 11.2 4.2 .5.3 2.9 6 0 5.73.1 6.7 7.7 9

3、.6 2.94.2 16.6 5.8 4.6 6.4试进行数据整理解:1. Xmax = 16.6 Xmin = 02. 求出 d = 16.6 0 = 16.63. 分组,计算组距、组中值分为 10 组,组距 = 16.6 10 = 1.66 1.74.计算频数 ( f i ) 、频率2分组组中值划正(上限排外)频数 f i频率0 1.70.85正正一110.22 1.7 3.42.55正50.1 3.4 5.14.25正70.14 5.1 6.85.95正70.14 6.8 8.57.65正50.1 8.5 10.29.35正50.1 10.2 11.911.05正70.14 11.9 1

4、3.612.7520.04 13.6 15.314.4500 15.3 17.016.15一10.02 合计5014. 作频率分布图频率-0.0500.050.10.150.20.2505101520频率频数051015组中值 0.85 2.55 4.25 5.95 7.65 9.35 11.05 12.75 14.45 16.15频数第四章 静态分析指标一、平均指标的计算1.算术平均数 X = ( x1 + x2 + x3 + +xn ) n = ( x i ) n2.加权平均数 X = ( x1f1 + x2f2 +x3f3 + +xnfn ) n = ( x i fi ) ( fi )

5、3.众数 = 总体中出现次数最多或最普遍的标志值34.中位数 Me当 n 为偶数时:中位数 = ( Xn/2 + Xn/2+1 ) 2当 n 为奇数时: 中位数 = X(n+1)/2二、标志变异指标的计算1.极差 d = Xmax Xmin2.总体方差 2 = ( Xi X )2 n = ( Xi2 ) n X23.样本方差 S2 = ( Xi X )2 ( n 1 )4.总体标准差 = 25.样本标准差 S = S26.离散系数(变异系数)V = X三、例题例 1.测量 10 株苗木高度(单位:cm) ,得下列数据:52.7,50,55.4,61.2,55.4,49.5,50,55.4,55

6、.4,61.2求这 10 株苗木的算术平均数、众数、中位数、极差、方差、标准差和变异系数。解:把数据整理为:数据52.75055.461.249.5 出现次数(频数)12421则:算术平均数 = ( 52.7150255.4461.2249.51 ) 10 = 54.62 (cm)众数 = 55.4中位数 = ( X5 X6 )2 = ( 55.449.5 ) 2 = 52.45极差 = 61.2 49.5 = 11.7方差 = 16.1616标准差 = 4.0201变异系数 = 4.0201 54.62 = 0.0736例 2.设有以下在胸径标志的样本分组资料,试计算其平均胸径、胸径方差、标

7、准差、极差、中位数、变异系数。胸径分 组0-11-22-33-44-55-66-77-88-99-10株数311118231613852100 组中值0.51.52.53.54.55.56.57.58.59.5解:平均胸径 = ( 0.531.512.5113.5184.5235.5166.5137.588.559.52 ) 100 = 4.91方差 = 3.7219 标准差 = 1.9292极差 = 9 中位数 = 4.5 变异系数 = 0.3929第七章 抽样推断抽样推断包括了随机抽样、统计估计和假设检验三方面的内容。一、有关概率论的知识41.事件随机事件:在相同条件下每次试验可能出现,可

8、能不出现的事件。必然事件:每次试验中必然出现的事件。不可能事件:每次试验中不可能出现的事件。2.概率在大量重复试验中,事件 A 发生的频率稳定地在固定常数 p 附近摆动,则称 p 为事件 A 的概率,表示为 P(A) = p 。不可能事件的概率为 0,必然事件的概率为 1。3.随机变量的数学期望与方差随机变量的数学期望 E ( X ) = 随机变量以概率为权数的加权平均数 = X随机变量的方差 D ( X ) =24.正态分布(常态分布)随机变量 X 在其平均值附近的概率分配较多,而远离平均值的概率分配很少的最常见的分布规律。记为:X N ( , 2 ),其概率密度分布为: f (X)= EX

9、P ( X X )2 ( 22)(2)E ( X ) = , D ( X ) =2 5.标准正态分布当 E ( X ) = 0 , D ( X ) =1 时的正态分布,记为:N(0,1)二、常用统计量的无偏估计、渐近无偏估计1.无偏估计:样本某统计量的数学期望等于其估计的总体参数,则这个估计统计量就叫做该总体参数的无偏估计。2.样本平均数是总体平均数的无偏估计,即 E(x)= X。3.样本方差是总体方差的渐近无偏估计,即 E(S2)= 2。三、估计值的误差限和可靠性若统计量 X 为未知参数 x 的估计,则:绝对误差 = | Xx |相对误差 = X估计精度 A = 1可靠性 1,其中 为危险率

10、四、求点估计(定值估计)与区间估计的步骤1.点估计:求出平均数 X、标准差 S 计算绝对误差 下结论:以 1 的可靠性求出平均值为 X,绝对误差为 2.区间估计:求出平均数 X、标准差 S 计算绝对误差 ,置信区间X, X 下结论:以1 的可靠性求出估计值为 X,绝对误差为 ,置信区间为X, X五、总体平均数 的抽样估计1.条件:正态:总体均服从(或近似服从)正态分布独立:总体是相互独立的等方差:各总体方差相等52.方法:重复抽样不重复抽样 大样本(n50 或 2已知)1.求平均数 X、标准差 S 2.计算绝对误差 ,置信区 间 = uS(n-1) 3. 结论:以 1 的可靠性 求出估计值为

11、X,绝对误差为 ,置信区间为X, X1. 求平均数 X、标准差 S 2. 计算绝对误差 ,置信 区间 = uS(N n)/N(n-1) 3. 结论:以 1 的可靠性 求出估计值为 X,绝对误差为 ,置信区间为X, X 小样本(n50 或 未知1. 求平均数 X、标准差 S 2. 计算绝对误差 ,置信区间 = tS(n-1) 3. 结论:以 1 的可靠性求出估计值为 X,绝对误差为 ,置信区间为X, X注:S 2 = 样本方差 = (n-1)2n (重复抽样情况下)= N (n-1) 2n (N-1) (不重复抽样情况下)2 = 总体方差u = 查附表 2:标准正态概率双侧临界值表。如 =0.0

12、5 时,u0.5 = 1.96;=0.1 时,u0.01 = 1.64t = 查附表 3:t 分布临界值表。如 =0.05,n = 5 时, t0.05(5-1)= t0.05(4)= 2.776 例 1:用重复抽样方法测得 30 株马尾松人工林的胸径数据如下: 13.611.210.28.59137.18.214.511.7 8.75.110.511.510.911.110.212.67.210.5 9.49.78.712.210.21210.810.39.512.5 试以 0.95 的置信度求林分平均胸径所在范围解:1. 求平均数 X、标准差 SX = 10.35 S = 2.012. 查

13、附表 3 得 t0.05(30-1)= t0.05(29)= 2.0453. 计算绝对误差 ,置信区间 = tS(n-1) = 2.0452.0129 = 0.76 X = 9.59 X = 11.124. 下结论:以 0.95 的可靠性求出估计值为 10.35,绝对误差为 0.76,置信区间为9.59,11.12六、总体频率的抽样估计重复抽样不重复抽样 大样本(n50)1.求频率 p1. 求频率 p6p = 样本具有某特点的单元数 样本总单元数 = m n 2.查附表 2 得 u 3.求绝对误差限 、置信区 间 = up(1-p)n 4. 下结论:以 1 的可靠 性求出总体频率的估计值为 p

14、,绝对误差为 ,置信区间 为p, pp = 具有某特点的单元数总 单元数 = m n 2. 查附表 2 得 u 3. 求绝对误差限 、置信区 间 = up(1-p)(N- n)n(N-1) 4. 下结论:以 1 的可靠 性求出总体频率的估计值为 p,绝对误差为 ,置信区间 为p, p例:为估计某针阔混交林中针叶林地面积所占百分比,用重复抽样方式抽取了 100 个点进行观察。观察结果有 68 个点为针叶林。试以 0.95 的可靠性估计该混交林中针叶林面积所占百分比的置信区间解:1.求频率 pp = 68100 = 0.68 1p = 0.32 2.查附表 2 得 u0.05 = 1.963. 求绝对误差限 、置信区间 = u0.050.680.32100 = 0.09 p= 0.59, p= 0.77 4. 下结论:以 0.95 的可靠性求出总体频率的估计值为 0.68,绝对误差为 0.09,置信区间为0.59,0.77第八章 显著性检验(统计假设检验)一、总体平均数 的显著性检验重复抽样不重复抽样 大样本(n50 或 2已知)1.假设: H0:=0,即总体平均值无 显著差异 H1:0,即总体平均值 有显著差异 2.计算统计量 U =(X )n = (X )(n-1)S 3. 查附表 2

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号