《精编》应用统计及模拟分析

上传人:tang****xu3 文档编号:134166194 上传时间:2020-06-03 格式:DOC 页数:33 大小:738.50KB
返回 下载 相关 举报
《精编》应用统计及模拟分析_第1页
第1页 / 共33页
《精编》应用统计及模拟分析_第2页
第2页 / 共33页
《精编》应用统计及模拟分析_第3页
第3页 / 共33页
《精编》应用统计及模拟分析_第4页
第4页 / 共33页
《精编》应用统计及模拟分析_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《《精编》应用统计及模拟分析》由会员分享,可在线阅读,更多相关《《精编》应用统计及模拟分析(33页珍藏版)》请在金锄头文库上搜索。

1、应用统计分析部分第一章:抽样分布与设计一、抽样分布1、抽样的特点抽样的目的是用被抽取部分个体所求得的数值推断总体的数量特征。其中,抽取部分个体称为总体的一个样本 。特别样本个数就是样本容量;样本取值就是样本观察值。抽样是对所研究的总体,按照随机原则抽取部分个体进行的调查。抽样的特点:随机原则:每个元素(或个体)有同等抽中的机会(具有代表性) 推断总体特征:样本的数值特征推断总体数量特征。 推断的精确性:把推断的误差控制在一定的精确度内(可靠性要求)2、样本平均数的分布正态总体分布:如果从正态分布总体N(,)中随机抽取样本,则样本平均数的分布具有如下性质:a:样本的平均数的分布也是正态分布。b:

2、样本的平均数的平均数等于总体的平均数c: 当从无限总体抽样(或从有限总体采用放回抽样)时,样本平均数分布的方差等于总体的方差除以样本容量。即特别:当从有限总体不放回抽样时,样本平均数分布方差为:();简记(1-)总结:样本平均数服从正态分布:N(,)非正态总体分布:如果总体不服从正态分布时,样本平均数分布性质则由中心极限定理来解释如下:a:只要数学期望和方差存在,从总体中随机相互独立抽取n个样本,则样本平均数是随机变量;b:当n够大 (一般n30) 时,则N(,)c:特别总体服从二点分布p(x=i)=p,p(x=0)=1-p时,则期望p方差p(1-p) 故放回抽样时,);不放回抽样时,(1-)

3、。样本平均数之差的分布:如果总体1:X,抽n1个样本,如果总体2:Y,抽n2个样本,则二、抽样设计1、 简单随机抽样: 事前编好随机数据表总体(全部编号) 标签(混合) 用手随机模取 抽样 摇号机2、 类型抽样(分层抽样或分类抽样):总体(按特征标志分组) 组1 随机抽样 组k 随机抽样分配原则:等数;等比例;最优设:总体为N(总体样本为n) ;分成k 组,第i组包含Ni个单位,样本为ni 等数:n1=n2=.= nk=等比例:;样本数最优:标志变动程度为,样本数样本平均数i组:; 总体:样本平均数总体方差:全样本平均数的方差是各类型方差的加权综合样本平均数i组方差:是第i组内资料的方差,取各

4、类型样本方差的加权数综合3、 整群抽样:总体(按标志分成若干群)随机抽取r个群样本总体分为R个群,每群含为M个单位。设为第i个群中的第j个单位的标志值。i群平均数: i=1,2,r总体平均数:总体方差: 样本平均数的群间方差其中,为总体各群的平均数;为总体的总平均数样本方差: 样本的群间方差其中,为抽样各群的样本平均数;为抽样各群全体样本的平均数整群不放回抽样样本平均数的方差:注:等距抽样;多阶段抽样;双相抽样;穿插抽样(略)。第二章:参数估计与假设检验一、参数估计问题随机变量特征(概率分布;均值;方差) 如何? 解决方式:根据样本来估计所要的信息;具体思路:用样本统计量估计总体参数。1、参数

5、点估计量优劣的判别准则和常用的估计量点估计:用样本统计量估计总体参数一个明确的估计值准则:无偏性-令为被估计参数;为的无偏估计量;则 一致性:样本容量越大,估计量的值越接近于被估计总体参数 有效性:,如果的方差比的方差小,则比有效常用估计量: 用样本的平均数估计总体平均数,即 用样本方差和标准差s估计总体方差和标准差即; 用样本中具有某特征单位的比例估计总体比率p,即2、参数区间估计问题 区间估计:用样本估计总体参数可能取值的区间(给出了点估计可靠性的一种描述,是点估计的补充)选择两个统计量1和2估计P(11-(事先给定的正数),且12,1,2 称为置信水平为1的置信区间;1置信概率(置信水平

6、或置信系数);实有意义:有100(1-)%把握断定在1,2内。(1) 总体平均数的区间估计假设:总体服从正态分布N() ; 随机变量X的概率密度函数:f(x)= ;记作:xN()如果令:Z(统计量)则E(Z)E()0D(Z)EE()E(=1所以:ZN(0,1)标准正态分布 密度函数f(x)= 分布函数(x)=(-x)=1-(x), P(azb)=P(Zb)-P(Za)第一种情况:样本取自总体方差已知(即已知)的正态分布,对总体期望值的区间估计已知:总体随机变量XN(, 2),则N(, 2/n) ,其中;2/n(放回)令:Z,则ZN(0,1)查正态分布表:PZr=P(rZr)=2(r)-1如果令

7、P(Zr)0.955 则(r)0.9775(标准正态表得:r 2)即P(22)=0.955也就是:P(22)0.955(值落在总体平均数正负两个标准差之内的概率为95.5%)可得P(22)0.955对的一个区间估计(总体平均数有95.5%的可能性位于样本平均数的正负两个标准差之内)一般令:P(Z),(01则P1,(01,一般=0.05或0.01称为概率密度置信水平估计量的标准差与概率度的乘积故的区间估计一般记为:或 (放回)称为置信区间(有100(1)%的把握说明总体平均值在这个区间内例:P0.99P0.9952.58 152.5815+2.5812.4217.58第二种情况:样本取自总体方差

8、已知(已知)的非正态分布(中心极限定理n30)例:P0.95P0.9751.96第三种情况:(未知)用样本标准差S估计总体标准差(即:的估计值为)令:Z为变量引进新变量t= (讨论t值的概率度;t的自由度为n-1)的区间估计一般计为:(总体分布对正态总体偏离不大时)例:P175(例8.3)已知:S0.08;n=16; =1 求解95%的置信区间(=0.05;/2=0.025) 求解:查自由度n-1=15的t分布(n个样本知道仅有n-1是独立的)得:(n-1)=2.13(2)正态总体方差的区间估计 方差 构造统计量=(n-1)S2/2 证明 (衡量变量偏离总体平均数的尺度) 在正态分布的条件下,

9、(n-1) (n-1为自由度) 分布的形状由自度确定,它是非对称的。当自由度为n 时,概率度为 时 P=给定置信水平1-:计算,查找出;使得:; 的100(1-)%的置信区间为(n-1)S2/2即:P(n-1)S2/2)=1- P=1-所以:标准差的100(1-)% 的置信区间为:例P181(例8.7) :求95%的置信区间:=0.05 ,n=14查,n=14得:;故二、假设检验问题总体参数的假设 原假设(零假设)记作H0 替代假设(备择假设)记作H1要求原假设和替代假设相互独立性。即H0真实H1不真实;或:H1真实H0不真实;也就是讲:否定H0接受H1;或否定H1接受H0假设的类型: 1):

10、H0:=0;H1 :0 双边检验 2):H0:0;H1 :0 单边检验假设检验:以样本为依据构造合适的检验统计量分析样本统计值与参数假设值的差距就是原假设的显著性检验 检验统计量= 样本统计量-被假设的参数 统计量的标准差 结论:差距大 假设值的真实性小 差距小 假设值的真实性大例:Z=(标准正态分布统计量)t= (t分布的统计量)假设检验的步骤:根据题意提出原假设H0和备择假设H1选择显著性水平(0.05和0.01)选择检验统计量及其分布根据显著性水平确定统计量的否定域或临界值(注意是双边还是单边检验)根据样本数据计算统计量的数值并作出推断:如果统计量的值落在否定域内否定原假设如果统计量的值

11、落在接受域内差异不显著(接受原假设)1、总体平均数的假设检验:假设:H0:=0;H1:0 双边检验例:已知方差:50,n=25,=70 , =0.05 , 0=90检验:Z2 构造统计量P(Z)= , =1.96 ; =-1.96Z(-1.96, 1.96) 否定原假设假设:H0:0;H1:0 单边检验例P190(例8.11)2、 总体方差的假设检验例198(例8.17)第三章:回归相关分析为了研究分析各种经济现象,就需要寻找能说明这些经济现象的各种经济变量,并确定这些变量之间的因果关系,探索这些变量之间的数量变化规律。这就是回归相关分析一、建立回归分析模型的步骤:1、理论模型设计选择模型中将

12、包含的变量(选择某变量作为经济系统的“果” ,正确地选择作为“因”的变量)。 按照经济行为理论和样本数据显示出变量之间关系构造描述变量之间关系的数学表述式。 拟定模型中待估参数的符号及其大小的理论期望值范围。2、样本数据的收集常用的样本数据:时间序列数据,截面数据,虚变量数据(政策变量取值:0和1)选择样本数据的出发点:可得性和可用性。样本数据的质量:实整性,准确性,可比性(数据的口径问题)和一致性(样本和母体必须一致。3、模型参数的估计样本数据估计整体参数的具体取值。4、模型检验经济意义检验模型参数估计值的可靠性检验(R2拟合优度检验,t变量显著性检验;F-方程显著性检验)应用检验(样本容量变化的灵敏度分析进行稳定性检验,精度检验,预测能力检验)二、多元回归分析模型综述:1、 理论模型设定:Y12x2+3x3+kxk+其中,Y为被解释变量(果);1,2. k待估的参数(未知参数) ;x1, x2, x3.xk为解释变量(因);为随机扰动项抽取样本代入设定模型得:Yi12x2i+3x3i+kxki+ii1,2,,n 样本容量 : n30(最低:n3k或nk)如果,令Y= Y1 = 1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号