应用统计分析部分－金锄头文库

资源描述

《应用统计分析部分》由会员分享，可在线阅读，更多相关《应用统计分析部分（19页珍藏版）》请在金锄头文库上搜索。

1、1应用统计分析部分第一章：抽样分布与设计一、抽样分布1、抽样的特点抽样的目的是用被抽取部分个体所求得的数值推断总体的数量特征。其中，抽取部分个体称为总体的一个样本。特别样本个数就是样本容量；样本取值就是样本观察值。抽样是对所研究的总体，按照随机原则抽取部分个体进行的调查。抽样的特点：随机原则：每个元素（或个体）有同等抽中的机会（具有代表性）推断总体特征：样本的数值特征推断总体数量特征。推断的精确性：把推断的误差控制在一定的精确度内（可靠性要求）2、样本平均数的分布正态总体分布：如果从正态分布总体 N（，）中随机抽取样本，则样本2平均数的分布具有如下性质：xa:样本的平均数的分布也是正

2、态分布。xb:样本的平均数的平均数等于总体的平均数xc: 当从无限总体抽样（或从有限总体采用放回抽样）时，样本平均数分x布的方差等于总体的方差除以样本容量。即2x2xn特别：当从有限总体不放回抽样时，样本平均数分布方差为：( )；简记 (1- )2xn1N2xnN总结：样本平均数服从正态分布： N （，）2x非正态总体分布：如果总体不服从正态分布时，样本平均数分布性质则由中心极限定理来解释如下：a：只要数学期望和方差存在，从总体中随机相互独立抽取 n 个样本，22则样本平均数是随机变量；nix1b：当 n 够大 (一般 n30) 时，则 N （，）2xc：特别总体服从

3、二点分布 p(x=i)=p，p(x=0)=1-p 时，则期望 p 方差 p(1-p) 故放回抽样时， )；不放回抽样时，(1- )pPN(n1P(Nn)。nP1(样本平均数之差的分布：如果总体 1：X ，抽 n1 个样本，),(21N1nix如果总体 2：Y ，抽 n2 个样本，),(2 21niy则 yx),(2121N二、抽样设计1、简单随机抽样：事前编好随机数据表总体（全部编号）标签（混合）用手随机模取抽样摇号机2、类型抽样(分层抽样或分类抽样 )：总体（按特征标志分组）组 1 随机抽样组 k 随机抽样分配原则：等数；等比例；最优设：总体为 N(总体样本为 n) ；分

4、成 k 组，第 i 组包含 Ni 个单位，样本为 ni 等数：n 1=n2=.= nk=等比例：；样本数NN.21 nii3最优：标志变动程度为，，样本数ikiiiiNn1kiiiiNn1样本平均数 i 组：；.)2,(1kinxnjii总体： ikiNx1样本平均数总体方差： 212ixkix全样本平均数的方差是各类型方差的加权综合2x样本平均数 i 组方差： kiixnNi122是第 i 组内资料的方差，取各类型样本方差的加权数综合2ix3、整群抽样：总体（按标志分成若干群）随机抽取 r 个群样本总体分为 R 个群，每群含为 M 个单位。设为第 i 个群中的第 j 个单位的

5、标ijx志值。i 群平均数： i=1，2，rmjiix1总体平均数： rrxririji11总体方差：样本平均数的群间方差Rix/)(22其中，为总体各群的平均数；为总体的总平均数i x4样本方差：样本的群间方差rxix/)(22其中，为抽样各群的样本平均数；为抽样各群全体样本的平均数i x整群不放回抽样样本平均数的方差： )1(2Rrx注：等距抽样；多阶段抽样；双相抽样；穿插抽样(略) 。第二章：参数估计与假设检验一、参数估计问题随机变量特征(概率分布；均值；方差 ) 如何？解决方式：根据样本来估计所要的信息；具体思路：用样本统计量估计总体参数。1、参数点估计量优劣的判别准则

6、和常用的估计量点估计：用样本统计量估计总体参数一个明确的估计值准则：无偏性-令为被估计参数；为的无偏估计量；则 )(E一致性：样本容量越大，估计量的值越接近于被估计总体参数有效性：，，如果的方差比的方差小，则)(1E)(212比有效2常用估计量：用样本的平均数估计总体平均数，即nix1)(xE 用样本方差和标准差 s 估计总体方差和标准差niis122)( 2即；2222 )()( xExEE)(s 用样本中具有某特征单位的比例估计总体比率 p，即nap p2、参数区间估计问题区间估计：用样本估计总体参数可能取值的区间（给出了点估计可靠性的一种5描述，是点估计的

7、补充）选择两个统计量 1 和 2估计P( 1 1- (事先给定的正数)2，且 1 0 单边检验假设检验：以样本为依据构造合适的检验统计量分析样本统计值与参数假设值的差距就是原假设的显著性检验检验统计量= 样本统计量- 被假设的参数统计量的标准差结论：差距大假设值的真实性小差距小假设值的真实性大9例：Z= (标准正态分布统计量)nx/t= (t 分布的统计量 )S/假设检验的步骤：根据题意提出原假设 H0 和备择假设 H1选择显著性水平（0.05 和 0.01）选择检验统计量及其分布根据显著性水平确定统计量的否定域或临界值（注意是双边还是单边检验）根据样本数据计算统计量的数值并作出推断：

8、如果统计量的值落在否定域内否定原假设如果统计量的值落在接受域内差异不显著（接受原假设）1、总体平均数的假设检验：假设：H 0：= 0；H 1： 0 双边检验例：已知方差： 50，n=25， =70 ， =0.05 ， 0=90x检验：Z 2nx/5/097构造统计量P（Z ）= ， =1.96 ； =-1.962205.Z205.ZZ (-1.96, 1.96) 否定原假设假设：H 0： 0；H 1： 0 单边检验例 P190（例 8.11）2、总体方差的假设检验例 198（例 8.17）10第三章：回归相关分析为了研究分析各种经济现象，就需要寻找能说明这些经济现象的各种经济变量，并确定

9、这些变量之间的因果关系，探索这些变量之间的数量变化规律。这就是回归相关分析一、建立回归分析模型的步骤：1、理论模型设计选择模型中将包含的变量（选择某变量作为经济系统的“果” ，正确地选择作为“因”的变量）。按照经济行为理论和样本数据显示出变量之间关系构造描述变量之间关系的数学表述式。拟定模型中待估参数的符号及其大小的理论期望值范围。2、样本数据的收集常用的样本数据：时间序列数据，截面数据，虚变量数据（政策变量取值：0 和 1）选择样本数据的出发点：可得性和可用性。样本数据的质量：实整性，准确性，可比性(数据的口径问题) 和一致性(样本和母体必须一致。3、模型参数的估计样本数据估计整体参数

10、的具体取值。4、模型检验经济意义检验模型参数估计值的可靠性检验（R 2拟合优度检验，t 变量显著性检验；F-方程显著性检验）应用检验（样本容量变化的灵敏度分析进行稳定性检验，精度检验，预测能力检验）二、多元回归分析模型综述：1、理论模型设定：Y 1 2x2+3x3+ kxk+其中，Y 为被解释变量（果）； 1， 2. k 待估的参数( 未知参数) ；x1, x2, x3.xk 为解释变量（因）；为随机扰动项抽取样本代入设定模型得：Y i 1 2x2i+3x3i+ kxki+ii1,2，,n样本容量： n30(最低：n3k 或 nk)如果,令 Y= Y1 = 1 = 1 X= 1 X

11、21 X31 Xk1Y2 2 2 1 X 22 X32 Xk2 . Yn k n 1 X 2n X 3n Xkn 11则样本模型：Y=X+2.基本假设(1) 随机性：为随机变量(2) 零均值： E()=0(3) 同方差： (总体方差)2(4) 无序列相关性：COV( i,j)=0 (解释变量相互独立) 协方差：COV(X,Y)= pi 为(x i ,yi)出现的概率ni iiyxp1相关系数： CORR(x,y)= yx,)cov(5) Xji 与 i 不相关：解释变量 Xj (j=2,k) 在反复随机抽样中是选定的变量,故矩阵 X 的阶数不变.(6) Xji 之间不相关：即秩(X)=k4

12、.87，说明该方程在 99%的显著水平下仍是显著成立的。（3）显著性水平，查 t 分布表得临界值 t0.025(21)=2.080,显然5.|t1|=82.080；|t 2|=1.41.721,说明解释变量 X3 在 90%的概率水平下显著。显著性水平，查 t 分布表得临界值 t0.10(21)=1.323,显然|t2|=1.41.323,说明解释变量 X2 在 80%的概率水平下显著。由此可见，决定是否剔除某个解释变量需持慎重态度，在该模型中，三个解释变量都可以保留。（4）显著性水平，查 D W 分布表得：d 1=1.12,dv=1.66 而 dl D05.W=1.41dv,根据检验

13、，在 95%的概率水平下，不能判断模型的自相关状态。第四章：模拟分析问题：线性规划动态规划都假设所有数据是事先确定的已知的，不包含概率因素网络理论的。实际情况很少有符合分析模型的假设，环境不确定性离散决策和复杂性，使现实中这些现象极为少见。模拟：可以解决问题( 不满足分析建模的标准方法所规定的假设)模拟的定义：是建立系统或决策问题的数学(或逻辑) 模型，并以该模型进行试检，以获得对系统行为的认识或帮助解决决策问题的过程。定义中的两个要素：一是模型：它将问题或系统的任何适当假设模型化（模型是对实际系统思想或客体的抽象描述）；二是模拟：用模型进行试验并分析结果。模型的不同分类：模型分类：规定型模

14、型：它决定着最优策略或最佳行动过程描述型模型：直接描述关系和提供评价信息，它用于解释系统行为，预测输入规划过程的未来事件，并帮助决策者选择满意方案和系统设计确定性：（数据已知或假设已知）17模型分类：概率型：（数据由概率分布决定）模型分类：离散型：变量随时间跳跃的变动连续型：变量随时间连续的变动模拟模型的类型：蒙特卡洛模拟模型(Monte Carlo simulation)系统模拟模型(System simulation)蒙特卡洛模拟模型：基本上是抽样试验，其目的是估计以若干概率输入变量而获得结果变量的分布。它常被用于估计策略变动的预期影响和决策所涉风险。例：Monte Carlo VAR 模拟法Monte Carlo 模拟法是基于历史数据或既定分布的条件下的参数特征，借助随机数产生的模拟方法模拟出大量的资产组合收益的数值，然后构造资产组合收益的经验分布函数，通过对经验分布函数的逆变换可求得 VAR 值。假定 Y 是绝对连续累积分布函数的随机变量，对于 0q1，令 Yq表示唯一的值，使得： qyYPyFq)(即就是：Y q是 Y 的分位点。当 Fy连续时

展开阅读全文

应用统计分析部分

最新文档