第二章基本统计概念的回顾课件

上传人:我*** 文档编号:141110271 上传时间:2020-08-04 格式:PPT 页数:41 大小:202KB
返回 下载 相关 举报
第二章基本统计概念的回顾课件_第1页
第1页 / 共41页
第二章基本统计概念的回顾课件_第2页
第2页 / 共41页
第二章基本统计概念的回顾课件_第3页
第3页 / 共41页
第二章基本统计概念的回顾课件_第4页
第4页 / 共41页
第二章基本统计概念的回顾课件_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《第二章基本统计概念的回顾课件》由会员分享,可在线阅读,更多相关《第二章基本统计概念的回顾课件(41页珍藏版)》请在金锄头文库上搜索。

1、Econometrics计 量 经 济 学,祝树金 教 授 经济与贸易学院 二零零七年十月,第二章 基本统计概念的回顾,主要内容,2.1 随机试验 2.2 随机变量 2.3 总体的的数字特征 2.4 样本分布的数字特征,2.1 随机试验,随机试验:指至少有两个可能结果,但不确定哪一个结果会出现的过程 总体:随机试验所有可能的集合称为总体(population)或样本空间 例子:在一种双回合游戏中,O1表示两个回合全部获胜;O2表示第一个回合获胜,第二个回合失败; O3表示第一个回合失败,第二个回合获胜; O4表示两个回合全部失败。样本空间有4种结果组成:O1,O2 , O3 , O4 样本点:

2、样本空间(或总体)的每一元素,即每一种结果成为样本点,2.1 随机试验,随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集 如果两个事件不能同时发生,则两个事件称为是互斥的 如果一个事件的发生与另一个事件的发生的可能性相同,则两个事件称为等可能性的。例如抛一枚硬币,正面朝上和正面朝下是等可能出现的,2.2 随机变量,一、概率分布 引入一个随机变量来描述总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和连续型两种类型。 样本就是n个相互独立的与总体具有相同分布的随机变量x1,xn,即n元随机变量。随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集 总体与样本间的

3、联系在于具有相同的分布,2.2 随机变量,一、概率分布 引入一个随机变量来描述总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和连续型两种类型。 样本就是n个相互独立的与总体具有相同分布的随机变量x1,xn,即n元随机变量。随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集 总体与样本间的联系在于具有相同的分布,2.2 随机变量,2、概率分布的含义和性质 随机变量X取各个值的概率称为X的概率分布。对一个离散型随机变量X可以给出如下的概率分布: P(X=xi)=pi 对于随机变量X(无论连续还是离散)可以确定实值函数F(x),称为累积分布函数(cumulative dis

4、tribution function, CDF), 定义如下 F(x) P(Xx),概率分布性质 (1)取值范围 (2)若A, B, C, 为互斥事件,则有 P(A+B+C+)P(A)P(B)P(C) 对于任意事件A, B则有P(A+B)P(A)P(B)P(AB) (3)若A, B, C, 为互斥事件,且为一完备事件组,则 P(A+B+C+)P(A)P(B)P(C)=1 (4)事件A, B, C, 称为相互独立的事件,如果有 P(ABC)P(A)P(B)P(C) (5)条件概率P(A|B)=P(AB)/P(B),2.2 随机变量,举例: 国际贸易专业有200名学生,其中男生120人,女生80人

5、,在这些学生中,40名男生和24名女生计划选学计量经济学,若随机抽取一人,发现这个学生计划选学计量经济学。那么这个学生是男生的概率是多少?,3、连续型随机变量的分布函数及概率密度函数 对于连续型随机变量,取任何特定数值的概率为0。 设F(x)是随机变量X的分布函数,如果对任意实数x,存在非负函数f(x)0, 使 就称f(x)0为X的概率密度函数(PDF),且f(x)具有性质,2.2 随机变量,4、多元随机变量的概率密度函数 联合概率密度函数f(X, Y) =P(X=x, Y=y)。 边缘概率密度函数f(X) , f(Y)。 条件概率密度函数 f(X|Y) =P(X=x|Y=y) 条件概率密度函

6、数f(X|Y) f(X, Y) / f(Y) 独立随机变量 如果f(X, Y) f(X) f(Y),则称变量X和Y是统计独立的,2.2 随机变量,5、随机变量函数 设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x,都有另一个随机变量Y的取值y=f(x)与之相对应,则称Y为X的函数,记作Y=f(X)。 常常遇到一些随机变量,它们的分布往往难于直接得到(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已知随机变量的分布求出与之有关的其它随机变量的分布

7、。其间的关系通常用函数关系表示。,2.2 随机变量,2.3 对总体的描述:随机变量的数字特征,数学期望 方差 数学期望与方差的图示 相关系数与协方差 偏度和峰度,一、数学期望(集中趋势的度量),1、离散型随机变量数学期望的定义 假定有一个离散型随机变量X有n个不同的可能取值x1,x2,xn,而p1,p2,pn是X取这些值相应的概率,则这个随机变量X的数学期望定义如下: 数学期望描述的是随机变量(总体)的一般水平,2、连续型随机变量数学期望的定义 若连续型随机变量X有分布密度函数f(x) ,而积分 绝对收敛,则称 为X的数学期望。 数学期望是最容易发生的,因而是可以期待的。它反映数据集中的趋势。

8、,一、数学期望(集中趋势的度量),求离散型随机变量数学期望举例 例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下: 试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。 解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 因为EXEY,所以乙射手射击水平比较高;二人各发一弹,得分总和最可能在4.3分左右(即4分或5分),例2:,3、数学期望的性质,(1)如果a、b为常数,则 E(aX+b)=aE(X)+b (2)如果X、Y为两个随机变量,则 E(X+Y)=E(X)+

9、E(Y) (3)如果g(x)和f(x)分别为X的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X) (4)如果X、Y是两个独立的随机变量,则 E(X.Y)=E(X).E(Y),4、条件期望,条件期望值的定义: 对于连续型随机变量的条件期望只要把加总符号换成积分号即可。,几个重要性质 (1) 一般地 (2) (3)重期望律: 例:已知 , 则,二、方差:离散程度的度量,1、随机变量方差的定义 若X为连续型随机变量,则X的方差以下式给出 随机变量的方差记作Var(x) 。方差的算术平方根叫标准差。,2、方差的性质,(1)Var(c )=0 (2)Var(c+x)=Var(x ) (3)Va

10、r(cx)=c2Var(x) (4)x, y为相互独立的随机变量,则 Var(x+y)=Var(x )+Var(y )=Var(x-y) (5)Var(a+bx)=b2Var(x) (6)a,b为常数,x, y为两个相互独立的随机变量,则Var(ax+by)=a2Var(x)+b2Var(y) (7)Var(x)=E(x2)-(E(x)2,例3 计算本节例1中甲射手的方差,例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下: E(X)=2.1 Var(X)=(- 1.1) 2 0.4+(-0.1)2 0.1+0.92 0.5 = 0.89,三、数学期望与方差的图示,数学期望描

11、述随机变量的集中程度,方差描述随机变量的离散程度。 1 方差同、期望变大 2 期望同、方差变小,5,四、相关系数与协方差,协方差和相关系数都是描述两个随机变量相互关联程度的参数或统计量。 方差是度量一个随机变量变异程度的指标,而协方差则是度量两个随机变量协同变动的指标。要度量两个随机变量之间的关系,自然要考察两个变量同时变化协同变化的情况,于是需要定义协方差。为了弥补协方差的不足受计量单位和数量尺度的影响,进而定义了度量两个随机变量呈线性相关程度的指标相关系数。,1、协方差,(1)定义:令随机变量X和Y的期望分别为E(x),E(y),其协方差为: cov(X,Y)=E(X- E(x)(Y- E

12、(y) =E(XY)-E(X)E(Y) 一般而言,两随机变量的协方差可正可负。若两变量同方向变动,则协方差为正,反之则为负。,(2) 协方差的性质 (1)若随机变量X,Y相互独立,则其协方差为0。 (2)cov(a+bX,c+dY)=bdcov(X,Y) (3)cov(X,X)=var(X) (3)相关变量的方差 若随机变量不是独立的,对于X+Y或X-Y的方差为: Var(X+Y)=var(X)+var(Y)+2cov(X,Y) Var(X-Y)=var(X)+var(Y)-2cov(X,Y) (4)若E(y|x)=E(y), 则Cov(x, y)=0 证明:利用重期望律,2、相关系数,相关系

13、数用 表示,其计算公式为: 从公式可看出两变量的相关系数等于它们的协方差与其各自的标准差之比。 相关系数介于-1到1之间。 相关系数的典型图形见P31,五、偏度(skewness)与峰度(kurtosis),用于描述概率密度函数形状的数字特征。偏度(S)是对称性的度量;峰度(K)是概率密度函数高低或胖瘦的度量 1、偏度(S)的计算 对于正态分布,S0;若偏度S的值为正,则其概率密度为正偏或右偏,分布函数有长的右尾;若S的值为负,则其概率密度为负偏或左偏,分布函数有长的左尾。,2、峰度(K)的计算 概率密度函数的峰度K小于3时,成为低峰态的(胖的或短尾的),峰度K大于3时,称为尖峰态的(瘦的或长

14、尾的)。对于正态分布的峰度为3,称为常峰态的。,五、偏度(skewness)与峰度(kurtosis),2.4 样本分布的数字特征,一、样本平均数 总体的数字特征是一个固定不变的数,称为参数;样本的数字特征是随抽样而变化的数,是一个随机变量,称为统计量。 样本平均数的定义:对于样本x1, x2, ,xn , 则样本平均数为 样本平均数用来描述样本的平均水平(一般水平)。,二、样本方差和标准差,1、定义:对于样本x1, x2, ,xn , 则称 分别为样本方差和标准差。 2、样本序列的正态性检验 偏度: 峰度:,检验样本序列的正态性可采用Jarque-Bera检验。该检验的零假设是样本服从正态分

15、布,检验统计量为 其中m是产生样本序列时用到的估计系数的个数。在零假设下JB统计量服从2(2) 分布。若为原始数据则m=0; 若序列是通过模型估计得到的,m为估计的参数个数。,2、样本序列的正态性检验,检验的显著性水平 虚拟假设:H0;对立假设:H1。在假设检验中存在两类错误:拒绝一个其实是真的虚拟假设,即第类错误;第 类错误是指H0实际上是错误的,但没有拒绝它。 检验的显著性水平(significance level)则定义为第类错误的概率,用符号表示为: P(拒绝H0 | H0) 即当H0为真时拒绝H0的概率。 检验的p值 检验的p值(p-value)是指给定t统计量的观测值,能拒绝虚拟假

16、设的最小显著性水平。小的p值是拒绝虚拟假设的证据。,检验的显著性水平和p值,例如:样本序列取2002年我国30个地区以1978年为基衡量的实际人均GDP,采用Eviews软件计算有 S2.32 K=8.53 JB=65.29 p-value=0.00 则2002年各地区人均GDP呈现右偏、尖峰的分布形态,并且在99%的置信水平下拒绝零假设,即序列不服从正态分布。,三、样本协方差,1、协方差的定义式 若样本容量足够大,可用pij=1/n, 那么,2协方差的缺陷,(1)协方差是一个有单位的指标。例如,Y为身高(厘米),X为体重(千克),那么它们的协方差COV(Y,X)的单位为厘米.千克。所以不便于用作相互比较。 (2)协方差受数据尺度的影响。例如,Y为身高(毫米),X为体重(克),那么它们的协方差COV(Y,X)的单位为毫米.克。同一组数据计算出来

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号