计量经济学第二讲计量经济分析的统计学基础课件

上传人:新** 文档编号:567677120 上传时间:2024-07-22 格式:PPT 页数:109 大小:1.33MB
返回 下载 相关 举报
计量经济学第二讲计量经济分析的统计学基础课件_第1页
第1页 / 共109页
计量经济学第二讲计量经济分析的统计学基础课件_第2页
第2页 / 共109页
计量经济学第二讲计量经济分析的统计学基础课件_第3页
第3页 / 共109页
计量经济学第二讲计量经济分析的统计学基础课件_第4页
第4页 / 共109页
计量经济学第二讲计量经济分析的统计学基础课件_第5页
第5页 / 共109页
点击查看更多>>
资源描述

《计量经济学第二讲计量经济分析的统计学基础课件》由会员分享,可在线阅读,更多相关《计量经济学第二讲计量经济分析的统计学基础课件(109页珍藏版)》请在金锄头文库上搜索。

1、经济社会仿真实验室主任经济社会仿真实验室主任经济社会仿真实验室主任经济社会仿真实验室主任电话电话电话电话: :8610-622889718610-62288971Email: Email: 二二二二八年三月七日八年三月七日八年三月七日八年三月七日第二讲第二讲计量经济分析的统计学基础计量经济分析的统计学基础计量经济学计量经济学Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件计量经济分析的统计学基础计量经济分析的统计学基础 本章是对计量经济学所用到的统计学概念和方法作本章是对计量经济学所用到的统计学概念和方法作一概括性

2、的回顾,这些概念和方法对理解本书后面的内一概括性的回顾,这些概念和方法对理解本书后面的内容是至关重要的。容是至关重要的。第一节第一节第一节第一节概率和概率分布概率和概率分布概率和概率分布概率和概率分布第二节第二节第二节第二节统计推断统计推断统计推断统计推断第三节第三节第三节第三节参数估计参数估计参数估计参数估计第四节第四节第四节第四节假设检验假设检验假设检验假设检验Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件1 1 1 1概率的概念:概率的概念:概率的概念:概率的概念: 一枚硬币有正、反两面,在抛之前出现正面还

3、是反面的一枚硬币有正、反两面,在抛之前出现正面还是反面的结果是无法确知的,但却可以依据硬币的物理特征为可能出结果是无法确知的,但却可以依据硬币的物理特征为可能出现的结果指定一个概率。如一枚完好的硬币,它的正面和反现的结果指定一个概率。如一枚完好的硬币,它的正面和反面都有同等机会出现,从而出现正面或反面的概率是面都有同等机会出现,从而出现正面或反面的概率是2 2种情况种情况中的一种,所以是中的一种,所以是1/21/2。第一节、概率和概率分布第一节、概率和概率分布n n数学概率和统计概率:数学概率和统计概率:数学概率和统计概率:数学概率和统计概率:uu数学概率:数学概率:数学概率:数学概率:不靠试

4、验而从理论上求得的概率。不靠试验而从理论上求得的概率。uu统计概率:统计概率:统计概率:统计概率:从多次试验得到的概率。从多次试验得到的概率。 统计概率与数学概率相近的是大数法则。统计概率与数学概率相近的是大数法则。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件一、概率的概念一、概率的概念1.1.1.1.随机试验和事件:随机试验和事件:随机试验和事件:随机试验和事件: 随机试验是导致至少两种可能结果的过程,并且随机试验是导致至少两种可能结果的过程,并且在此过程中将出现何种结果是不确定的。在此过程中将出现何种结果是

5、不确定的。uu样本空间或总体:样本空间或总体:样本空间或总体:样本空间或总体:一个随机试验的所有可能结果一个随机试验的所有可能结果的集合。的集合。uu样本点:样本点:样本点:样本点:样本空间的每个成员。样本空间的每个成员。uu事件:事件:事件:事件:样本空间的子集。样本空间的子集。uu互不相容或互不相容或互斥事件:互斥事件:互斥事件:互斥事件:两个事件中一个事件的发两个事件中一个事件的发生排除另一个事件的发生。生排除另一个事件的发生。uu完备事件:完备事件:完备事件:完备事件:若干个事件包罗了一个试验的所有可若干个事件包罗了一个试验的所有可能的结果。能的结果。Friday, 7 March 2

6、008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件一、概率的概念一、概率的概念2.2.2.2.总体和样本:总体和样本:总体和样本:总体和样本:uu给定的给定的一组观测值一组观测值一组观测值一组观测值通常被视为是从某个更大的总体中抽取的通常被视为是从某个更大的总体中抽取的一个样本一个样本一个样本一个样本。总体可以是有限的,也可以是无限的。有限总体。总体可以是有限的,也可以是无限的。有限总体可能很大,也可能很小。为计算方便,大总体有时可假定为可能很大,也可能很小。为计算方便,大总体有时可假定为无限总体无限总体无限总体无限总体。uu样本是总体的一部分。样本

7、是总体的一部分。样本是总体的一部分。样本是总体的一部分。之所以需要抽取样本,是因为在有些之所以需要抽取样本,是因为在有些情况下,当分析某个变量的特征时,涉及的总体容量太大,情况下,当分析某个变量的特征时,涉及的总体容量太大,以至于不可能对整个总体进行检查;或者这样做耗费太大,以至于不可能对整个总体进行检查;或者这样做耗费太大,因而只能使用观测样本。因而只能使用观测样本。uu样本是总体的代表。样本是总体的代表。样本是总体的代表。样本是总体的代表。假定样本能够反映要研究的总体特征,假定样本能够反映要研究的总体特征,因此可以依据样本来推断总体。因此可以依据样本来推断总体。例如,为研究所有北京人的平均

8、收入,很显然需要全体北京例如,为研究所有北京人的平均收入,很显然需要全体北京人(总体)的数据。可是,要收集每个人的收入是一件很困人(总体)的数据。可是,要收集每个人的收入是一件很困难的事。在实践中,可以抽取一个由难的事。在实践中,可以抽取一个由50005000人组成的随即样本,人组成的随即样本,然后计算这然后计算这50005000人的平均收入,作为北京人的真实平均收入人的平均收入,作为北京人的真实平均收入的估计值。的估计值。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件一、概率的概念一、概率的概念3.3.3.3.

9、事件的概率:事件的概率:事件的概率:事件的概率:uu概率的古典定义概率的古典定义概率的古典定义概率的古典定义【拉普拉斯(拉普拉斯(1749174918271827)】: 设一试验有设一试验有n n个互不相容的等可能的结果(每个结果称个互不相容的等可能的结果(每个结果称为基本事件),每次试验必有一基本事件发生。为基本事件),每次试验必有一基本事件发生。m m为事件为事件A A中中包含的基本事件个数。则称比值包含的基本事件个数。则称比值m/nm/n为事件为事件A A的概率,记作的概率,记作P(A) = P(A) = 。mnuu概率的统计定义概率的统计定义概率的统计定义概率的统计定义: 在相同的条件

10、下进行在相同的条件下进行n n次试验,设事件次试验,设事件A A出现了出现了m m次。如次。如果当试验次数果当试验次数n n充分大时,事件充分大时,事件A A的频率的频率m/nm/n具有持久的稳定具有持久的稳定性,则称事件性,则称事件A A是有概率的。是有概率的。A A的概率记为的概率记为P(A),P(A),则则P(A) P(A) 。mnFriday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件一、概率的概念一、概率的概念4.4.4.4.概率的性质:概率的性质:概率的性质:概率的性质:uu0P(A)10P(A)1对所有对所有

11、A A成立成立。P(A)=0 P(A)=0 表明事件表明事件A A是不可能事件;是不可能事件;P(A)=1 P(A)=1 表明事件表明事件A A是必然事件。是必然事件。一般情况下,概率值在一般情况下,概率值在0 01 1之间。之间。uu若若A A,B B,C C,是完备事件集,则是完备事件集,则P(A + B + C + ) = 1P(A + B + C + ) = 1。其中:其中:A + B + CA + B + C的含义是的含义是A A或或B B或或C C,等等。,等等。uu若若A A,B B,C C,是互不相容事件,则是互不相容事件,则P(A + B + C + ) = P(A) + P

12、(B) + P(C) + P(A + B + C + ) = P(A) + P(B) + P(C) + 。uu若若A BA B(即事件(即事件B B包含事件包含事件A A),则),则P(A)P(B)P(A)P(B)。uu若事件若事件A A是是A A的对立事件,则的对立事件,则P(A) + P(A) = 1P(A) + P(A) = 1。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件二、随机变量与概率分布二、随机变量与概率分布1.1.1.1.随机变量:随机变量:随机变量:随机变量: 可以在一个特定的数集中按一定概率

13、取值的变量。可以在一个特定的数集中按一定概率取值的变量。“A “A random variablerandom variable is a variable that takes on alternative values, is a variable that takes on alternative values, each with a probability less than or equal to 1.” each with a probability less than or equal to 1.” PindyckPindyck, R.S. et. Al. , R.S. et.

14、 Al. (1991, p.19)(1991, p.19)uu离散随机变量:离散随机变量:离散随机变量:离散随机变量:只能取某些离散值。只能取某些离散值。“A “A discrete random variablediscrete random variable may take on only a specific number of may take on only a specific number of real values”, real values”, Pindyck, R.S. et. Al. (1991, p.19)Pindyck, R.S. et. Al. (1991, p

15、.19)如:掷骰子所得点数(如:掷骰子所得点数(1 1,2 2,3 3,4 4,5 5,6 6)。)。随机变量通常用大写字母随机变量通常用大写字母X, Y, ZX, Y, Z来表示,它们所取的值用小来表示,它们所取的值用小写字母写字母x, y, zx, y, z等表示。等表示。uu连续随机变量:连续随机变量:连续随机变量:连续随机变量:可以取一个有限(或无限)区间所有值。可以取一个有限(或无限)区间所有值。“A “A continuous random variablecontinuous random variable may take on any value on the real ma

16、y take on any value on the real number line”, number line”, Pindyck, R.S. et. Al. (1991, p.19)Pindyck, R.S. et. Al. (1991, p.19)如:零件的直径。如:零件的直径。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件二、随机变量与概率分布二、随机变量与概率分布2.2.2.2.随机变量的概率分布和概率密度函数:随机变量的概率分布和概率密度函数:随机变量的概率分布和概率密度函数:随机变量的概率分布和概

17、率密度函数: 一个随机变量的一个随机变量的概率分布:概率分布:概率分布:概率分布:是该随机变量取给定值或属于是该随机变量取给定值或属于一给定值集的概率所确定的函数。概率分布反映的是随机一给定值集的概率所确定的函数。概率分布反映的是随机变量所有可能取值的概率的分配方式。一旦与所有可能结变量所有可能取值的概率的分配方式。一旦与所有可能结果相联系的概率被确定,则概率分布即完全被确定。果相联系的概率被确定,则概率分布即完全被确定。“We can describe a random variable by examining the “We can describe a random variable

18、by examining the process which generates its values. This process, called a process which generates its values. This process, called a probability distributionprobability distribution, lists all possible outcomes and the , lists all possible outcomes and the probability that each will occur.” probab

19、ility that each will occur.” PindyckPindyck, R.S. et. Al. (1991, , R.S. et. Al. (1991, p.19)p.19)Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件二、随机变量与概率分布二、随机变量与概率分布1.1.1.1.离散随机变量的概率离散随机变量的概率离散随机变量的概率离散随机变量的概率分布分布分布分布函数(函数(函数(函数(PDFPDF,probability probability distributiondistributi

20、on function function):):):):设设X X为取相异值为取相异值x x1 1,x,x2 2,x xn n,的离散随机变量,则函数的离散随机变量,则函数f(xf(x)=)=称为称为X X的概率分布或概率分布函数的概率分布或概率分布函数, ,其中其中P(X=xP(X=xi i) )为离散随机为离散随机变量变量X X取取x xi i值的概率。值的概率。p(X=xp(X=xi i),),i=1,2,n,i=1,2,n,0,0,XxXxi iFriday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件二、随机变量与

21、概率分布二、随机变量与概率分布2.2.2.2.连续随机变量的概率连续随机变量的概率连续随机变量的概率连续随机变量的概率密度密度密度密度函数(函数(函数(函数(PDFPDF,probability probability densitydensity function function):):):):设设X X为连续随机变量,且满足下列条件:为连续随机变量,且满足下列条件:f(x)0f(x)0 f(x)dxf(x)dx = 1 = 1 f(x)dxf(x)dx = = P(aP(axbxb) )则则f(xf(x) )称为称为X X的概率密度函数的概率密度函数, ,其中其中P(aP(axxb b)

22、 )表示表示X X位于区间(位于区间(a,ba,b 之中的概率。之中的概率。-b ba a连续随机变量与离散随机变量不同,连续随机变量与离散随机变量不同,X X取任何指定值的概率被认为是取任何指定值的概率被认为是零,只有取某一范围(或区间)的值的概率值才有意义。零,只有取某一范围(或区间)的值的概率值才有意义。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件三、概率分布的特征三、概率分布的特征概率分布常用两个概括性测度概率分布常用两个概括性测度期望值(集中趋势测度)期望值(集中趋势测度)期望值(集中趋势测度)期望值

23、(集中趋势测度)和和方差(离散测度)方差(离散测度)方差(离散测度)方差(离散测度)来描述。来描述。1. 1.期望值(期望值(期望值(期望值(expected valueexpected value):):):):a. a.离散随机变量离散随机变量X X的的期望值期望值期望值期望值,记作,记作E(X) E(X) ,也叫做它的,也叫做它的均值均值均值均值,记作记作 x x,定义为:,定义为: x xE(X)=pE(X)=p1 1X X1 1+p+p2 2X X2 2+ + +p pN NX XN N= = p pi iX Xi i 或或 x xE(X)=E(X)= xf(xxf(x) ) 式中,

24、式中, p pi i=1=1, , f(xf(x) )为为X X的概率分布函数。的概率分布函数。 由上述定义不难看出,随机变量的期望值是其所有可能的值由上述定义不难看出,随机变量的期望值是其所有可能的值的的加权平均加权平均加权平均加权平均,权数是这些值的概率。,权数是这些值的概率。b. b.连续随机变量的连续随机变量的期望值期望值期望值期望值定义为:定义为: x xE(X)=E(X)=xf(x)dxxf(x)dx 它与离散随机变量期望值的唯一区别是用积分号代替求和号。它与离散随机变量期望值的唯一区别是用积分号代替求和号。N Ni=1i=1x x-Friday, 7 March 2008计量经济

25、学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件三、概率分布的特征三、概率分布的特征2. 2.期望的性质(期望的性质(期望的性质(期望的性质(properties of the expectations properties of the expectations operatoroperator):):):):I. I.若若b b为常数,则为常数,则E(bE(b) )b;b;II.II.设设X X为随机变量,为随机变量,a a和和b b为常数,则为常数,则 E(aXE(aX + b) = + b) = aE(XaE(X) + b;) + b;III.III.设

26、设X X为随机变量,为随机变量,a a为常数,则为常数,则IV.IV.E(aX)E(aX)2 2 = a = a2 2E(XE(X2 2); );IV.IV.若若X X和和Y Y为独立随机变量,则为独立随机变量,则 E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件三、概率分布的特征三、概率分布的特征3. 3.方差(方差(方差(方差(variancevariance):):):): 一随机变量的方差通常用来度量该随机变量诸值对其均值一随机变量的方差通常用来度量

27、该随机变量诸值对其均值的离散趋势。的离散趋势。(The variance of a random variable provides a measure of the The variance of a random variable provides a measure of the spread, or dispersion, around the mean.spread, or dispersion, around the mean.)设设X X为一随机变量,且为一随机变量,且E(X)=E(X)= ,则,则X X的方差,记作的方差,记作 2 2,定,定义为:义为:Var(XVar(X)

28、= ) = 2 2 = E(X - = E(X - ) )2 2 。 2 2的正平方根的正平方根 称为称为X X的的标准差标准差标准差标准差。方差和标准差都是用来描。方差和标准差都是用来描述随机变量诸值的分散程度。方差可用下式计算:述随机变量诸值的分散程度。方差可用下式计算:a. a.若若X X为离散随机变量,则:为离散随机变量,则:Var(XVar(X) ) 2 2 = = p pi iXXi i-E(X)-E(X)2 2; ; 或或Var(XVar(X) ) 2 2 = = (X-(X- ) )2 2f(x)f(x)。b. b.若若X X为连续随机变量,则:为连续随机变量,则: Var(X

29、Var(X) ) 2 2 = =(X-(X- ) )2 2f(x)dxf(x)dx。x x-N Ni=1i=1Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件三、概率分布的特征三、概率分布的特征4. 4.方差的性质(方差的性质(方差的性质(方差的性质(properties of the varianceproperties of the variance):):):):I. I.Var(XVar(X) )E(X-E(X- ) )2 2=E(X=E(X2 2)- )- 2 2; ;II.II.常数的方差为常数的方差为

30、0 0; ;III.III.若若a a和和b b为常数,则为常数,则IV.IV.Var(aX+bVar(aX+b)= a)= a2 2Var(X);Var(X);IV.IV.若若X X和和Y Y为独立随机变量,则为独立随机变量,则 Var(X+YVar(X+Y)=)=VarVar(X)+(X)+VarVar(Y(Y) )。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件三、概率分布的特征三、概率分布的特征5. 5.协方差(协方差(协方差(协方差(covariancecovariance):):):):若若X X和和

31、Y Y为两随机变量,均值分别为为两随机变量,均值分别为 x x和和 y y,则两变量的,则两变量的协方差定义为协方差定义为Cov(XCov(X,Y)Y)E(X-E(X- x x)(Y-)(Y- y y) )= =p pij ij(X(Xi i-E(X)(Y-E(X)(Yi i-E(Y-E(Y) ); ;其中,其中,p pij ij代表代表X X和和Y Y的联合概率。的联合概率。N Ni=1i=1N Nj=1j=1结果结果概率概率结果结果概率概率X=X=¥5,000, Y=15,000, Y=10 0X=X=¥10,000, Y=010,000, Y=01/81/8X=X=¥5,000, Y=0

32、5,000, Y=01/41/4X=X=¥15,000, Y=115,000, Y=11/31/3X=X=¥10,000, Y=110,000, Y=11/81/8X=X=¥15,000, Y=015,000, Y=01/61/6联合概率是由对应于两随机变量发生的所有可能结果联合概率是由对应于两随机变量发生的所有可能结果的一组概率来描述的。所有这些概率均为非负,且加的一组概率来描述的。所有这些概率均为非负,且加总为总为1 1。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件三、概率分布的特征三、概率分布的特征n n

33、若若若若X X和和和和Y Y为独立随机变量,则为独立随机变量,则为独立随机变量,则为独立随机变量,则Cov(XCov(X, Y)=0, Y)=0。注:两随机变量的协方差可能为注:两随机变量的协方差可能为0 0,但彼此并不独立。,但彼此并不独立。X X2 21 10 01 12 2Y Y4 41 10 01 14 4所有观测值假定拥有同一概率(所有观测值假定拥有同一概率(1/51/5)。在这种情况下,)。在这种情况下,E(X)=0E(X)=0,E(Y)=2E(Y)=2,且,且Cov(X, Y) = Cov(X, Y) = X Xi i(Y(Yi i-2) = 0-2) = 0。但显然但显然X X

34、和和Y Y并不独立。实际上,并不独立。实际上,Y=XY=X2 2。5 5i=1i=1Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件三、概率分布的特征三、概率分布的特征6.6.6.6.相关系数(相关系数(相关系数(相关系数(correlation coefficientcorrelation coefficient):):):):两随机变量两随机变量X X和和Y Y的总体的总体相关系数相关系数相关系数相关系数 xyxy定义为:定义为: xyxy 相关系数与变量单位无关,是度量两变量之间相关系数与变量单位无关,是度量

35、两变量之间线性关线性关线性关线性关系系系系强度的测度,其值在强度的测度,其值在1 1和和1 1之间,即之间,即11 11。Cov(X, Y)Cov(X, Y) Cov(X, Y) Cov(X, Y) Var(X)Var(Y)Var(X)Var(Y) x xy y_00 xyxy11- -11 xyxy00 xyxy=0=0 xyxy=1=1 xyxy=-1=-1Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件三、概率分布的特征三、概率分布的特征6.相关变量的方差相关变量的方差相关变量的方差相关变量的方差设设X X和

36、和Y Y是两随机变量,则是两随机变量,则: Var(X+YVar(X+Y)=Var(X)+Var(Y)+2Cov(X, Y)=Var(X)+Var(Y)+2Cov(X, Y);Var(XVar(X-Y)=Var(X)+Var(Y)-2Cov(X, Y)-Y)=Var(X)+Var(Y)-2Cov(X, Y)。证明:证明:Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件四、样本均值、方差、协方差和四、样本均值、方差、协方差和相关系数相关系数1.1.1.1.样本均值样本均值样本均值样本均值 ( ( ( (sample

37、meansample mean) ) ) )随机变量随机变量X X的均值的一个无偏估计量,记作的均值的一个无偏估计量,记作X X,定义为,定义为: 所谓无偏估计量是指待估计参数的估计量的期望值等于参数所谓无偏估计量是指待估计参数的估计量的期望值等于参数本身。本身。2.2.2.2.样本方差样本方差样本方差样本方差( ( ( (sample variancesample variance) ) ) )和标准差和标准差和标准差和标准差( ( ( (sample sample standard deviationstandard deviation) ) ) )随机变量随机变量X X的方差及其标准差的

38、一个无偏估计量定义为的方差及其标准差的一个无偏估计量定义为样本方差:样本方差:样本标准差:样本标准差: Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件四、样本均值、方差、协方差和四、样本均值、方差、协方差和相关系数相关系数Pindyck, R.S. and D.L. Rubinfeld (1998), Pindyck, R.S. and D.L. Rubinfeld (1998), Econometric Econometric Models and Economic ForecastsModels and Ec

39、onomic Forecasts 4th ed., pp. 24-5: 4th ed., pp. 24-5:“Why do we divide by N-1 (rather than N) to get an unbiased “Why do we divide by N-1 (rather than N) to get an unbiased estimate of the sample variance? an intuitive answer can estimate of the sample variance? an intuitive answer can be based on

40、the concept of be based on the concept of degrees of freedomdegrees of freedom. Our sample is . Our sample is known to contain N data points. However, in computing the known to contain N data points. However, in computing the sample variance a necessary first step was the computation of sample varia

41、nce a necessary first step was the computation of the sample mean. This places one constraint upon the N data the sample mean. This places one constraint upon the N data points, that the N observations sum to N times the computed points, that the N observations sum to N times the computed mean . Thi

42、s leaves N-1 unconstrained observations with which mean . This leaves N-1 unconstrained observations with which to estimate the sample variance.”to estimate the sample variance.”Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件四、样本均值、方差、协方差和四、样本均值、方差、协方差和相关系数相关系数3.3.3.3.样本协方差样本协方差样本协方

43、差样本协方差 ( ( ( (sample covariancesample covariance) ) ) )测量测量X X和和Y Y的观测值共变(一起变动)程度的一个测度,的观测值共变(一起变动)程度的一个测度,定义为定义为: 4.4.4.4.样本相关系数样本相关系数样本相关系数样本相关系数( ( ( (sample correlation coefficientsample correlation coefficient) ) ) )更为常用,定义为:更为常用,定义为: 式中:式中:S Sxyxy为为X X和和Y Y的协方差;的协方差;S Sx x和和S Sy y分别为分别为X X和和Y

44、Y的标准差。的标准差。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件五、五、几个重要的理论概率分布几个重要的理论概率分布1 1二项分布二项分布二项分布二项分布(Binomial DistributionBinomial Distribution)2 2普哇松分布普哇松分布普哇松分布普哇松分布(Poisson DistributionPoisson Distribution)3 3正态分布正态分布正态分布正态分布(Normal DistributionNormal Distribution)4 4 2 2 2 2分

45、布分布分布分布( 2 Distribution2 Distribution)5 5t t t t分布或学生分布分布或学生分布分布或学生分布分布或学生分布(t Distribution or Student t Distribution or Student DistributionDistribution)6 6F F F F分布分布分布分布(F DistributionF Distribution )Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件五、几个重要的理论概率分布五、几个重要的理论概率分布1.二项分布二

46、项分布二项分布二项分布(Binomial DistributionBinomial Distribution) 若离散随机变量若离散随机变量X X取值取值0,1,n0,1,n,并存在数,并存在数p p(0p10p00), , 使使: P(X=k)= eP(X=k)= e- - ; k = 0, 1, 2, ; k = 0, 1, 2, 则称则称X X服从普哇松分布,此时有:服从普哇松分布,此时有: E(X)=E(X)= ; ; Var(XVar(X)=)= 。k kk!k!Simon-Denis Poisson Simon-Denis Poisson (1781-1840)(1781-1840

47、),法国数,法国数学家学家Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2.普哇松分布(普哇松分布(Poisson Distribution)举例:举例:举例:举例: 大连港区大连港区19791979年载货年载货500500吨以上船只共到达吨以上船只共到达12711271艘(不包括定期到达的船舶)艘(不包括定期到达的船舶), ,到到达统计分布表列于下表上。达统计分布表列于下表上。 首先根据原始资料做出船舶到达的分布表,然后按照统计学方法确定其符合于那首先根据原始资料做出船舶到达的分布表,然后按照统计学方法确定其符

48、合于那种理论分布,并估计它的参数。种理论分布,并估计它的参数。 表表表表2 2 2 2:船舶到达分布表:船舶到达分布表:船舶到达分布表:船舶到达分布表船舶到达数船舶到达数天数天数频率频率 n n0 012120.0330.0331 143430.1180.1182 264640.1750.1753 374740.2030.2034 471710.1950.1955 549490.1340.1346 626260.0710.0717 719190.0520.0528 84 40.0110.0119 92 20.0050.0051010以上以上1 10.0030.003合计合计3653651.00

49、01.000Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件图图图图4 4 4 4:到达数经验分布:到达数经验分布:到达数经验分布:到达数经验分布2.普哇松分布(普哇松分布(Poisson Distribution)Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件 平均到达率平均到达率( () = = 3.483.48(艘(艘/ /天)天)这种分布为泊哇松分布(推导略)。这种分布为泊哇松分布(推导略)。 平均间隔平均间隔1/3.481/

50、3.48天有一艘船到达。天有一艘船到达。2.普哇松分布(普哇松分布(Poisson Distribution)到达总数到达总数总天数总天数12711271365365Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2.泊哇松分布的故事泊哇松分布的故事他怎么啦?他怎么啦?Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件十十九九世世纪纪时时,巴巴特特开开惠惠茨茨根根据据普普鲁鲁士士骑骑兵兵队队的的统统计计报报告告,对对十十个个骑骑兵兵连连中

51、中的的骑骑兵兵在在二二十十年年中中被被马马踢踢死死的的记记录录作作了了分分析析。这这样样,他他的的观观察察数数值值有有10*20=20010*20=200个个(每每年年对对每每个个连连队队作作一一个个记记录录),他他作作了了一一个个表表,列列出出死死亡亡人人数数的的分分布布情情况。况。问题:问题:你也能列个表吗?你也能列个表吗?泊哇松分布的故事泊哇松分布的故事Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件从这个表里可以看出,死亡事件共从这个表里可以看出,死亡事件共 0*109+1*65+2*22+3*3+4*1=

52、 122 0*109+1*65+2*22+3*3+4*1= 122(人次)。(人次)。平均每连队每年死亡人次为平均每连队每年死亡人次为 = Ex = 122/200 = 0.61 = Ex = 122/200 = 0.61可见,被马踢死的概率很小啊!可见,被马踢死的概率很小啊! 为单位时间内的平均死亡人数。为单位时间内的平均死亡人数。泊哇松分布的故事泊哇松分布的故事Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件再依据再依据再依据再依据POISSON PROCESSPOISSON PROCESSPOISSON PR

53、OCESSPOISSON PROCESS计算其频率:计算其频率:计算其频率:计算其频率:P(X=k)= e-P(X=k)= e-P(X=k)= e-P(X=k)= e-; k=0,1,2,; k=0,1,2,; k=0,1,2,; k=0,1,2,P(X=0)=e-0.61=0.544P(X=0)=e-0.61=0.544P(X=0)=e-0.61=0.544P(X=0)=e-0.61=0.544P(X=1)=0.61e-0.61=0.331P(X=1)=0.61e-0.61=0.331P(X=1)=0.61e-0.61=0.331P(X=1)=0.61e-0.61=0.331P(X=2)=0

54、.612e-0.61/2!=0.101P(X=2)=0.612e-0.61/2!=0.101P(X=2)=0.612e-0.61/2!=0.101P(X=2)=0.612e-0.61/2!=0.101P(X=3)=0.613e-0.61/3!=0.021P(X=3)=0.613e-0.61/3!=0.021P(X=3)=0.613e-0.61/3!=0.021P(X=3)=0.613e-0.61/3!=0.021P(X=4)=0.614e-0.61/4!=0.003P(X=4)=0.614e-0.61/4!=0.003P(X=4)=0.614e-0.61/4!=0.003P(X=4)=0.61

55、4e-0.61/4!=0.003简直太相似了!简直太相似了!简直太相似了!简直太相似了!k kk!k!泊哇松分布的故事泊哇松分布的故事Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件五、几个重要的理论概率分布五、几个重要的理论概率分布3.3.正态正态正态正态分布分布分布分布(N No or rmal Distributionmal Distribution)若一个连续随机变量若一个连续随机变量X X的概率密度函数为的概率密度函数为: ( (0); -X0); -X+则称则称X X服从正态分布,并记为服从正态分布,并

56、记为X XN(N( , ,2 2) ),此时,此时有:有: 、e e是常数。是常数。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件正态分布的性质(正态分布的性质(正态分布的性质(正态分布的性质(Properties of the NormalProperties of the Normal)uu关于其均值(关于其均值(关于其均值(关于其均值( )的对称性的对称性的对称性的对称性正态分布(Nominal) 3.正态分布正态分布 (Normal Distribution)Lower Spec LimitUpper S

57、pec Limit对称钟型X X-3-3 -2-2 - - 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3X X 2 2 1 1 3 3 1 1 2 2 3 3X XFriday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件正态分布的性质(正态分布的性质(正态分布的性质(正态分布的性质(Properties of the NormalProperties of the Normal)uu正态曲线下的面积正态曲线下的面积正态曲线下的面积正态曲线下的面积:大约大约6868的面积位于的面积位于 之间,大约之间,大约

58、9595的面积位的面积位于于 2 2之间,大约之间,大约99.799.7的面积位于的面积位于 3 3之间。之间。95.46%68.26%正态分布(Nominal)3.正态分布正态分布 (Normal Distribution)Lower Spec LimitUpper Spec Limit99.74% X X-3-3 -2-2 - - 2 2 3 3 34%34%14%14%2%2%Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件MeanMean2 Parts per 2 Parts per BillionBill

59、ionC Cp p( (Process Capability IndexProcess Capability IndexProcess Capability Index) = 2) = 2 Lower Specification Limit Upper Specification LimitSix Sigma Is Virtual PerfectionDefectsDefects99.9999998%Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件正态分布的性质(正态分布的性质(正态分布的性质(正态分布的性质(Pr

60、operties of the NormalProperties of the Normal)uu正态分布完全被它的两个参数正态分布完全被它的两个参数 和和所描述,且正态分布曲线的所描述,且正态分布曲线的拐点拐点(points of inflexion)(points of inflexion)在在X X 。uuX X可以取任意实数值,且当可以取任意实数值,且当X X时,时,f(Xf(X) )趋近于趋近于X X轴。轴。3.正态分布正态分布 (Normal Distribution) 1 1= = 2 2= = 1 12)(K2)。KK-20 0概率N(0,1)t(10)t tt(30)图图2

61、23 3:t t分布分布-3-3-2-2-1-11 12 23 3Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件五、几个重要的理论概率分布五、几个重要的理论概率分布6.6.F F分布分布(The F DistributionThe F Distribution)有时候,我们需要做包含两个或两个以上回归参数的联合有时候,我们需要做包含两个或两个以上回归参数的联合假设检验假设检验( (joint hypotheses testjoint hypotheses test),),这时就要用到这时就要用到F F分布。分布。

62、如:检验需求函数中截矩如:检验需求函数中截矩( ( ) )和斜率和斜率( ( ) )是否均为是否均为0 0,还是,还是其中一个,或另一个,或两者均不为其中一个,或另一个,或两者均不为0 0。若若Z Z1 1和和Z Z2 2是独立分布的自由度分别为是独立分布的自由度分别为K K1 1和和K K2 2的的 2 2变量,则:变量,则: 服从自由度为服从自由度为K K1 1和和K K2 2的的F F分布,用分布,用F(KF(K1 1,K,K2 2) )或或F FK K ,K ,K 表示。表示。K K1 1为分子自由度(或要估测参数的数量),为分子自由度(或要估测参数的数量),K K2 2为分母自由度(

63、或为分母自由度(或自由度)。自由度)。1 21 2Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件五、几个重要的理论概率分布五、几个重要的理论概率分布n nF F分布的性质分布的性质 ( (Properties of the F DistributionProperties of the F Distribution) )uu与与 2 2分布一样,分布一样,F F分布也是分布也是向右偏斜向右偏斜,取值范围由取值范围由0 0到正无穷。到正无穷。当当K K1 1和和K K2 2增大时,增大时,F F分布趋向正态分布。分

64、布趋向正态分布。F F分布密度曲线:分布密度曲线:F(10,20)F(50,50)F(100,100)F(2,2)图图2 24 4:F F分布分布Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件五、几个重要的理论概率分布五、几个重要的理论概率分布n nF分布的性质分布的性质 ( (Properties of the F DistributionProperties of the F Distribution) )uuF F分布变量的均值为分布变量的均值为(K K2 222),其方差为),其方差为 ,K K2 244

65、。uu F F分布可用于检验两正态分布随机变量的方差是否相等。分布可用于检验两正态分布随机变量的方差是否相等。K2K2-2Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件计量经济分析的统计学基础计量经济分析的统计学基础第一节第一节第一节第一节概率和概率分布概率和概率分布概率和概率分布概率和概率分布第二节第二节第二节第二节统计推断统计推断统计推断统计推断第三节第三节第三节第三节参数估计参数估计参数估计参数估计第四节第四节第四节第四节假设检验假设检验假设检验假设检验Friday, 7 March 2008计量经济学第二

66、讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件1 1 1 1统计推断的一般问题统计推断的一般问题统计推断的一般问题统计推断的一般问题第二节、统计推断第二节、统计推断uu随机抽样:随机抽样:随机抽样:随机抽样:从总体中随机抽取样本的过程。从总体中随机抽取样本的过程。uu随机样本:随机样本:随机样本:随机样本:如果一个样本是以这样一种方式抽取的如果一个样本是以这样一种方式抽取的 它与具它与具有同样容量为有同样容量为N N的其他任一样本被选取的概率相同。的其他任一样本被选取的概率相同。抽取随机样本的抽取随机样本的基本理由基本理由基本理由基本理由是:与其他任何选取方式相比,

67、这种是:与其他任何选取方式相比,这种样本更可能反映取样总体的特征。样本更可能反映取样总体的特征。n n统计推断的两个分支统计推断的两个分支统计推断的两个分支统计推断的两个分支uu假设检验:假设检验:假设检验:假设检验:判断手中的样本是否可能取自具有确定参数的某判断手中的样本是否可能取自具有确定参数的某类总体,即从样本信息来检验关于总体参数的假设。类总体,即从样本信息来检验关于总体参数的假设。uu参数估计:参数估计:参数估计:参数估计:给定样本,作出总体诸参数可能值的推断,即如给定样本,作出总体诸参数可能值的推断,即如何从样本值估计总体参数。何从样本值估计总体参数。统计推断的这两个分支,即假设检

68、验和参数估计,是紧密相统计推断的这两个分支,即假设检验和参数估计,是紧密相关的。关的。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件(1)单纯随机抽样法)单纯随机抽样法(Simple random sampling)常用方法常用方法常用方法常用方法:uA、抽签法;uB、乱数表法 (randomtable)Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件A、抽签法、抽签法u抽签法:抽签法:抽签法:抽签法:常用一个骰子,这个骰子必须是从常

69、用一个骰子,这个骰子必须是从0-90-9的数字均具有同等的概率,一个立体正的数字均具有同等的概率,一个立体正1010面体的面体的骰子,可以满足需要。骰子,可以满足需要。u例如:要从例如:要从10001000个样本中选出个样本中选出1010个样本,则把这个样本,则把这个骰子转动个骰子转动3 3次,以最先得到的数字为百位,第次,以最先得到的数字为百位,第2 2次为十位,第次为十位,第3 3次为个位,组成一个数,反复转次为个位,组成一个数,反复转动骰子,可得到一组数据,即为样本的序号。动骰子,可得到一组数据,即为样本的序号。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第

70、二讲计量经济分析的统计学基础课件分析的统计学基础课件B、乱数表法、乱数表法乱数表是从骰子之投掷得出来的数字列出的一张表。乱数表是从骰子之投掷得出来的数字列出的一张表。乱数表(部分)乱数表(部分)113219610434600956209454387400800212845472357588477520212773483369357387605123529611048026525406154425187582118913905366562638890479510889470765445077124534810015199.4925678771504684986241855129071235505

71、0514514615879128821090260912080Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件(2)分层随机抽样法)分层随机抽样法(Stratified random sampling)A.A.分分层层比比例例抽抽样样法法:按按分分层层后后各各层层母母体体数数量量的的多多少少作作比例而抽出样本数。比例而抽出样本数。B.B.牛曼牛曼( (NeymanNeyman) )分层抽样法:按各层的变异数的大小,分层抽样法:按各层的变异数的大小,而调整各层的样本数目,以提高样本的依赖程度。而调整各层的样本数目,以

72、提高样本的依赖程度。C.C.戴明戴明(Deming)(Deming)分层抽样法:当各层样本的调查费用分层抽样法:当各层样本的调查费用有显著的差异时,在不十分影响依赖度的前提下,有显著的差异时,在不十分影响依赖度的前提下,而调整各层的样本数目,使调查费用减至最低。而调整各层的样本数目,使调查费用减至最低。D.D.多次分层抽样法:于母体分层之后,对某些层再作多次分层抽样法:于母体分层之后,对某些层再作一次或两次的分层,然后再用随机抽样法抽样。一次或两次的分层,然后再用随机抽样法抽样。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统

73、计学基础课件分层抽样法可以按性别或职业分层;按单位规模大小分层;分层抽样法可以按性别或职业分层;按单位规模大小分层;按消费者所得分层,按年龄分层。按消费者所得分层,按年龄分层。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件(3)分群随机抽样法)分群随机抽样法(Cluster sampling) 又称两面三刀段式分群抽样法。适用于:界质乱度高的又称两面三刀段式分群抽样法。适用于:界质乱度高的母体。因为母体的异质性很高,而且乱度很大,便不能母体。因为母体的异质性很高,而且乱度很大,便不能订立标准分层,只能依其他外观的

74、或地域的来划分成几订立标准分层,只能依其他外观的或地域的来划分成几个群。个群。 案例:拟从某市抽出案例:拟从某市抽出10001000名样本,但无法取得市民名册,名样本,但无法取得市民名册,所有资料只有小区、办事处的名称和数目。假定该市共所有资料只有小区、办事处的名称和数目。假定该市共有有200200个单位的小区、办事处,每一个单位约有个单位的小区、办事处,每一个单位约有2020名居名居民,因此可以小区、办事处为单位,从民,因此可以小区、办事处为单位,从200200个小区、办个小区、办事处中随机抽出事处中随机抽出5050个,并将所抽出的小区、办事处中的个,并将所抽出的小区、办事处中的全体居民作为

75、样本,如此可抽出全体居民作为样本,如此可抽出10001000名样本。名样本。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件(4)系统抽样法)系统抽样法(Systematic random sampling) 又称又称“等距抽样法等距抽样法”。系统抽样法介于机率抽样法和非机。系统抽样法介于机率抽样法和非机率抽样法之间。其第一种样本可以依立意抽样法抽取;亦率抽样法之间。其第一种样本可以依立意抽样法抽取;亦可用随机方式抽取。可用随机方式抽取。 抽样流程:抽样前,须将母体的每一个单位编号,先计算抽样流程:抽样前,须将母体

76、的每一个单位编号,先计算样本区间(即样本区间(即N/mN/m,N N表示母体的数目,表示母体的数目,m m表示样本的大小)表示样本的大小),如果样本区间为分数,可四舍五入化为整数。然后从,如果样本区间为分数,可四舍五入化为整数。然后从1 1到到N/mN/m号中随机抽出一个号码作为第一个样本单位,将第号中随机抽出一个号码作为第一个样本单位,将第一个样本单位的号码加样本区间即得第二个样本单位,依一个样本单位的号码加样本区间即得第二个样本单位,依此类推,直到样本数抽够为止。此类推,直到样本数抽够为止。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学

77、基础课件分析的统计学基础课件 此法适用于常规调查。例如母体样本有此法适用于常规调查。例如母体样本有1000010000个,样本个,样本的大小决定为的大小决定为200200个,则样本区间为个,则样本区间为10000/200=5010000/200=50,假,假如从如从1 1到到5050中我们随机抽出了中我们随机抽出了7 7,则样本单位的号码,则样本单位的号码,依次为依次为7 7,5757,107107,157157,207.207.直到样本达到直到样本达到200200个为止。个为止。 问题:如果从问题:如果从1 1到到5050中我们随机抽出了中我们随机抽出了1616呢?呢? Friday, 7

78、March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件(5)任意抽样法)任意抽样法(Convenience sampling) 任任意意抽抽样样法法是是随随调调查查者者之之方方便便所所选选取取的的样样本本,属属于于非非机机率率抽抽样样。母母体体的的标标志志是是“同同质质”时时,可可用用此此法法,一一般般市市场场调调查多用此法。例如街头作访问调查(看到谁就访问谁)。查多用此法。例如街头作访问调查(看到谁就访问谁)。 优点:使用方便,最省钱。优点:使用方便,最省钱。 缺点:抽样偏差极大,结果极不可靠;通常不应利用一个缺点:抽样偏差极大,结果极不

79、可靠;通常不应利用一个任意样本估计母体参数的数值,因为一个母体中任意样本估计母体参数的数值,因为一个母体中“任意任意”单位极可能和其他单位极可能和其他“不任意不任意”的单位有显著的不同。的单位有显著的不同。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件(6)判断抽样法)判断抽样法( Judgement sampling) “ “立意抽样法立意抽样法” ”:系专家的判断而决定所选的样本。:系专家的判断而决定所选的样本。由法国社会经济学家黎伯莱由法国社会经济学家黎伯莱(Leplay)(Leplay)所创造的一种抽所创

80、造的一种抽样方法。设计调查必须对母体的有关特征具有相当的样方法。设计调查必须对母体的有关特征具有相当的了解。使用这种抽样法应极力避免挑选极端的类型,了解。使用这种抽样法应极力避免挑选极端的类型,而选取而选取“ “多数型多数型” ”或或“ “平均型平均型” ”的样本为调查研究的的样本为调查研究的对象,以期透过对典型样本的研究而了解母体的状态。对象,以期透过对典型样本的研究而了解母体的状态。 适用于母体的构成单位极不相同而样本数很小的情况。适用于母体的构成单位极不相同而样本数很小的情况。在编制物价指数时,有关产品项目的选择及样本地区在编制物价指数时,有关产品项目的选择及样本地区的决定等常采用此法。

81、的决定等常采用此法。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件 优点:由于判断抽样法系依照调查人的需要选定样本,较优点:由于判断抽样法系依照调查人的需要选定样本,较能适合特殊的需要,回收率也较高。能适合特殊的需要,回收率也较高。缺点:如果主观判断偏差,则判断抽样极易发生抽样偏误。缺点:如果主观判断偏差,则判断抽样极易发生抽样偏误。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件(9)配额抽样法)配额抽样法(quota sampli

82、ng)此法适用于一般小的市场调查。此法适用于一般小的市场调查。执行步骤:执行步骤:AA、选择、选择“控制特征控制特征”作为细分母体的标准;作为细分母体的标准;BB、将母体按、将母体按“控制特征控制特征”细分,使分成数个细分,使分成数个子母体。子母体。CC、决定各子母体样本的大小,通常系将总样、决定各子母体样本的大小,通常系将总样子数按各子母体在母体中所占的比例分配;子数按各子母体在母体中所占的比例分配;DD、选择样本单位:各子母体样本数决定后,、选择样本单位:各子母体样本数决定后,即可为每一个调查员指派即可为每一个调查员指派“配额配额”要他在某个子要他在某个子母体中访问一定数额的样本。母体中访

83、问一定数额的样本。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2 2 2 2抽样分布抽样分布第二节、统计推断第二节、统计推断uu抽样误差:抽样误差:抽样误差:抽样误差:随机样本的样本值(统计量)与总体值随机样本的样本值(统计量)与总体值(参数)之间的差异。抽样误差是在样本的选取中(参数)之间的差异。抽样误差是在样本的选取中偶然因素作用的结果。偶然因素作用的结果。uu抽样分布(抽样分布(抽样分布(抽样分布(sampling distributionssampling distributions):):):):假设

84、从一给假设从一给定总体中选取容量为定总体中选取容量为N N的随机样本的过程可以无限次的随机样本的过程可以无限次重复进行,则将产生指定统计量(如均值重复进行,则将产生指定统计量(如均值 )的所有)的所有可能值的一个分布,它是与样本统计量联系在一起可能值的一个分布,它是与样本统计量联系在一起的概率分布。的概率分布。 在统计推断的应用中,必须首先导出有关统计量在统计推断的应用中,必须首先导出有关统计量的抽样分布,这些抽样分布是进行假设检验和参数的抽样分布,这些抽样分布是进行假设检验和参数估计的基础。估计的基础。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分

85、析的统计学基础课件分析的统计学基础课件2 2 2 2抽样分布抽样分布第二节、统计推断第二节、统计推断uu例例例例2.12.1:某厂生产一种直径为某厂生产一种直径为100mm100mm的轴。检验工人的轴。检验工人每批成品中随机抽取一个每批成品中随机抽取一个1616根轴的样本进行检验,根轴的样本进行检验,设该样本的均值为设该样本的均值为110mm110mm,方差为,方差为100mm100mm,试问生,试问生产线是否出了问题?产线是否出了问题?uu分析:分析:分析:分析:这是一个假设检验的问题:根据样本均值这是一个假设检验的问题:根据样本均值110mm110mm,检验总体均值为,检验总体均值为100

86、mm100mm的假设是否正确。的假设是否正确。uu步骤:步骤:步骤:步骤:(1 1)确定该样本均值的抽样分布(如:正态)确定该样本均值的抽样分布(如:正态分布或分布或t t分布);(分布);(2 2)根据抽样分布来计算抽样误差)根据抽样分布来计算抽样误差X X 110-100=10110-100=10出现的概率;如果概率值非常小出现的概率;如果概率值非常小(如(如0.010.01),则说明测试结果不支持原来有关总体均),则说明测试结果不支持原来有关总体均值为值为100100的假设。的假设。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课

87、件分析的统计学基础课件3 3 3 3均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布第二节、统计推断第二节、统计推断uu定理:定理:定理:定理:若若X XN N( , ,2 2),则对于从),则对于从X X的总体中取出的容量为的总体中取出的容量为N N的样本的样本的均值的均值 ,在重复抽样的情况下,有,在重复抽样的情况下,有也就是说,样本均值也就是说,样本均值 的抽样分布是均值为的抽样分布是均值为 , ,方差为方差为2 2/N/N的正态分布。的正态分布。标准误差标准误差标准误差标准误差(standard deviationstandard deviation): : 在实际中,没有理由

88、假定随机变量概率分布的在实际中,没有理由假定随机变量概率分布的方差方差方差方差( (variancevariance) )或或标标标标准差准差准差准差( (standard deviationstandard deviation) )都是已知的。在它们均未知的情况下,对于标都是已知的。在它们均未知的情况下,对于标准差的估计量通常称为准差的估计量通常称为标准误差标准误差标准误差标准误差(standard errorstandard error)。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件3 3 3 3均值的抽样

89、分布均值的抽样分布第二节、统计推断第二节、统计推断uu中心极限定理:中心极限定理:中心极限定理:中心极限定理:若若 为从一均值为为从一均值为 , ,标准差标准差为为的非正态总体中取出的非正态总体中取出N N个独立观测值的随个独立观测值的随机样本的均值机样本的均值,则只要,则只要N N充分大,充分大, 的抽样分的抽样分布近似于均值为布近似于均值为 ,标准差为,标准差为 的正态的正态分布。分布。 中心极限定理将正态总体均值的抽样分布中心极限定理将正态总体均值的抽样分布的定理推广到非正态分布的一般情形。实际的定理推广到非正态分布的一般情形。实际上,对于上,对于N N3030,就可以得到相当满意的近,

90、就可以得到相当满意的近似。但一般来说,原总体对正态分布的偏离似。但一般来说,原总体对正态分布的偏离越大,样本也应当越大。越大,样本也应当越大。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件3 3均值的抽样分布均值的抽样分布第二节、统计推断第二节、统计推断Central Limit TheoremCentral Limit Theorem: As the sample size is : As the sample size is increased, the sampling distribution of th

91、e mean increased, the sampling distribution of the mean approaches the normal distribution in form approaches the normal distribution in form regardless of the form of the population regardless of the form of the population distribution of the individual measurements. distribution of the individual

92、measurements. For practical purposes, the sampling distribution For practical purposes, the sampling distribution of the mean can be assumed to be approximately of the mean can be assumed to be approximately normal whenever the sample size is n30. normal whenever the sample size is n30. (Kazmier, L.

93、 J. (1988), pp.129-130.)(Kazmier, L. J. (1988), pp.129-130.)Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件计量经济分析的统计学基础计量经济分析的统计学基础第一节第一节第一节第一节概率和概率分布概率和概率分布概率和概率分布概率和概率分布第二节第二节第二节第二节统计推断统计推断统计推断统计推断第三节第三节第三节第三节参数估计参数估计参数估计参数估计第四节第四节第四节第四节假设检验假设检验假设检验假设检验Friday, 7 March 2008计量经济学第二讲

94、计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第三节、参数估计第三节、参数估计n n参数估计参数估计参数估计参数估计:由样本数据来估计未知的总体参数的方法。参数估计和由样本数据来估计未知的总体参数的方法。参数估计和假设检验是统计推断的两个重要内容。假设检验是统计推断的两个重要内容。n n估计问题可分为两类:估计问题可分为两类:点估计点估计点估计点估计和和区间估计区间估计区间估计区间估计。1 1 1 1点估计:点估计:点估计:点估计:1.1.1.1.估计量和估计值:估计量和估计值:估计量和估计值:估计量和估计值: 设设X X为一随机变量,其概率密度函数为为一随机变量,其

95、概率密度函数为f(xf(x, , ) ),其中,其中 为该分为该分布的参数。假定,不失一般性,已知概率密度函数(布的参数。假定,不失一般性,已知概率密度函数(PDFPDF)的形)的形式是式是t t分布或正态分布,但不知道分布或正态分布,但不知道 的值。的值。 为估计为估计 的值,从已知分布中抽取一个容量为的值,从已知分布中抽取一个容量为N N的随机样本,的随机样本,然后导出样本值的一个函数(公式):然后导出样本值的一个函数(公式):使得我们可以用该公式提供使得我们可以用该公式提供 的真值的估计值。的真值的估计值。 称为总体参数称为总体参数 的的估计量估计量估计量估计量(Estimator)(E

96、stimator),该估计量所取的一个具体值称为,该估计量所取的一个具体值称为 的一个的一个估计值估计值估计值估计值(Estimate)(Estimate)。显然,。显然, 是告诉我们如何估计是告诉我们如何估计 真值的一种规真值的一种规则或一个公式;是样本数据的函数,是一个则或一个公式;是样本数据的函数,是一个随机变量随机变量随机变量随机变量。 这样得到的估计量称为这样得到的估计量称为点估计量点估计量点估计量点估计量,因为它仅提供,因为它仅提供 的单个的单个(点)估计值。(点)估计值。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分

97、析的统计学基础课件第三节、参数估计第三节、参数估计2.2.2.2.点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point EstimatorsProperties of Point Estimators) 估计量是基础,是计算估计值的公式。估计量和估计值相估计量是基础,是计算估计值的公式。估计量和估计值相比,估计量更重要。比,估计量更重要。“好好”的估计量通常会产生比较接近总的估计量通常会产生比较接近总体参数真值的估计值,而与具体的样本无关。体参数真值的估计值,而与具体的样本无关。uu 估计量的统计性质可分为两类:估计量的统计性质

98、可分为两类:小样本性质小样本性质小样本性质小样本性质和和大样本性大样本性大样本性大样本性质质质质(渐近性质)(渐近性质)(1 1 1 1) 小样本性质小样本性质小样本性质小样本性质:uu无偏性(无偏性(无偏性(无偏性(UnbiasednessUnbiasedness)uu有效性(有效性(有效性(有效性(EfficiencyEfficiency)uu最佳线性无偏性(最佳线性无偏性(最佳线性无偏性(最佳线性无偏性(The Best Linear The Best Linear UnbiasednessUnbiasedness)Friday, 7 March 2008计量经济学第二讲计量经济计量经济

99、学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2.2.2.2.点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point EstimatorsProperties of Point Estimators)第三节、参数估计第三节、参数估计(1 1 1 1) 小样本性质小样本性质小样本性质小样本性质uu无偏性(无偏性(无偏性(无偏性(UnbiasednessUnbiasedness): : : :如果如果E( )=E( )= ,则,则 为为 的无偏估计量;的无偏估计量;反之,则估计量是有偏估计量。反之,则估计量是有偏估计量。 是

100、有偏的(biased):偏离度-E()。 是无偏的(unbiased)。* 从图从图2-52-5中可以看出:从无偏分布中抽取的一个估计值比起从那些不以中可以看出:从无偏分布中抽取的一个估计值比起从那些不以总体真值为中心的分布中抽取的估计值有更大可能靠近总体真值。总体真值为中心的分布中抽取的估计值有更大可能靠近总体真值。Bias (=E()(=E()E(E( ) ),f()f()f( f( ) )*图图2-52-5:无偏估计量和有偏估计量:无偏估计量和有偏估计量*Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2.2

101、.2.2.点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point EstimatorsProperties of Point Estimators)第三节、参数估计第三节、参数估计(1 1 1 1) 小样本性质小样本性质小样本性质小样本性质uu无偏性举例无偏性举例无偏性举例无偏性举例: : : :(1)(1)如如E( )=E( )= , 是是 的一个无偏估计量。的一个无偏估计量。是是2 2的无偏估计量。的无偏估计量。(2)(2) , , 偏离度偏离度 但是但是 Friday, 7 March 2008计量经济学第二讲计量经济计量经

102、济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2.2.2.2.点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point EstimatorsProperties of Point Estimators)第三节、参数估计第三节、参数估计(1 1 1 1) 小样本性质小样本性质小样本性质小样本性质uu有效性(有效性(有效性(有效性(EfficiencyEfficiency): : : :考虑两个由容量为考虑两个由容量为N N的同一样本计算而来的无偏估计量的同一样本计算而来的无偏估计量 和和如果有:如果有: ;或;或 ,则称,

103、则称 为有效估计量,为有效估计量,或者说或者说 比比 更有效。更有效。 ,f()f()f()f()图图2-62-6:有效性:有效性 显然,在一个参数显然,在一个参数 的各种估计量之间进行选择时,我们希望选择的各种估计量之间进行选择时,我们希望选择既无既无既无既无偏又有效偏又有效偏又有效偏又有效的估计量。若在的估计量。若在 的所有估计量中,我们能够找到一个具有的所有估计量中,我们能够找到一个具有最小方最小方最小方最小方差差差差的估计量,则称之为的估计量,则称之为 的最佳估计量。的最佳估计量。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课

104、件分析的统计学基础课件2.2.2.2.点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point Properties of Point EstimatorsEstimators)第三节、参数估计第三节、参数估计(1 1 1 1) 小样本性质小样本性质小样本性质小样本性质uu有效性举例有效性举例有效性举例有效性举例: : : :如如; 。即:即:比比m m约约6060更有效。更有效。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2.2.2.2.点估计量的

105、统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point Properties of Point EstimatorsEstimators)第三节、参数估计第三节、参数估计(1 1 1 1) 小样本性质小样本性质小样本性质小样本性质uu最佳线性无偏性(最佳线性无偏性(最佳线性无偏性(最佳线性无偏性(the best linear the best linear unbiasednessunbiasedness): : : :线性估计量(线性估计量(线性估计量(线性估计量(linear estimatorlinear estimator):):

106、):):是指估计量是指估计量 是诸样本观测值的一个是诸样本观测值的一个线性函数线性函数线性函数线性函数。最佳线性无偏估计量(最佳线性无偏估计量(最佳线性无偏估计量(最佳线性无偏估计量(BLUE: the best linear unbiased BLUE: the best linear unbiased estimatorestimator): : : :是指是指 是是线性的线性的线性的线性的、无偏的无偏的无偏的无偏的,并且它在,并且它在 的所有线性无偏的所有线性无偏估计量中具有估计量中具有最小方差最小方差最小方差最小方差。Friday, 7 March 2008计量经济学第二讲计量经济计量

107、经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第三节、参数估计第三节、参数估计2.2.2.2.点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point Properties of Point EstimatorsEstimators)(2 2 2 2) 大样本性质大样本性质大样本性质大样本性质: 有时,一个估计量在小样本情况下不满足某些有时,一个估计量在小样本情况下不满足某些小样本性质,但随着样本容量小样本性质,但随着样本容量N N的无限增大,该估的无限增大,该估计量就会有一些令人满意的统计性质,这些性质称计量就会有一

108、些令人满意的统计性质,这些性质称为大样本性质或为大样本性质或渐近性质渐近性质渐近性质渐近性质。uu渐近无偏性(渐近无偏性(渐近无偏性(渐近无偏性(Asymptotic UnbiasednessAsymptotic Unbiasedness)uu一致性(一致性(一致性(一致性(ConsistencyConsistency)Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2.2.2.2.点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point Estimat

109、orsProperties of Point Estimators)第三节、参数估计第三节、参数估计(2 2 2 2) 大样本性质大样本性质大样本性质大样本性质uu渐近无偏性(渐近无偏性(渐近无偏性(渐近无偏性(Asymptotic UnbiasednessAsymptotic Unbiasedness): : : :若对于估计量若对于估计量 ,有,有则则 称为称为 的的渐近无偏渐近无偏渐近无偏渐近无偏估计量估计量估计量估计量。也就是说,当。也就是说,当N N时,估计量时,估计量 的的期望值趋向于期望值趋向于 的真值。的真值。用概率极限符号表示为用概率极限符号表示为一个估计量是一个估计量是一致

110、一致估计量的估计量的充分条件充分条件充分条件充分条件是:是:且且。uu一致性(一致性(一致性(一致性(ConsistencyConsistency): : : :定义:定义:定义:定义:如果如果 , 0,0,则称则称 为为 的的一致一致一致一致估计量估计量估计量估计量。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件2.2.2.2.点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(点估计量的统计性质(Properties of Point EstimatorsProperties of Point Est

111、imators)第三节、参数估计第三节、参数估计(2 2 2 2) 大样本性质大样本性质大样本性质大样本性质uu一致性(一致性(一致性(一致性(ConsistencyConsistency): : : : 均方差(均方差(MSE: Mean Squared ErrorMSE: Mean Squared Error)= =如果当如果当nn时,时, ;则称;则称 为为参数参数 的一致的一致估计量。估计量。因为因为 当当nn时,时,如果如果 , ,且偏离度(且偏离度( )00,则,则 。 nnn=5n=5n=20n=20n=200n=200Friday, 7 March 2008计量经济学第二讲计量

112、经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第三节、参数估计第三节、参数估计2 2 2 2区间估计:区间估计:区间估计:区间估计: 可以预期未来参数将按某种置信度位于其中的区间的方法。可以预期未来参数将按某种置信度位于其中的区间的方法。1.1.1.1.置信区间和置信限:置信区间和置信限:置信区间和置信限:置信区间和置信限: 考虑从一均值为考虑从一均值为 ,标准差为,标准差为的正态总体中抽取容量为的正态总体中抽取容量为N N的样本。该样本的均值的样本。该样本的均值或或N(0, 1)N(0, 1) 由正态分布的性质可知,在重复抽样的情况下,由正态分布的性质可知,在重复抽样的

113、情况下,9595的样的样本均值将落在区域本均值将落在区域 1.961.96 之内,也就是之内,也就是。或或Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第三节、参数估计第三节、参数估计2 2区间估计:区间估计: 可以预期未来参数将按某种置信度位于其中的区间的方法。可以预期未来参数将按某种置信度位于其中的区间的方法。1.1.1.1.置信区间和置信限:置信区间和置信限:置信区间和置信限:置信区间和置信限: 的的的的95959595置信区间为:置信区间为:置信区间为:置信区间为: , , 的的的的95959595置信限

114、为:置信限为:置信限为:置信限为: 的的的的置信水平为:置信水平为:置信水平为:置信水平为:Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第三节、参数估计第三节、参数估计2 2 2 2区间估计:区间估计:区间估计:区间估计:1.1.1.1.置信区间和置信限:置信区间和置信限:置信区间和置信限:置信区间和置信限:2.2.2.2.均值的置信限:均值的置信限:均值的置信限:均值的置信限: 在实际应用中,我们一般不知道在实际应用中,我们一般不知道 ,只能用,只能用样本标样本标样本标样本标准差准差准差准差 代替它。在这种情

115、况下,有代替它。在这种情况下,有 t(N-1)t(N-1)与正态分布的情况类似,我们有与正态分布的情况类似,我们有若取若取 0.050.05,则有,则有即即 的的9595置信限为(置信限为( )。其中)。其中t t0.0250.025表示自由度为表示自由度为N-1N-1的的t t分布两端各分布两端各2.5%2.5%面积的面积的t t临界值(可查临界值(可查t t表)。表)。置信水平置信水平置信水平置信水平置信限置信限置信限置信限95951.961.9699992.582.58Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学

116、基础课件第三节、参数估计第三节、参数估计2 2 2 2区间估计:区间估计:区间估计:区间估计:2. 2.均值的置信限:均值的置信限:均值的置信限:均值的置信限:例例例例2.22.2:1616个北京男高中生的一个随机样本给出的平均身高为个北京男高中生的一个随机样本给出的平均身高为174cm174cm,标准差为,标准差为5cm5cm,试求北京男高中生平均身高的,试求北京男高中生平均身高的9595置信限。置信限。解:解:解:解: N=16N=16,S=5S=5,故,故 。用用 0.050.05,N-1=15N-1=15个自由度查表得个自由度查表得t t0.0250.025=2.131, =2.131

117、, 故故9595置置信度为信度为即根据样本,我们有即根据样本,我们有9595的把握说北京男高中生的平均身的把握说北京男高中生的平均身高在高在171.3cm171.3cm176.7cm176.7cm。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件计量经济分析的统计学基础计量经济分析的统计学基础第一节第一节第一节第一节概率和概率分布概率和概率分布概率和概率分布概率和概率分布第二节第二节第二节第二节统计推断统计推断统计推断统计推断第三节第三节第三节第三节参数估计参数估计参数估计参数估计第四节第四节第四节第四节假设检验假

118、设检验假设检验假设检验Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验 有两种假设检验的方法:有两种假设检验的方法:显著性检验方法显著性检验方法显著性检验方法显著性检验方法和和置信区间法置信区间法置信区间法置信区间法。显著性检验显著性检验显著性检验显著性检验是经典的假设检验方法,具有简洁清晰的特点。是经典的假设检验方法,具有简洁清晰的特点。1 1 1 1假设检验的逻辑假设检验的逻辑假设检验的逻辑假设检验的逻辑 1 1 1 1假设检验的步骤和方法假设检验的步骤和方法假设检验的步骤和方法

119、假设检验的步骤和方法2 2 2 2统计假设的单侧检验统计假设的单侧检验统计假设的单侧检验统计假设的单侧检验3 3 3 3两类典型的错误两类典型的错误两类典型的错误两类典型的错误4 4 4 4统计假设的统计假设的统计假设的统计假设的F F F F检验检验检验检验Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验1 1假设检验的逻辑假设检验的逻辑假设检验的逻辑假设检验的逻辑 依据:依据:依据:依据:总体参数的任何具体估计值都来自诸估计值的一个分总体参数的任何具体估计值都来自诸估计值的一个分

120、布(即估计量的抽样分布)。因此,由这个估计值引出的结论必布(即估计量的抽样分布)。因此,由这个估计值引出的结论必须将整个分布考虑在内。须将整个分布考虑在内。 设有一个取自某个均值为设有一个取自某个均值为 的总体的样本,计算出样本均值的总体的样本,计算出样本均值为为 (如(如 110110),我们要检验的假设是,此(样本)均值来自),我们要检验的假设是,此(样本)均值来自均值为均值为 ( 100100)的总体。这个假设意味着)的总体。这个假设意味着 和和 之间的差异应之间的差异应该仅仅是由偶然因素造成的。根据该仅仅是由偶然因素造成的。根据 的抽样分布,我们可以求出的抽样分布,我们可以求出上述假设

121、成立的情况下,即被抽样的总体的均值为上述假设成立的情况下,即被抽样的总体的均值为 的情况下,的情况下,随机抽取一个样本,得到样本均值为随机抽取一个样本,得到样本均值为 的概率是多少。的概率是多少。如果此概如果此概如果此概如果此概率值很小,则表明从均值为率值很小,则表明从均值为率值很小,则表明从均值为率值很小,则表明从均值为 100100100100的总体中不大可能取到均值的总体中不大可能取到均值的总体中不大可能取到均值的总体中不大可能取到均值为为为为 110110110110的随机样本。的随机样本。的随机样本。的随机样本。在这种情况下,我们说在这种情况下,我们说 显著地不同于显著地不同于 ,因

122、而拒绝关于此,因而拒绝关于此 是来自一均值为是来自一均值为 的总体的假设。或者换个的总体的假设。或者换个说法,我们的样本数据不能支持总体均值为说法,我们的样本数据不能支持总体均值为 的假设。的假设。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验1假设检验的逻辑假设检验的逻辑假设检验的逻辑:假设检验的逻辑:假设检验的逻辑:假设检验的逻辑:就是检验是否出现了小概率事件。就是检验是否出现了小概率事件。 如果出现小概率事件,则拒绝原来关于总体参数的如果出现小概率事件,则拒绝原来关于总体参数

123、的假设;如果检验表明得到的样本值并不属于小概率事假设;如果检验表明得到的样本值并不属于小概率事件,则不能拒绝原来的假设,或者说,我们接受该假件,则不能拒绝原来的假设,或者说,我们接受该假设。设。 上面提到的概率究竟应该小到什么程度才算小?一上面提到的概率究竟应该小到什么程度才算小?一般说来,这取决于我们愿意承担的拒绝一个正确的假般说来,这取决于我们愿意承担的拒绝一个正确的假设和接受一个错误的假设这两方面的风险。在实践中,设和接受一个错误的假设这两方面的风险。在实践中,一般习惯于取一般习惯于取5 5作为拒绝假设的临界水平,称为作为拒绝假设的临界水平,称为5 5的显著性水平。的显著性水平。Frid

124、ay, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验2 2假设检验的步骤和方法假设检验的步骤和方法1.1.建立关于总体的原假设和备择假设建立关于总体的原假设和备择假设2.2.计算检验统计量计算检验统计量3.3.检验原假设,得出关于原假设是否合理的结论检验原假设,得出关于原假设是否合理的结论Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验2假设检验的步骤和方法假设检验的步骤和方法假设检验

125、的步骤和方法假设检验的步骤和方法 例例2.12.1:某厂批量生产一种直径为:某厂批量生产一种直径为100mm100mm的轴,随机抽取一的轴,随机抽取一个个1616根轴的样本,计算出平均直径(样本均值)为根轴的样本,计算出平均直径(样本均值)为110mm110mm,方,方差为差为100mm100mm,试问生产线是否出了问题;即检验总体均值是不,试问生产线是否出了问题;即检验总体均值是不是是100mm100mm。1. 1.建立关于总体的原假设和备择假设建立关于总体的原假设和备择假设建立关于总体的原假设和备择假设建立关于总体的原假设和备择假设2. 2. 正式的假设检验涉及在两个相互矛盾的假设之间进行

126、正式的假设检验涉及在两个相互矛盾的假设之间进行选择,一个是原假设(选择,一个是原假设(null hypothesisnull hypothesis); ;另一个是备择假另一个是备择假设(设(alternative hypothesisalternative hypothesis)。原假设通常用)。原假设通常用H H0 0表示,备择表示,备择假设用假设用H Ha a或或H H1 1表示。表示。3. 3. 原假设原假设H H0 0: =100=1004. 4. 备择假设备择假设H Ha a:1001005. 5. 上述类型的检验称为上述类型的检验称为双侧检验双侧检验双侧检验双侧检验。若备择假设的形

127、式变。若备择假设的形式变为为 100100或或 100 t tc c,则拒绝原假设,则拒绝原假设H H0 0。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验2 2假设检验的步骤和方法假设检验的步骤和方法3.3.3.3.检验原假设,得出关于原假设是否合理的结论检验原假设,得出关于原假设是否合理的结论检验原假设,得出关于原假设是否合理的结论检验原假设,得出关于原假设是否合理的结论0 0拒绝域(拒绝域( 5%5%)-t-tc ct tc c接受域接受域 95%95% 在例子中,从在例子中

128、,从t t表中可查出,表中可查出,对于对于 =5=5和自由度和自由度=16-1=15=16-1=15的的t t的临界值为的临界值为t tc c=2.13=2.13,有,有因此,样本数据不支持总体均因此,样本数据不支持总体均值为值为100100的假设,可能是生产线的假设,可能是生产线出了问题。出了问题。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验3 3 3 3统计假设的单侧检验统计假设的单侧检验统计假设的单侧检验统计假设的单侧检验一般而言,如果用一般而言,如果用 表示待检验的总体参

129、数,则表示待检验的总体参数,则 的双侧检验是一的双侧检验是一个关于假设个关于假设H H0 0: : 0 0H Ha a: : 0 0的检验。而的检验。而 的单侧检验是关于假设的单侧检验是关于假设H H0 0: : 0 0H H0 0: : 0 0H Ha a: : 0 0 H Ha a: : 0 0的检验。的检验。或或0 0拒绝域拒绝域 5%5%-t-tc ct tc c接受域接受域 95%95%0 0拒绝域拒绝域 5%5%-t-tc c接受域接受域 95%95%0 0拒绝域拒绝域 5%5%t tc c接受域接受域 95%95%Friday, 7 March 2008计量经济学第二讲计量经济计

130、量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验4 4两类典型的错误两类典型的错误两类典型的错误两类典型的错误第第第第I I I I类错误:类错误:类错误:类错误:拒绝了正确的原假设,或称拒绝了正确的原假设,或称“弃真弃真”错误。错误。 KazmierKazmier, L. J. (1988), Theory and Problems of , L. J. (1988), Theory and Problems of BusinesBusines Statistics (2nd Ed.), p.157Statistics (2nd Ed.), p.

131、157Type I error:Type I error: if a 5 percent level of significance is used, there if a 5 percent level of significance is used, there is a probability of 0.05 of rejecting the null hypothesis when it is a probability of 0.05 of rejecting the null hypothesis when it is in fact true. The probability o

132、f type I error is always equal to is in fact true. The probability of type I error is always equal to the level of significance that is used as the standard for the level of significance that is used as the standard for rejecting the null hypothesis.rejecting the null hypothesis. 第第第第IIIIIIII类错误:类错误

133、:类错误:类错误:接受了错误的原假设,或称接受了错误的原假设,或称“取伪取伪”错误。错误。 Type II error:Type II error: if the null hypothesis is accepted when it is in if the null hypothesis is accepted when it is in fact false.fact false.Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验4 4两类典型的错误两类典型的错误两类典型的错误两

134、类典型的错误表表2 21 1:假设检验中不同决策的可能结果:假设检验中不同决策的可能结果可能的决策可能的情况H0正确H0错误接受H0正确接受(1-)第II类错误()拒绝H0第I类错误()正确拒绝(1-)0 0拒绝域(拒绝域( =5%=5%)第第IIII类错误(或称类错误(或称“取伪取伪取伪取伪”错误)错误)接受域(接受域(1-1- )0 0拒绝域(拒绝域( =5%=5%)第第I I类错误(或称类错误(或称“弃真弃真弃真弃真”错误)错误)t tc c正确接受原假设(正确接受原假设(1-1- )Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础

135、课件分析的统计学基础课件第四节、假设检验第四节、假设检验5 5统计假设的统计假设的统计假设的统计假设的F F F F检验检验检验检验 F F检验通常用于检验两正态总体的方差是否相等,亦即是否具检验通常用于检验两正态总体的方差是否相等,亦即是否具有同方差性。有同方差性。问题归纳:问题归纳:问题归纳:问题归纳:从两正态总体中分别取出容量为从两正态总体中分别取出容量为n n1 1和和n n2 2的样本,样本方的样本,样本方差分别为差分别为S S1 12 2和和S S2 22 2,要检验的是其总体方差,要检验的是其总体方差 1 12 2和和 2 22 2是否相等。是否相等。检验统计量:检验统计量:检验

136、统计量:检验统计量:可以证明,可以证明,F F服从自由度为服从自由度为n n1 1-1-1和和n n2 2-1-1的的F F分布,即分布,即式中,式中,n n1 1-1-1为分子自由度;为分子自由度;n n2 2-1-1为分母自由度。为分母自由度。拒绝域(=0.05)Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件第四节、假设检验第四节、假设检验5 5统计假设的统计假设的统计假设的统计假设的F F F F检验检验检验检验例例例例 2.32.3:设从某年高考外语考试成绩中抽取男女考生各设从某年高考外语考试成绩中抽取男

137、女考生各6060人的一个样本,人的一个样本,男女考生外语高考分的样本方差分别为男女考生外语高考分的样本方差分别为110110和和8080,试检验该年全体,试检验该年全体男女考生外语高考成绩是否同方差。男女考生外语高考成绩是否同方差。解:解: 设男女考生总体方差分别为设男女考生总体方差分别为 1 12 2, 2 22 2,则要检验的假设为,则要检验的假设为H H0 0: 1 12 2= = 2 22 2H Ha a: 1 12 22 22 2我们有我们有用自由度(用自由度(59,5959,59)查)查F F表,表,5 5显著水平下的显著水平下的F F临界值临界值F Fc c=1.48=1.48,

138、如上图所,如上图所示。因为示。因为F=1.375FF=1.375Fc c=1.48=1.48,故接受原假设,故接受原假设H H0 0,即该年男女考生英语成绩,即该年男女考生英语成绩同方差。同方差。注:注:注:注:F F表只给出右侧临界值,临界值截断右侧表只给出右侧临界值,临界值截断右侧5 5的面积。的面积。F F表的这种构表的这种构成方式要求我们在计算成方式要求我们在计算F F值时,要将值时,要将样本方差值较大的一个放在分子上样本方差值较大的一个放在分子上样本方差值较大的一个放在分子上样本方差值较大的一个放在分子上,从而使得从而使得F F值总是大于值总是大于1 1。拒绝域(=0.05)1.48

139、1.48Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件小结小结本章对计量经济学所用到的统计学概念和方法进行了概本章对计量经济学所用到的统计学概念和方法进行了概括性讨论,主要包括:括性讨论,主要包括:1 1 1 1概率和概率分布概率和概率分布概率和概率分布概率和概率分布概率、随机变量(离散随机变量、连续随机变量);概率、随机变量(离散随机变量、连续随机变量);概率分布(正态分布、概率分布(正态分布、t t分布、分布、 2 2分布和分布和F F分布);期分布);期望值和方差、协方差和相关系数。望值和方差、协方差和相关

140、系数。2 2 2 2统计推断统计推断统计推断统计推断统计推断:假设检验(检验是否出现了小概率事件);统计推断:假设检验(检验是否出现了小概率事件);参数估计(点估计;区间估计)。参数估计(点估计;区间估计)。假设检验的具体步骤:假设检验的具体步骤:假设检验的具体步骤:假设检验的具体步骤:1.1.建立关于总体的原假设和备择假设;建立关于总体的原假设和备择假设;2.2.计算检验统计量;计算检验统计量;3.3.检验原假设,得出关于原假设是否合理的结论。检验原假设,得出关于原假设是否合理的结论。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件复习思考题复习思考题1 1(名词解释),(名词解释),2 2,3 3和和4 4。Friday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件谢谢谢谢!Q&AFriday, 7 March 2008计量经济学第二讲计量经济计量经济学第二讲计量经济分析的统计学基础课件分析的统计学基础课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号