计量经济学统计基础讲义课件

上传人:我*** 文档编号:137930512 上传时间:2020-07-12 格式:PPT 页数:66 大小:461KB
返回 下载 相关 举报
计量经济学统计基础讲义课件_第1页
第1页 / 共66页
计量经济学统计基础讲义课件_第2页
第2页 / 共66页
计量经济学统计基础讲义课件_第3页
第3页 / 共66页
计量经济学统计基础讲义课件_第4页
第4页 / 共66页
计量经济学统计基础讲义课件_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《计量经济学统计基础讲义课件》由会员分享,可在线阅读,更多相关《计量经济学统计基础讲义课件(66页珍藏版)》请在金锄头文库上搜索。

1、计量经济学的统计学基础,简要复习数理统计学,为什么要复习数理统计学,数理统计学是计量经济学的基础,它为计量经济学提供了唯一而有效的方法。 数理统计较难,而且许多同学对于数学公式与数学符号的健忘,提醒我们有必要在展开计量经济学讨论之前,对本课程中经常使用到的数理统计学基本内容事先进行一些温习和回顾。,主要内容,第一节 基本概念 第二节 对总体的描述随机变量的数字特征 第三节 对样本的描述样本分布的数字特征 第四节 随机变量的分布总体和样本的连接点 第五节 通过样本,估计总体(一)估计量的特征 第六节 通过样本,估计总体(二)估计方法 第七节 通过样本,估计总体(三)假设检验,第一节 基本概念,总

2、体和个体 样本和样本容量 随机变量 统计量 随机变量的分布函数和分布密度函数,1.1 总体、个体、样本和样本容量,研究对象的全体称为总体或母体,组成总体的每个基本单位称为个体。 总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为样本的大小。 注意:抽样是按随机原则选取的,即总体中每个个体有同样的机会被选入样本。,1.2 随机变量,随机而变的量 随机变量是指变量的值无法预先确定仅以一定的可能性(概率)取值的量(Random Variable)。 一个随机变量具有下列特性:可以取许多不同的数值,取这些数值的概率为p,,总体、随机变量、样本间的联系,样本是随机的,所

3、谓“样本容量为 n的样本”就是n个相互独立且与总体有相同分布的随机变量X1,Xn。 每一次具体抽样所得的数据,就是n元随机变量的一次观察,记为(x1,xn)。 样本是总体的一部分。总体一般是未知的,一般要通过样本才能部分地推知总体的情况。,1.3 统计量,设(x1,x2,xn)为一组样本观察值,函数 y= f( x1,x2,xn )若不含有未知参数,则称为统计量。 统计量一般是连续函数。由于样本是随机抽取,因而它的函数y也是随机变量,所以,统计量是随机变量。 一般用统计量来提取由样本带来的总体信息。,1.4 随机变量的分布函数,定义 若X为一随机变量,对任意实数x, 称 为随机变量X的概率分布

4、函数。,概率分布是关于总体的概念。有了概率分布就等于知道了总体。,连续变量的分布,取连续值的变量,如高度、长度、重量、时间、距离等等;它们被称为连续变量。 换言之,一个随机变量如果能够在一区间(无论这个区间多么小)内取任何值,则该变量称为在此区间内是连续的,其分布称为连续型概率分布。,想象连续变量观测值的直方图;如果其纵坐标为相对频数,那么所有这些矩形条的高度和为1;完全可以重新设置量纲,使得这些矩形条的面积和为1。 不断增加观测值及直方图的矩形条的数目,直方图就会越来越像一条光滑曲线,其下面的面积和为1。 该曲线即所谓概率密度函数。,逐渐增加矩形条数目的直方图和一个形状类似的密度曲线。,连续

5、变量的分布,连续变量落入某个区间的概率就是概率密度函数的曲线在这个区间上所覆盖的面积;因此,理论上,这个概率就是密度函数在这个区间上的积分。 对于连续变量,取某个特定值的概率都是零,而只有变量取值于某个(或若干个)区间的概率才可能大于0。 连续变量密度函数曲线(这里用f表示)下面覆盖的总面积为1,即,连续型随机变量的分布密度,定义:对于任何实数x,如果随机变量X的分布函数F(x)可以写成,分布密度函数的性质:,概率密度函数的大小能够反映X在x附近取值的概率的大小,从而比分布函数更直观。,举例:正态分布,x2,x2,f(x),F(x),x1,x1,X,X,第二节 对总体的描述 随机变量的数字特征

6、,2.1、数学期望 2.2、方差 2.3、数学期望与方差的图示,2.1.1 数学期望:一个加权平均值,数学期望描述随机变量(总体)的一般水平。 定义2.1离散型随机变量数学期望的定义: 定义2.2 连续型随机变量数学期望的定义,2.1.2数学期望的性质,(1)如果a、b为常数,则 E(aX+b)=aE(X)+b (2)如果X、Y为两个随机变量,则 E(X+Y)=E(X)+E(Y) (3)如果g(x)和f(x)分别为X的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X) (4)如果X、Y是两个独立的随机变量,则 E(X.Y)=E(X).E(Y),2.2.1 方差的定义,定义 离差 如果随

7、机变量X的数学期望E(X)存在,称X-E(X)为随机变量X的离差。显然,随机变量离差的数学期望是0,即 E X-E(X) = 0 定义 方差、标准差 随机变量离差平方的数学期望 叫随机变量的方差,记作Var(x)或D(x)。 方差的算术平方根叫标准差。,2.2.2方差的意义,(1)离差和方差都是用来描述离散程度的,即描述X对于它的期望的偏离程度,这种偏差越大,表明变量的取值越分散。 (2)一般情况下,我们采用方差来描述离散程度。 因为离差的和为0,无法体现随机变量的总离散程度。方差中由于有平方,从而消除了正负号的影响,并易于加总。,2.2.3 方差的性质,(1)Var(c )=0 (2)Var

8、(c+x)=Var(x ) (3)Var(cx)=c2Var(x) (4)x,y为相互独立的随机变量,则 Var(x+y)=Var(x )+Var(y )=Var(x-y) (5)Var(x)=E(x2)-(E(x)2,数学期望与方差的图示,数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。 1. 方差同、期望变大 2. 期望同、方差变小,第三节 对样本的描述 样本分布的数字特征,一、样本均值: 二、样本方差、样本标准差,第四节 随机变量的分布 总体和样本的连接点,4.1 几种重要的分布 4.2 分布:总体和样本之间的连接点 学习的重点应放在确定X服从什么分布,和各种分布的联系上。,

9、4.1 几种重要的分布,4.1.1 正态分布 4.1.2 卡方分布 4.1.3 t分布 4.1.4 F分布 4.1.5 临界值点,4.1.1 正态分布,定义 正态分布的定义 定理 正态分布的数学期望和方差,正态分布,在市场上的精制盐很多是一公斤袋装,上面标有“净含量1kg”的字样。但当你用稍微精确一些的天平称那些袋装盐的重量时,会发现有些可能会重些,有些可能会轻些;但都是在1kg左右。多数离1kg不远,离1kg越近就越可能出现,离1kg越远就越不可能。 一般认为这种重量分布近似地服从最常用的正态分布,又叫高斯分布,近似地服从正态分布的变量很常见,象测量误差、商品的重量或尺寸、某年龄人群的身高和

10、体重等等。 在一定条件下,许多不是正态分布的样本均值在样本量很大时,也可用正态分布来近似。,正态分布,正态分布的密度曲线是一个对称的钟型曲线(最高点在均值处)。正态分布也是一族分布,各种正态分布根据它们的均值和标准差不同而有区别。,两条正态分布的密度曲线。左边是N(-2,0.5)分布,右边是N(0, 1)分布,正态分布,当然,和所有连续变量一样,正态变量落在某个区间的概率就等于在这个区间上,密度曲线下面的面积。 比如,标准正态分布变量落在区间(0.51,1.57)中的概率,就是在标准正态密度曲线下面在0.51和1.57之间的面积。 很容易得到这个面积等于0.24682;也就是说,标准正态变量在

11、区间(0.51,1.57)中的概率等于0.24682。如果密度函数为f(x),那么这个面积为积分,标准正态变量在区间(0.51, 1.57)中的概率,正态分布的标准化,定义 标准正态分布 定理 正态分布标准化,关于正态分布的和,4.1.2 2 分布, 2 分布的定义,定理 2 分布的和仍然服从 2 分布,4.1.3 t分布,t分布的定义,4.1.4 F分布,F分布的定义,4.1.5 临界值点:(1)标准正态分布和t分布临界值点(双侧),类似:,临界值点: (2)卡方分布(双侧)和F分布(单侧)临界值点,x,概率密度,1-,/2,/2,1-,x,4.2 分布:总体和样本之间的连接点,第五节 通过

12、样本,估计总体(一) 估计量的特征,无偏性 有效性 一致性 大样本下,具一致性的估计量具“无偏”和“有效”特性。,5.1 无偏性定义,5.2 有效性定义,形象感觉无偏性和有效性: 有4支比赛用枪的抽样结果,一次射击就是一次抽样。试问: 哪些是无偏估计? 哪些是有偏估计? 哪些是有效估计?,5.3 一致性的定义,n增大时,一致估计量的“无偏”“有效”特性,N小,N大,N极大,的真值,。,6 通过样本,估计总体(二) 估计方法,点估计 区间估计 区间估计的概念、步骤 应用:对总体期望的区间估计 1、已知方差,对数学期望EX进行区间估计 正态总体 一般总体大样本下 2、方差未知,对数学期望EX进行区

13、间估计 大样本下/小样本下,6.1 区间估计的概念,所谓区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围。 具体作法是找出两个统计量 1(x1,xn)与2 (x1,xn), 使 P(1 2 )=1- (1 , 2)称为置信区间, 1-称为置信系数(置信度), 称为冒险率(测不准的概率)或者显著性水平,一般取5%或1%。,对区间估计的形象比喻,我们经常说某班的平均成绩“大概80分左右”,可以看成一个区间估计。(某班的成绩为被估计的参数) P(1 2 )=大概的准确程度(1-) 如:P(75 85 )=95%=1-5%,6.2 区间估计的步骤:,1)找一个含有该参数的统计量; 2)构造

14、一个概率为1- 的事件; 3)通过该事件解出该参数的区间估计.,6.3 已知方差,对总体期望值EX=的区间估计,(1)正态总体; (2)一般总体,大样本下。,(1)正态总体,方差已知,估计均值,图示如下,(2)一般总体,方差已知,大样本下数学期望EX的区间估计,中心极限定理指出,无论是否为正态总体,当样本容量相当大时,有样本平均数渐进地服从正态分布。 在n=30时,近似地,样本平均数 所以,对于大样本仍可以按正态总体进行均值的区间估计。,6.4 方差未知,正态总体,对数学期望EX 的区间估计,(1)大样本下 根据中心极限定理,Var(X)可以用s2 代替,所以仍按已知方差正态分布的方法进行的置

15、信区间估计。,(2)小样本下很重要,区间估计,统计量的选择小结,第七节 通过样本,估计总体(三) 假设检验,基本概念:假设检验,原假设/备择假设 小概率事件原理在假设检验中的应用 置信水平 假设检验的步骤 应用: 正态总体期望的假设检验(方差已知/方差未知)(t检验等) 方差的假设检验,7.1 假设检验的概念,定义:称对任何一个随机变量未知的分布类型或参数的假设为统计假设,简称假设。检验该假设是否正确称为假设检验。 统计假设,如 H0: p= 0.5 (称为原假设) H1: p0.5 (称为备择假设),7.2“小概率原理”在假设检验中的应用,数理统计学中的“小概率原理”认为:概率很小的事件在一

16、次抽样试验中几乎是不可能发生的。 在H0成立的条件下,统计量落在拒绝域为一个小概率事件,因此,在一次抽样试验中,依据小概率原理,小概率事件一般是不会发生的。 要是小概率事件(“统计量落在拒绝域” )居然发生了。那么,只能是提出的假设H0发生了错误,所以必须拒绝H0。,显著性水平,是小概率事件发生的概率;一般取0.05或0.01,7.3 假设检验的步骤:,1:分析问题,提出原假设和备择假设; 2:选择和计算统计量U:在原假设成立时,U的分布已知;含有要检验的参数;各个参数应该都是已知的、可求的。 3:构造小概率事件: 4:判断小概率事件是否发生: 5:下结论:若小概率事件发生,拒绝原假设H0;选择备择假设H1。否则,无充分理由拒绝原假设,只好接受原假设。,假设检验的具体操作步骤(以正态总体、已知方差,检验均值为例),1、提出零假设 H0: = 0 H1 :0 3、确定显著水平,如=

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号