{财务管理财务知识}计量经济学专题卡方检验韩纪江某某某

上传人:卓****库 文档编号:140926906 上传时间:2020-08-02 格式:PPTX 页数:65 大小:468.83KB
返回 下载 相关 举报
{财务管理财务知识}计量经济学专题卡方检验韩纪江某某某_第1页
第1页 / 共65页
{财务管理财务知识}计量经济学专题卡方检验韩纪江某某某_第2页
第2页 / 共65页
{财务管理财务知识}计量经济学专题卡方检验韩纪江某某某_第3页
第3页 / 共65页
{财务管理财务知识}计量经济学专题卡方检验韩纪江某某某_第4页
第4页 / 共65页
{财务管理财务知识}计量经济学专题卡方检验韩纪江某某某_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《{财务管理财务知识}计量经济学专题卡方检验韩纪江某某某》由会员分享,可在线阅读,更多相关《{财务管理财务知识}计量经济学专题卡方检验韩纪江某某某(65页珍藏版)》请在金锄头文库上搜索。

1、卡方检验 chi-square test,chi-squared,2test,卡方检验属于非参数假设检验, 适用于布尔型或二项分布数据,主要用于分类变量. 基于两个概率间的比较,早期用于生产企业的产品合格率等,2020/8/2,1,北方民族大学经济学院 韩纪江副教授韩纪江整理,回顾:Chi-square Probability Distribution 2分布,2分布 Chisquare distribution,与正态分布很相似。是由正态分布派生出来的一种分布.,随机变量X服从均值为,方差为2的正态分布 随机变量Z= (X) / 是标准正态变量,即ZN(0,1)。,X N(,2),标准正态变

2、量的平方服从自由度为1的2分布,用符号表示为,Z2 = 2 (1),是平方和中独立观察值的个数。,自由度仅为1,这是因为仅考虑一个标准正态变量,令Z1,Z2, ZK为K个独立的标准正态变量(即每一个变量均是均值为0,方差为1的正态变量),,对所有的变量ZS平方,则它们的平方和服从自由度为K的2分布,,可证明,定义自由度,推广,2020/8/2,2,北方民族大学经济学院 韩纪江副教授,进一步理解,设X1,X2,X3,.,Xn,相互独立,且服从标准正态分布N(0,1),则称,2=X12+ X22+ X32+. +Xn2,,服从自由度为 n 的 2 分布,记为2 2(n),2 分布的概率密度,202

3、0/8/2,3,北方民族大学经济学院 韩纪江副教授,2 分布的概率密度曲线,设X1, X2, X3,.,Xn,相互独立,且服从正态分布N(, 2),2020/8/2,4,北方民族大学经济学院 韩纪江副教授,Properties of the Chi-square Distribution2分布的性质,takes only positive values (after all, it is the distribution of a squared quantity) and ranges from 0 to infinity. 只取正值(是平方和的分布)从0到无限大。,1,is a skewe

4、d distribution, the degree of the skewness depending on the d.f. For comparatively few d.f. the distribution is highly skewed to the right, but as the d.f. increase, the distribution becomes increasingly symmetrical and approaches the normal distribution.是斜分布,其偏度取决于自由度大小,自由度越小,越向右偏。 随着自由度增大,逐渐呈对称,接近

5、正态分布。,2,The expected, or mean, value of a chi-square r.v. is k and its variance is 2k, where k is the d.f. This is a noteworthy property of the chi-square distribution in that its variance is twice its mean value.期望为k,方差为2k。即方差是其均值的两倍。,3,If Z1 and Z2 are two independent chi-square variables with k1

6、and k2 d.f., then their sum (Z1 + Z2) is also a chi-square variable with d.f. = (k1 + k2).独立自由变量的自由度可以相加。,4,2020/8/2,5,北方民族大学经济学院 韩纪江副教授,2 分布的分位点,对于给定的,(0,1),满足条件,P 2 2(n)=2(n)f(y)dy=,的点2(n)为2(n)分布的上分位点,对于不同的,n,可以通过查表求得 上分位点的值,2020/8/2,6,北方民族大学经济学院 韩纪江副教授,2020/8/2,7,北方民族大学经济学院 韩纪江副教授,2020/8/2,8,北方民族

7、大学经济学院 韩纪江副教授,2020/8/2,9,北方民族大学经济学院 韩纪江副教授,2020/8/2,10,北方民族大学经济学院 韩纪江副教授,2020/8/2,11,北方民族大学经济学院 韩纪江副教授,一、卡方检验的基本思想,1.卡方检验:以卡方分布为基础的一种常用假设检验方法,用于比较两个及以上样本率(构成比),或两个分类变量的关联性分析。,用于2个变量都属于分类变量(例如性别、婚姻状态等,属于定性数据)时的数据分析,比较理论频数和实际频数的 吻合程度或拟合优度,例如要分析性别与色盲之间(色盲一般分为“有”和“无”2个分类,属于定性变量)的关系,两个率或两个构成比的比较,,多个率或多个构

8、成比的比较,在分类资料统计推断中的应用,包括,分类资料的相关分析。,2020/8/2,12,北方民族大学经济学院 韩纪江副教授,2.卡方检验的步骤,(1)建立零假说(Null Hypothesis),,即认为观测值与理论值的差异是由于随机误差所致,观察频数与期望频数没有差别。,无效假设H0 :,假设H0成立,基于此前提,计算理论值(即期望值)。,确定数据间的实际差异,即求出卡方2值,表示观察值与理论值之间的偏离程度,2020/8/2,13,北方民族大学经济学院 韩纪江副教授,(2)卡方值的计算,残差=A-E,A代表某个类别的观察频数,E代表基于H0计算出的期望频数,表示某一个类别观察值和理论值

9、的偏离程度,一方面,因为残差有正有负,如果将残差简单相加,会彼此抵消,总和仍然为0。,为此,可以将残差平方后求和。,另一方面,残差大小是一个相对的概念,相对于10,20非常大,但相对于1000就很小。,考虑到这一点,将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。,将残差加总,2020/8/2,14,北方民族大学经济学院 韩纪江副教授,2统计量公式,(i=1,2,3,k),k为单元格数。,2 公式,Ai为i水平的观察频数,Ei为i水平的期望频数。,n为总频数,pi为i水平的期望频率,字母,公式,当n比较大时,2统计量近似服从k-1个自由度的卡方分布。,最初是由英国统计学家Karl

10、 Pearson在1900年首次提出,因此也称之为Pearson 2 。,2020/8/2,15,北方民族大学经济学院 韩纪江副教授,(3)判断原则,2值为0,2值越小,由卡方公式,当观察频数与期望频数完全一致时,观察频数与期望频数越接近,两者之间的差异越小,2值越大,反之,观察频数与期望频数差别越大,两者间差异越大,小的2值表明观察频数接近期望频数,接近假设,大的2值表明观察频数远离期望频数,即表明远离假设,换言之,就倾向于接受H0,就倾向于拒绝H0,2是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。,如果2值足够小,如果2值足够大,2020/8/2,16,北方民族大

11、学经济学院 韩纪江副教授,(4)判断标准选定,至于2在每个具体研究中究竟要大到什么程度才能拒绝H0 ,则要借助于卡方分布求出所对应的P值来确定,如卡方值大于某特定概率标准(即显著性差异)下的理论值,则拒绝零假说,,即实测值与理论值的差异在该显著性水平下是显著的。,根据2分布及自由度,确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。,如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;,否则,就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。,2020/8/2,17,北方民族大学经济学院 韩纪江副教授,(5)应用条件,只有当

12、样本量比较充足时,才可以忽略两者之间的差异,,卡方分布本身是连续型分布,但是在分类资料的统计分析中,显然频数只能以整数形式出现,因此计算出的统计量是非连续的。,否则将可能导致较大的偏差,对于卡方检验中的每一个单元格,要求其最小期望频数均大于1,且至少有45的单元格期望频数大于5,,一般认为,此时使用卡方分布计算出的概率值才是准确的,2020/8/2,18,北方民族大学经济学院 韩纪江副教授,行列表卡方检验的适用条件,如果数据不符合要求,可以采用,不太理想的办法,与邻近行或列中的实际频数合并,删去理论频数太小的格子所对应的行或列,最理想的办法,增加样本含量以增大理论频数(但是可能吗),确切概率法

13、,2020/8/2,19,北方民族大学经济学院 韩纪江副教授,3.卡方检验的用途,检验某个连续变量的分布是否与某种理论分布相一致,如是否符合正态分布、均匀分布、Poisson分布等,检验某个分类变量各类的出现概率是否等于指定概率,如在36选7的彩票抽奖中,每个数字出现的概率是否各为136; 掷硬币时,正反两面出现的概率是否均为0.5。,检验某两个分类变量是否相互独立,如吸烟(二分类变量:是、否)与呼吸道疾病(二分类变量:是、否)有关? 产品原料种类(多分类变量)是否与合格(二分类变量:是、否)有关?,考察某无序分类变量各水平在两组或多组间分布实际上是否一致,2020/8/2,20,北方民族大学

14、经济学院 韩纪江副教授,控制某种或某几种分类因素以后,另两个分类变量是否相互独立,如控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关; 控制产品加工工艺的影响后,产品原料类别是否与产品合格有关。,检验某两种方法的结果是否一致,如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致; 采用两种方法对客户进行价值类别预测,预测结果是否一致。,2020/8/2,21,北方民族大学经济学院 韩纪江副教授,4.举例 四格表(fourfold table),步骤(1)计算理论频数。 基于H0成立,两样本所在总体无差别的前提下计算出各单元格的理论频数来。,计算总的理论龋齿率和理论未龋齿率,总的理论龋齿

15、率 = 患龋齿人数合计/总调查人数合计,总的理论未龋齿率 = 未患龋齿人数合计/总调查人数合计,2020/8/2,22,北方民族大学经济学院 韩纪江副教授,理论频数与实际频数的比较,使用含氟牙膏人群,总的理论龋齿率含氟牙膏调查人数=使用含氟牙膏龋齿率,总的理论未龋齿率含氟牙膏调查人数=使用含氟牙膏未龋齿率,使用一般牙膏人群,总的理论龋齿率一般牙膏调查人数=使用一般牙膏龋齿率,总的理论未龋齿率一般牙膏调查人数=使用一般牙膏未龋齿率,2020/8/2,23,北方民族大学经济学院 韩纪江副教授,步骤(2)计算残差,残差= A - E,设A=某个类别的观察频数,E=基于H0计算出的期望频数,表示某一个

16、类别观察值和理论值的偏离程度,调整残差,残差有正有负,相加后会彼此抵消,总和仍然为0。,为此,将残差平方后求和,以表示样本总的偏离无效假设的程度。,进一步调整,残差大小是一个相对的概念,相对于期望频数为10时,20的残差非常大;可相对于期望频数为1000时20就很小。,因此又将残差平方除以期望频数再求和,以标准化观察频数与期望频数的差别。,最终得卡方统计量公式为:,2020/8/2,24,北方民族大学经济学院 韩纪江副教授,步骤(3)理解,从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0,实际观察频数与期望频数越接近,两者之间的差异越小,卡方值越小;,反之,实际观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。,当然,卡方值的大小也和单元格数(自由度) 有关。,2020/8/2,25,北方民族大学经济学院 韩纪江副教授

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号