非参数统计论文

上传人:小** 文档编号:70534724 上传时间:2019-01-17 格式:DOCX 页数:6 大小:74.91KB
返回 下载 相关 举报
非参数统计论文_第1页
第1页 / 共6页
非参数统计论文_第2页
第2页 / 共6页
非参数统计论文_第3页
第3页 / 共6页
非参数统计论文_第4页
第4页 / 共6页
非参数统计论文_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《非参数统计论文》由会员分享,可在线阅读,更多相关《非参数统计论文(6页珍藏版)》请在金锄头文库上搜索。

1、非参数统计方法与实例在统计学中,最基本的概念是总体、样本、随机变量、分布、估计和假设检验等,其中很大一部分食与正态理论相关的。在我们已经学过的知识里,总体的分布形式往往是给定的或已经假定了的,我们只需要在总体分布已知的基础上对参数进行估值或者进行检验。但是实际上,对总体的分布的假定并不是能随便做出的,数据可能并不是来自假定的总体分布,或者根本不是来自同一个总体。在这种假定下进行推断就可能产生错误的结论。于是,人们希望能在不假定总体分布的情况下,尽量从数据本身来获得所需的信息,这就是非参数统计的宗旨。在统计学的方法中,参数方法与非参数方法没有谁优谁劣之说,有的只是在具体情况下,谁更适用、谁更准确

2、完整表示数据的信息。接下来,我将就参数统计与非参数统计分别分析其适用情形与优缺点,并详细介绍几种非参数统计的方法并有案例分析。1、参数统计与非参数统计非参数统计方法和参数统计方法共同组成统计分析方法,它们都是统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非

3、参数”检验。就上文我们可以看出,参数统计和非参数统计分别针对不同的数据来使用。参数统计方法的适用范围是很好确定的,它适用于数据分布已知或者可以做出比较正确的假定的数据,对这些数据进行检验、估计,得出数据总体的均值、方差等参数来描述数据特征。这样的数据一般都有这三个要求:1、抽样总体为正态分布或近似正态分布;2、各抽样总体为等方差或方差齐性;3、各变量值间是相互独立的。而非参数统计,顾名思义,是不用估计参数来描述数据特征的方法,只通过对数据作一些诸如分布连续、有密度、具有某阶矩等一般性的假定来揭示数据特征,这也就赋予了非参数统计方法特别的适用数据范围,一般总结为以下四种:1、待分析数据不满足参数

4、检验所要求的假定,因而无法应用参数检验;2、仅由一些等级构成的数据,不能应用参数检验。例如,在一些经济数据中,通常是将一个特征数据分级而不是采用具体数据,这样的数据时没办法做参数检验和估计的,因此非参数统计也就适用了;3、所提的问题的数据中并不包含的参数,也不能用参数检验;4、当我们需要迅速得出结果时,也可以不用参数统计方法而用非参数统计方法来达到目的。因为一般说来,非参数统计方法所要求的计算与参数统计方法相比,完成起来更为方便快捷,因此这种情况下采用非参数统计是一个正确的选择。接下来,将分析参数统计方法与非参数统计的优缺点并进行比较。一般来说,它们两者的优缺点是相对的。非参数统计与参数统计相

5、比具有很多优点,比如说:1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。那么这一点相对的也就是参数统计的缺点,参数统计可以适用的数据一定是总体已知或可以知道的,并且一旦需要计算统计量就意味着数据时需要精确测量的,因此,参数统计适用的范围是很窄的;2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。当然,非参数统计方法也有缺点。首先,由于方法简单,用的计

6、量水准较低,使用非参数统计方法时就不如参数统计方法敏感,可能准确度上会有偏差,因为毕竟非参数统计方法只使用了样本的信息,而未使用总体信息。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第类错误的概率要大些。这也相对的是参数统计方法的优点,一旦数据可以使用参数统计,那么相比非参数统计得出的结果更精确,更有效。2、非参数统计方法下面,我将介绍非参数统计方法,主要是介绍非参数检验的方法。非参数检验的方法是非常多的,有针对独立样本的检验,也有针对配对样本的检验;有针对单样本的检验,有针对两个样本的检验,也有针对多样本的检验。我选取了两种比较常用的检验方法,即针对两配对样本

7、的Wilcoxon检验和针对两独立样本的曼-惠特尼U检验。2.1两配对样本的Wilcoxon检验在处理两配对样本的检验中,还有一种检验是符号检验,但因为在符号检验中,只考虑到了差异的符号,而没有考虑到数据包含的信息,因此在符号检验的基础上选取考虑到数据大小的Wilcoxon秩检验。在Wilcoxon秩检验中,它把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量。它适用于t检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(即产生数据的总体是否具有相同的均值)。Wilcoxon秩检验与符号检验相比

8、优点更多,它在符号检验利用了观测值和零假设的中心位置之差的符号进行检验的基础上,利用这些差的大小(体现于差的绝对值大小)所包含的信息来进行检验。这样在符号检验中利用每个观测值点相应的正号或负号仅仅代表了该点在中心位置的哪一边的基础上,用绝对值差的大小来表示该点距离中心的远近。这样加入了各观测值距离中心远近的信息的Wilcoxon秩检验自然比仅仅利用符号要更有效。这也是wilcoxon秩检验的中心思想。2.2两独立样本的曼-惠特尼U检验两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。曼-惠特尼U检验又称“曼-惠

9、特尼秩和检验”,是由H.B.Mann和D.R.Whitney于1947年提出的。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。曼-惠特尼秩和检验可以看作是对两均值之差的参数检验方式的t检验或相应的大样本正态检验的代用品。由于曼-惠特尼秩和检验明确地考虑了每一个样本中各测定值所排的秩,它比符号检验法使用了更多的信息。它的主要思想是假定要检验两组数据之间有没有差异。首先,不管分组把所有数据排序。按照数值大小给定一个值叫做秩。最小的值秩为1,最大的为N(假定两个样本总共有N个观察值)。如果有相同的值,就得到相同的秩。相同的值的秩是他们的秩的平均

10、值。如果两组的秩的和差距比较大,就会得出较小的p值,认为这两组间有显著差异。根据曼-惠特尼U检验的公式可以看出它比较的是两个样本中位数,并且曼-惠特尼U检验只用于两组数据的比较。如果要比较多组数据,可以用 Kruskal-Wallis检验。用几次 Mann-Whitney 检验来比较多个组间的差异是不适合的,就如同ANOVA不能用多次t检验代替一样。因此,曼-惠特尼U检验只适用于两独立样本的检验。3、实例3.1 目的及意义在进行实例分析时,我选取了股票市场的数据。选取了40个st上市公司的每股收益和40个非st上市公司的每股收益指标,对它们进行分析,看每股收益指标是否存在显著性的差异。我们都知

11、道st表示被特别处理的上市公司,由于其财务状况出现问题,交易所要对投资者的投资进行提醒,因此会在公司前加上st表示警惕。但是企业出现st并不是意味着企业的财务状况永久出现问题,它可能在st之后变好,也可能在st之后变坏。而未被st的企业也不是不可能出现问题。那么在这种情况下,综合全盘的对st企业和非st企业财务状况进行分析,看它们是否存在显著差异是有意义的。基于此,我在中国经济与发展统计数据库中中国证券业年鉴中找到2012年深圳主板年度财务指标,其中有净利润、每股净收益和每股净资产等财务指标。由于每股净收益是测定股票投资价值的重要指标之一,也是分析每股价值的一个基础性指标,它综合反映公司的获利

12、能力。因此,我选取了每股净收益作为进行分析的财务指标。在报表中我选取了40个st上市公司的数据,由于st企业数明显比非st企业数量少,因此我从中随机抽取了40个非st企业进行分析。希望分析结果能够对投资者的投资决策有一定的参考价值。3.2 选取的方法及该方法的优缺点由于st企业和非st企业本质上来说没什么联系,因此可以将它们看成两独立样本的参数检验,因此选取了曼-惠特尼U检验。曼-惠特尼U检验的目的是检验这两个总体的均值是否有显著的差别。曼-惠特尼秩和检验可以看作是对两均值之差的参数检验方式的t检验或相应的大样本正态检验的代用品。由于曼-惠特尼秩和检验明确地考虑了每一个样本中各测定值所排的秩,

13、所以该检验具有比符号检验更优的特性,并且其计算比较简便,能够很快的得出检验结果。但它也有不足,因为曼-惠特尼U检验比较的是两样本的中位数,所以它其实漏掉了一些信息,这可能导致检验的不准确,可能会得出错误的结论。3.3 SPSS分析过程数据:曼-惠特尼U检验:可以看出,st企业每股收益的秩均值为36.34,秩和为1453.5;非st企业每股收益的秩均值为44.66,秩和为1786.5。这样看来,st和非st的每股收益似乎是有明显差异,下面用检验表来确定是否存在差异。可以看出渐进显著性和精确显著性差距并不大,这里的80个数据可以将它看成大样本,这样我们就可以得出结论。由于渐进显著性(双侧)值为0.

14、1100.05,所以不能拒绝原假设,而原假设为st和非st上市公司的每股净收益无差异,因此得出结论,st和非st的每股收益可以看做无差异的。3.4 结论在对st和非st上市企业的每股收益做曼-惠特尼检验后,我们得出了一个出人意料的结果,即这两种企业的每股净收益是无差别的。这样的结果确实好像是难以接受,一个财务出现过状况的企业和一个正常健康的企业的怎么可能是一样的呢?但现实是,这里我们只使用了曼-惠特尼U检验来进行检验,根据曼-惠特尼检验的缺点,很有可能出现了偏差。另一方面,衡量一个企业营运状况的财务指标是很多的,这里选取的每股净收益很可能没有反映出st与非st企业的差别。这告诉我们,经济问题是非常复杂的,做出结论也非常的困难,应当尽可能多的分析以便做出准确的结论。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号