统计应用上常见的谬误.doc

上传人:F****n 文档编号:95565760 上传时间:2019-08-20 格式:DOC 页数:54 大小:373KB
返回 下载 相关 举报
统计应用上常见的谬误.doc_第1页
第1页 / 共54页
统计应用上常见的谬误.doc_第2页
第2页 / 共54页
统计应用上常见的谬误.doc_第3页
第3页 / 共54页
统计应用上常见的谬误.doc_第4页
第4页 / 共54页
统计应用上常见的谬误.doc_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《统计应用上常见的谬误.doc》由会员分享,可在线阅读,更多相关《统计应用上常见的谬误.doc(54页珍藏版)》请在金锄头文库上搜索。

1、统 计 应 用 上 常 见 的 谬 误谢邦昌 辅仁大学统计系教授兼主任 叶瑞铃 辅仁大学应用统计研究所研究生壹、绪论让统计结果更接近事实一、研究动机 统计是一门新兴的科学,可号称是人类在二十世纪的十个伟大发现之一。自二十世纪初,从Neyman、Pearson及Fisher等人发表一连串开拓性论文之后,统计便不断地蓬勃发展,一直到今天,不论在自然科学或是社会科学的各个领域中,都找得到它的踪迹。事实上,它已成为我们生活中的一部份。 随着现代科学的不断发展,统计学不仅早已从数学中独立出来,而也已成为在社会科学研究上的一种专门的学科。今日在科学研究中,统计分析的应用早已有其不可或缺的重要地位,不仅于此

2、,在一般人的生活周遭上的应用上,甚至在个人理财活动中都少不了统计分析的应用。因此,将统计学当成一种解决问题、寻求真相的工具,咸信将使统计对人们的生活产生更大的影响及帮助。 统计的应用范围极广,其方式主要在搜集、整理、陈示、分析及解释资料。并可在较少的成本花费下将吾人有兴趣的事物之全体(注1)抽出一部份来观察与研究(注2),然后根据所得到的信息用科学的数量方法来推测所欲了解的事实。所以根据以上所述,统计学又分为叙述统计与推论统计两大部份。现在各方面的研究工作者无一不将统计学视为最有帮助的工具之一,除了在一般的学术研究之外,尤其在工商业的各项业务,如财务、工管、销售等,都需要应用统计资料及统计方法

3、来作分析及推论,方能使各项工作顺利完成(注3)。 近年来,统计确实已受到学界及工商业界的普遍应用;不管是学术研究论文、期刊,或者是政府出版品,乃至于民间企业刊物、杂志等,都可看到统计应用的大幅成长与统计专业程度的要求明显提高。但阅读与参考这些文献、资料的读者往往只专注于统计数字的大小,而忽略了数字背后的涵义,殊不知不少数字可能因为统计分析方法的误用而导致结果推论的错误。因此,探讨一般常见的统计分析应用上的误用情形,为本研究的第一个动机。 研究统计的人都一直深信着统计数字中永远隐藏着某些事实的真相,等待人类的智慧去寻找。多年前有位学者说:Statistics may not tell the t

4、rue, but it never lies.(注4)。这句话反应出统计数字也许不能告诉我们真相,但是它绝对不会撒谎,只有人们才会这么做。因此,如何使统计数字说出真话,并找出统计误用的原因及补救的方法,为本研究的第二个动机。二、研究目的 统计理论继续不断的发展,其所论述的范围及应用的层面愈来愈广,统计除了可叙述数据、推论数据外,更重要的是其预测性的功能。因此,如何善用统计分析工具以帮助完成决策与验证实验假设,实已成为企业经营管理与科学研究之重要课题。以周密的设计,搜集完整的有关资料,经过适当的统计分析所得的结果作为依据,才能使所冒的风险与失策的可能愈小,而迅速得到预期的目的(注5)。 综合以上

5、所述与研究动机,遂引发本研究之目的: (1)探讨统计分析应用上常见的错误情形。 (2)了解统计分析误用的原因及探讨其补救的方法。三、研究范围 统计的应用与分析方法的范围甚广,本研究仅就下列二部份进行探讨: (1)学术研究部份:针对各类学术论文之研究设计、资料分析、论文撰写部份加以讨论。 (2)日常生活应用部份:如民意调查、收视率调查等等生活上常见的统计应用方面加以讨论。 本研究先针对上述二个范畴中常犯的错误情形加以讨论,其次以实际的情形举例说明,并讨论其改进与补救方法。 此外,文内所提之例子并不列出其出处,一方面维护他人写作之权益,另一方面保障并尊重其隐私权。 注释1.在统计的术语中称之为母体

6、。2.在统计的术语中称为母体的任何部份集合为样本。3.蔡宗儒(淡江大学统计系讲师),统计与生活,社 教资料杂志,第二二期,p4。4.郑天泽(政治大学统计研究所副教授),统计之应用 ,社教资料杂志,第二二期,p3。5.颜月珠(台湾大学财务金融学系教授),商用统计 学,三民书局八版,民国82年8月。 贰、统计应用常犯的谬误 在本部份,将分别针对实务应用上在统计分析时常见之错误情形,经归纳与整理后分述于后。一、抽样方法的不适当样本是否能代表母体 ? 1.抽样方法概论 基本上,抽样理论包含三个主要的部份抽样、估计、推论。抽样在于给予从母体抽取样本的规则;估计在于利用样本统计给予母体值的点估计;推论在于

7、给予母体值的区间估计。在本部分仅针对抽样部份进行探讨。 抽样方法在统计中的重要性可由图21中清楚的看出。图21 抽样对统计之重要性图示 为了解母体的性状,经由抽样调查,并以其结果推测母体,此为统计推论的必要过程(注1)。抽样方法选择的适当与否,不仅影响着如何估计,而其精确(precision)度及误差(error),皆关系着整个样本是否可有效的推估母体。 此外,在实务应用上,抽样方法也涉及两个重要的因素:即效率与成本。提高效率与降低成本为每个从事研究或调查者所追求的目标。 抽样方法可分为:机率抽样与非机率抽样两种。在此我们可简单的将两者加以区别:机率抽样可推估母体;非机率抽样因其较主观而产生偏

8、歪样本,故只能找出母体的某些特性,而未必能推估母体。故一般较严谨的调查或研究其抽样皆以前者方式为之。而常见的机率抽样又可分成:单纯随机抽样(simple random sampling)、分层随机抽样(stratified random sampling)、部落抽样(cluster sampling)、系统抽样(system sampling)、多阶段抽样(multi-stage sampling)。非机率抽样则以任意抽样(convenience sampling)、判断抽样(judgement sampling)、配额抽样(quote sampling)为代表。 选择抽样方法时之基本考虑为:

9、样本结构是否和母体结构有一致性。因此这也是为何在完成抽样后必须作适合度检定的理由,基于此项大原则我们才可选择适合母体结构的抽样方法。在此对各抽样方法及其特殊步骤不作多述,仅将其优、缺点及适用时机列于表21。表21 各种抽样方法之比较抽样方法优点缺点适用时机简单随机抽样法分层抽样法部落抽样法系统抽样法1.母体名册完整时,直接由母体中随机抽出样本,方法简单。2.由于抽出机率均等,较易估计母体总值及抽样误差。1.层间差异愈大,层内差异愈小。2.适当分层抽样推论之误差,恒较简单抽样为低。3.可得到各层之估计值。1.当部落间差异愈小,部落内差异愈大,则抽出样本统计精确度愈高。2.部落内样本较为集中,访查

10、员行动半径不大,可节省调查人力及费用。1.随机起号仅需抽出一个,以后累加即可。2.当个体序列成随机出现时,其推估精确度和简单抽样相同。1.通常推算结果之精确度,较分层集体、分段抽样法为低。2.由于抽出样本较为分散,所需调查人力费用较高。3.无法估计子母体特征。分层后之样本数据,其整理推算工作,通常较简单抽样为繁。1.以部落为抽样单位,各项整理统计费用将会增加,故一般多采成对抽取,便于估计误差。2.通常在各部落内分子无甚差异时,将增加部落间差异,调查结果误差必大。3.各部落内含个体多寡不同时,亦使误差加大。1.当母体名册和个体单位数不完整时,无法采用。2.遇有个体成某种周期序列,又恰与抽样间隔相

11、近时,则抽样误差较大。1.母体较小且知道抽样单位的数量。2.有较完整的母体名册。3.单位访问成本较为固定。4.母体名册是有关母体信息的唯一来源。1.当样本的分层达到各层的抽样单位的特性尽量接近,而层与层之间的差异尽可能地扩大时使用。2.当母体中的特殊单位较多或分布不均匀时,为避免抽样误差亦使用之。1.当母体成若干部落,且部落与部落间个体同质,而同一部落内个体异质时使用。2.当无法取得母体集团名册或划样样本对象为前提时使用。1.母体有现成次序的场合时使用。2.使用此法时于划分间隔抽取的母体,其所有个体的排列次序必须是随机的。抽样方法优点缺点适用时机多阶段抽样法任意抽样法判断抽样法配额抽样法1.多

12、阶段抽样法为群集与分层抽样之折衷办法,兼取两者之优点。2.配合行政区域抽样,抽取手续与调查管理均较便利。根据调查者自身的方便程度,不依据特定的抽样原则,具有经济、方便之优点。可由人为意志自由选择调查对象,不受抽样设计条件之各种限制,容易进行调查。适用于母体集团无法取得,且抽样手续简便,为营销研究者所乐于使用。分段抽样之误差可能加大,且整理分析较其它抽样复杂。调查结果容易产生偏误,如盲人摸象。调查结果无法推估母体平均数及抽样误差,如选择不当,其误差可能甚大。合乎条件之样本难得,抽样之误差也未能估计。当母体集团分布广而散时,如以一段式抽样,势必耗时、耗费,此时则以多段式抽样弥补其缺失。由调查者主观

13、决定。由调查者主观决定。由调查者主观决定。 最后要提到的是,选择一个适合的抽样方法固然重要,但抽样过程的处理不当亦可造成人为的疏失,而导致结果的错误增加,亦是值得注意的问题。2.常犯的错误情形 由以上说明我们可知:抽样方法对整个统计分析的过程与结果影响甚大。而一般影响调查者对抽样方法之选择的因素不外乎(1)正确性、(2)方便性、(3)时间、(4)费用。此四项因素往往无法兼顾,这也是为何一些研究者在其研究论文中常会提及因时间、经费不足等之研究限制了!事实上,在抽样方法上的错误也多半因此四项因素而发生。 我们常发现:许多以商品之消费行为之研究、与之关系性研究或商品之市场调查等为题之研究或调查,其研

14、究母体为所有消费者或所有某一特定族群,但调查者往往会先将抽样母体定为台北市、台中市、高雄市三区(此一观念类似部落抽样法之部落定义),在从其中用简单随机抽样、分层抽样或部落抽样等方法抽出若干样本数来统计分析,最后则用这些样本来代表所有的母体,如此以偏盖全的说法,更别说抽样及估计误差之估算了! 更甚者,一些如收视率调查、民意调查等的数据数据在此方面的错误与影响更大;因为这些数据大多会透过媒体的报导而误导消费者,进而影响其判断与决策。在日常生活中这类错误讯息层出不穷,如某报纸报导:电视公司八点文件连续剧收视率突破40,勇冠三台。如某报纸民意测验结果:候选人民众支持率达50,大幅领先其它两位候选人。但在相信这些数字之前,我们至少应先了解其抽样方法是否正确与适当,否则它们根本毫无意义可言!二、样本大小的问题勿又要马儿好,又要马儿不吃草1.决定样本大小

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 事务文书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号