体育科研中的统计信息

上传人:206****923 文档编号:40493292 上传时间:2018-05-26 格式:DOC 页数:5 大小:44.50KB
返回 下载 相关 举报
体育科研中的统计信息_第1页
第1页 / 共5页
体育科研中的统计信息_第2页
第2页 / 共5页
体育科研中的统计信息_第3页
第3页 / 共5页
体育科研中的统计信息_第4页
第4页 / 共5页
体育科研中的统计信息_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《体育科研中的统计信息》由会员分享,可在线阅读,更多相关《体育科研中的统计信息(5页珍藏版)》请在金锄头文库上搜索。

1、体育科研中的统计信息体育科研中的统计信息魏登云(安徽师范大学体育学院,安徽 芜湖 241000)摘要:摘要:为了探讨提高和评价体育科研中统计分析的效果,根据统计信息系统运行过程与运用统计方法定量研究实际问题的过程同步的事实,从统计信息的角度,揭示了统计分析过程的一般规律,提出值得注意的问题。关键词:关键词:体育科研;统计信息;统计分析1 前言前言统计信息是指运用统计方法获得的信息,从哲学的层面看,统计信息是统计主体根据宿体的需要,运用统计方法,经过一系列统计活动所取得的关于被认识客体的状态、结构、功能及其发展变化规律性的客观描述。实际工作中,人们运用统计方法对具体问题进行定量研究,实质上是对统

2、计信息的处理,从统计设计到统计处理再到统计结果的分析,体现了统计信息的收集、加工、开发和解释的过程,形成了一个完整的统计信息系统,在这个系统中各环节相互联系、相互影响。统计处理的科学性以及统计分析结果的价值,取决于统计信息系统的运行质量。因此,如何使这个系统运行有序、高效,是统计处理和分析工作的根本宗旨,也是衡量统计方法运用质量的标准。在体育科研中,由于体育现象自身的复杂性,统计信息系统相对比较复杂,表现在信息广而杂,信息成分复杂,信息提取和加工困难,信息的解释具有多样性等。如果科研人员(统计主体)不清楚统计信息系统的运行规律,缺乏统计信息意识,那么在实际工作中遗漏重要信息、误用统计信息的现象

3、将难以避免,目前国内体育统计应用中存在的问题已经说明了这一点。针对体育科研的具体情况,本文拟从实际应用的角度,讨论统计信息的搜集、提取、开发和解释。2 统计信息源统计信息源在信息论中,信源就是客体,是研究对象的全体即统计总体,分析问题所需要的所有信息都来自信源,统计信源的确定是通过统计设计来实现的。2.1 信源属性属性是确定信源的关键,它决定了信源的内容和范围,使主体明确需要搜集客体哪些方面的信息,从而对原始信息的质量起决定作用。属性是由研究目的来确定的。例如,在调查研究中,设计者需要根据研究目的,明确待查对象的属性,了解其是否具有需要的信息,然后才能确定调查对象和内容。如果设计者对属性不明确

4、,那么信源可能就不具有同质性,搜集的信息可能很杂。2.2 信息载体统计信息的基本物理载体是统计数据,统计数据是载荷统计信息的一种符号。在这应用中,选择信息载体往往表现为选择统计指标以及度量指标的数字或符号,指标的选择以其是否较好地反映待测属性为标准,即所选的指标是否较多地含有课题需要的信息。实际上,任何一项指标都不可能百分之百地含有我们需要的信息,总是带有一定的无用信息或干扰信息,特别是当我们准备选择某些不是很熟悉的指标时,需要进行效度分析;选择指标可能会遇到的另外一个问题是漏掉一些“价1值信息”含量很高的指标,这样会造成信息载体结构不合理,从而使统计信息不客观。因此,设计统计指标时应经过有关

5、专家详细论证。2.3 信息计量方法信息载体的最终表示形式是数字或符号,因此数字的性质不同或者符号的含义不同,信息的含量或含义就不一样。例如,测量学的四种量表中,比例量表的信息含量比有序量表就多,应用中能用高级量表表示的,则不用低级量表,避免信息损失。实际问题是复杂多样的,有时候在一组数据中会含有多种信息,有的是价值信息,而有些却是非价值信息甚至是干扰信息。因此从信源开始,对原始信息进行适当的净化处理,有时候是有益的。例如,配对资料 X=(x1,x2,xn)与 Y=(y1,y2,yn)中均含有反映个体之间差异的信息,这种信息对研究目的来说没有什么价值,如果考虑 XY,则其中的信息价值明显。所以如

6、果以XY 为信息载体则原始信息就净化了2.4 主体信息与客体信息信息源指的是客体,主体与客体是根据研究目的自然划分的,研究目的不同,主体与客体就会变化。例如,研究者设计 n 项指标,邀请 m 位专家就各项指标的重要性按等级计分,目的是筛选指标,那么 m 位专家是客体;如果研究目的是分析各项指标之间的关系,那么需要就 n 项指标对若干名受试者进行测量,这若干名受试者是客体,而以上 m 位专家就不能作为信源,两种信源所载信息有本质区别。关于信源的确实,原则上以客体是否载有所需信息为标准。因此,主体对所需信息的认识是至关重要的,哪些是价值信息,哪些是干扰信息,至少要胸中有数,在统计设计时最大限度地保

7、留价值信息,净化信源。作为统计主体,总是希望信源能被充分净化,但实际工作中很难做到,多种信息混合于同一信源是难免的,所以对信源发出的统计信息需要加工。3 统计信息的加工统计信息的加工加工统计信息的手段是统计量,加工方式有两种:信息的集中与信息的分离。3.1 统计量统计量是统计信息的二级载体,是对原始数据的初步加工。一般来说,原始数据被加工成统计量,原始统计信息会有损失,因此在构造统计量时,必须根据研究目的,分清价值信息和非价值信息,尽量减少价值信息的损失。平均数、标准差和率是统计应用中最常用的统计量,原因就在于很多实际问题中原始信息的损失很小。例如,在正态总体中,样本平均数和标准差是关于总体参

8、数的充分统计量,基于充分统计量对总体参数作推断时,统计信息没有损失。但对于非正态总体,情况就不一样了,基于平均数和标准差作出的推断可能会损失原始信息,必要时增加统计量。衡量统计量优劣的标准就是价值信息的保护程度,充分统计量是最理想的,如果充分统计量难以找到,那么统计量的大样本性质是值得考虑的。3.2 统计信息的集中信源中的原始信息可能多种多样,根据研究目的,研究者需要滤掉干扰信息,将价值信息集中起来,用统计量来集中反映。例如在多元统计中,变量之间线性关系的信息集中蕴含在协方差矩阵之中。值得注意的是,在我们过滤干扰信息时,不要把重要的价值信息也滤掉了。例如,体操比赛中,6 位裁判员给运动员评分,

9、去掉一个最高分,再去掉一个最低分,以剩下 4 个分数的平均数作为最后得分,这里去掉最高和最低两个分数的目的是过滤干扰信息,但同时也滤掉了一些重要信息。2比如裁判员对所有运动员名次的判定。因为竞技体育比赛中评分的目的是给参赛选手排出最终名次,所以各裁判员对运动员名次的判定应该说是重要信息,尽管去掉的是两个极端分,但是裁判员个人对名次判定的信息等于全部损失了。3.3 统计信息的分离信源中的多种信息交织在一起,研究者在作信息处理时,需要将有关的信息分离开来,分别量化,以达到统计分析的目的。最典型的例子就是方差分析,方差分析的本质就是将总变异分解成可以追溯到其来源的几部分变异之和,实质上也就是把反映几

10、个不同来源(因素)效应的信息分离开来,并以离差平方和来度量。例如,在双因子有交互效应方差分析中,我们关心的关于变异的所有信息都在总变异中,通过分解把反映因子 1 的效应、因子 2 的效应、交互效应以及随机因素造成的变异的信息分离开来,以方差量化,从而进行推断。另一个例子,多元分析中的协方差矩阵含有各变量的方差和变量之间相关关系两部分信息,如果我们想考虑各变量的方差,那么协方差矩阵的迹就反映了这部分信息;如果要消除各变量方差的影响,单纯考虑变量之间的关系,那么从协方差矩阵中将反映变量方差的信息分离出去,就得到相关系数矩阵,下面的式了说明了分离的办法。121121)V()V(2121VV其中为协方

11、差阵,为相关系数矩阵,为标准差矩阵。21V信息的分离要根据研究目的,具有针对性,其中研究者对各部分信息的认识以及如何量化是很重要的。4 统计信息的开发统计信息的开发统计信息具有层次性,原始统计信息是最基本的信息,是描述客体在一定时空条件下所处的状态的信息,是直接测量的结果。研究者运用科学的统计方法对原始信息进行加工分析,得到反映客体综合特征的新信息,这便是统计信息的开发。经过开发得到的深层次的统计信息是原始信息的再生信息,表现为实质性信息、预测性信息和决策支持性信息。在体育科研中,人们运用统计方法对原始数据进行的各种处理,都是统计信息的开发。4.1 充分利用原始信息开发再生信息是以原始统计信息

12、为基础的,统计数据中各部分信息有的可能是相互联系,互为补充的,应用中如果孤立地使用部分信息,而忽视另一部分重要的相关信息,可能会造成开发出的统计信息失真。例如,多元分析中,各指标之间往往都具有相关性,这种相关信息对统计推断具有很大影响,如果针对单一指标逐个进行分析(多元问题一元化处理) ,就忽视了变量之间的相关信息,得出的结果自然是不可靠的。再看一个具体例子。例 1 一项中学生体育消费的调查研究,研究者按社会上可能的 10 种消费类型设计问卷,共收回 200 份有效问卷,经初步计算,得男女生各消费类型的平均消费额(见下表) 。为了比较男、女生总消费额是否有差异,研究者按表中计算,得 d=0.6

13、56,s=9.056,n=10,采用假设检验方法,得 t=0.229,结论:男女生总消费额差异不显著。3表 男女生消费额差异比较服装报刊器材培训比赛音像纪念品资料营养捐款男(x1)65.699.0521.825.474.293.806.052.6636.607.17女(x2)83.257.7917.3515.753.586.296.591.6719.327.57(x1-x2)-17.561.264.47-10.280.71-2.49-0.540.9917.28-0.40该问题的处理显然是错误的。根据研究目的,需要推断的是男女生总消费额有无差异,所以男生和女生内部个人总消费额之间的差异是个重要的

14、价值信息,而在消费类型上的差异是非价值信息,该例的处理方法恰恰是使用非价值信息,而丢掉了价值信息。4.2 深刻理解原始信息理解原始信息,掌握统计数据中含有哪些信息,是信息开发的前提。如果研究者对原始数据中含有的信息不清楚或者认识错误,那么处理信息就是盲目的,开发出的再生信息就难以解释,甚至失真。例 2 某研究者为建立某种评价指标体系,设计 n 项指标,请 m 位专家对初步拟出的指标就其重要程度打分,然后以专家给出的分数为原始数据,进行因子分析,提取少数几个公因子,建立评价模型。该例中原始数据载有的信息是“各项指标的相对重要性” ,而不是指标之间的相关,主成分和因子分析是处理指标之间相关信息的一

15、种手段,所以例 2 中运用因子分析是不恰当的。其实针对例2 中的原始信息,直接统计各指标的得分,已经可以达到精减指标的目的了。5 再生信息的解释再生信息的解释经过一系列的信息运动过程,开发出的再生信息需要反馈到客体,得到合理的解释,才具有使用价值。解释统计信息,有以下几个方面值得注意。5.1 结合实际从方法论角度看,信息是反映客观物质世界的一种思维形式,开发出来的统计信息必须结合具体问题,才具有实际的意义。况且,原始统计信息经过一系列的加工、处理,也有可能使再生信息失真,需要结合实际进行检验。5.2 结合信息来源再生信息是在原始信息的基础上开发的,从量的角度看不会超过原始信息,所以再生信息只能

16、针对信源作解释,尤其是运用范围,不能无限扩大。5.3 注意基础信息在信息开发过程中,有时可能使用了一些基础信息(默认或假定的) 。例如总体服从正态分布等,那么这些基础信息实际上已经成为再生信息的前提,因此在解释和反馈再生信息时必须明确这一点。6 小结小结在体育科研中,运用统计方法解决实际问题的过程实质上是统计信息系统的运行过程,统计处平均消费 额消费 类型性别4理的效果取决于统计信息系统内部各环节的运行质量。该系统在运行过程中,应始终遵循“客观、公正”的原则,无论是原始信息的提取、加工和开发,还是再生信息的解释和反馈,都以不放大、缩小价值信息量为原则,当然对各部分统计信息的准确识别是前提。主要参考文献:主要参考文献:1王振龙统计哲学研究M北京:中国统计出版社,2002 2魏登云主成分与因子分析在体育综合评价中的应用检测J体育科学,2003,23(4):4851 3魏登云主观评分误差的非参数处理方法J中国体育科技,2001,37(3):3840 4魏登云体育科学研究中数据变异的分类及处理J四川体育

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号