论文中数据的统计学问题

上传人:cl****1 文档编号:474732526 上传时间:2024-01-25 格式:DOC 页数:6 大小:24.50KB
返回 下载 相关 举报
论文中数据的统计学问题_第1页
第1页 / 共6页
论文中数据的统计学问题_第2页
第2页 / 共6页
论文中数据的统计学问题_第3页
第3页 / 共6页
论文中数据的统计学问题_第4页
第4页 / 共6页
论文中数据的统计学问题_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《论文中数据的统计学问题》由会员分享,可在线阅读,更多相关《论文中数据的统计学问题(6页珍藏版)》请在金锄头文库上搜索。

1、精品范文模板 可修改删除撰写人:_日 期:_论文撰写中要注意的统计学问题(转)(一、均值的计算 在处理数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。此时,往往我们会不假思索地直接给出算术平均值和标准差。显然,这种做法是不严谨的。这是因为作为描述随机变量总体大小特征的统计量有算术平均值、几何平均值和中位数等多个。至于该采用哪种均值,不能根据主观意愿随意确定,而要根据随机变量的分布特征确定。反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布时,其数学期望就是其算术平均值。此时,可用算术平均值描述随机变量的大小特征;如果所研究的随机

2、变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。在这种情况下,可通过假设检验来判断随机变量是否服从对数正态分布。如果服从对数正态分布,则几何平均值就是数学期望的值。此时,就可以计算变量的几何平均值;如果随机变量既不服从正态分布也不服从对数正态分布,则按现有的数理统计学知识,尚无合适的统计量描述该变量的大小特征。此时,可用中位数来描述变量的大小特征。因此,我们不能在处理数据的时候一律采用算术平均值,而是要视数据的分布情况而定。二、直线相关与回归分析 这两种分析,说明的问题是不同的,既相互又联系。在做实际分析的时候,应先做变量的散点图,确认由线性趋势后再进行统计分析。一般先做相关分析

3、,只有在相关分析有统计学意义的前提下,求回归方程才有实际意义。一般来讲,有这么两个问题值得注意: 一定要把回归和相关的概念搞清楚,要做回归分析时,不需要报告相关系数;做相关分析的时候,不需要计算回归方程。 相关分析中,只有对相关系数进行统计检验(如t检验),P0.05这种无统计学意义的结论;而当样本量很大,如500,即使r=0.1,也会有P0时,表示两变量正相关,r0时,两变量为负相关。* 当|r|=1时,表示两变量为完全线性相关,即为函数关系。* 当r=0时,表示两变量间无线性相关关系。* 当0|r|1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接

4、近于0,表示两变量的线性相关越弱。* 一般可按三级划分:|r|0.4为低度线性相关;0.4|r|0.7为显著性相关;0.7|r|1为高度线性相关。在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种.在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.反之,其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得.2性质编辑符号x如果能够表示对象集合S

5、中的任意元素,就是变量。如果变量的域(即对象的集合S)是离散的,该变量就是离散变量;如果它的域是连续的,它就是连续变量。连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。13区分连续变量(continuous variable)与离散变量(discrete variable)2的简单区分方法连续变量与离散变量的简单区别方法:连续变量时一直叠加上去的,增长量可以划分为固定的单位,即:1,2,3 例如:一个人的身高,他首先长到1.51,然后才能长到1.52,1.53;在百度贴

6、吧中,用户首先要有1个粉丝,其后他才能有2,3位粉丝。而离散变量则是通过计数方式取得的,即是对所要统计的对象进行计数,增长量非固定的,如:一个地区的企业数目可以是今年只有一家,而第二年开了十家;一个企业的职工人数今年只有10人,第二年一次招聘了20人等。 分类变量可分为无序变量和有序变量两类。释义无序分类变量(unordered categorical variable)是指所分类别或属性之间无程度和顺序的差别。,它又可分为二项分类,如性别(男、女),药物反应(阴性和阳性)等;多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。有序分类变量有序分类变量(ordinal categorical variable)各类别之间有程度的差别。如尿糖化验结果按、+、+、

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > 总结/计划/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号