怎样计算离散度

上传人:桔**** 文档编号:563892120 上传时间:2022-09-19 格式:DOCX 页数:7 大小:47.54KB
返回 下载 相关 举报
怎样计算离散度_第1页
第1页 / 共7页
怎样计算离散度_第2页
第2页 / 共7页
怎样计算离散度_第3页
第3页 / 共7页
怎样计算离散度_第4页
第4页 / 共7页
怎样计算离散度_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《怎样计算离散度》由会员分享,可在线阅读,更多相关《怎样计算离散度(7页珍藏版)》请在金锄头文库上搜索。

1、离散度-如何反应一组数据的离散程度在EXCEL中用STDEV求标准差,用AVERGE求平均值,在用标准差比上平均数即可,变异系数越小越稳定。(2012-08-30 22:00:46)转载标签:分类:数学物理,概率统计,机器学习标准差离均差标准误平均值样本离散度标准差是反应一组数据离散程度最常用的一种量化形式,是表示精确度的重要指标。说起标 准差首先得搞清楚它出现的目的。我们使用方法去检测它,但检测方法总是有误差的,所以 检测值并不是其真实值。检测值与真实值之间的差距就是评价检测方法最有决定性的指标。 但是真实值是多少,不得而知。因此怎样量化检测方法的准确性就成了难题。这也是临床工 作质控的目的

2、:保证每批实验结果的准确可靠。虽然样本的真实值是不可能知道的 ,但是每个样本总是会有一 个真实值的,不管它究竟是多少。可以想象,一个好的检测方法,其检测值应该很紧密的分 散在真实值周围。如果不紧密,与真实值的距离就会大,准确性当然也就不好了,不可能想 象离散度大的方法,会测出准确的结果。因此,离散度是评价方法的好坏的最重要也 是最基本的指标。一组数据怎样去评价和量化它的离散度呢?人们使用了很多种方法:极差最直接也是最简单的方法,即最大值最小值(也就是极差)来评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛中去掉最高最低分就是极差的具体应用。离均差的平方和由于误差的不可控性,因此只由

3、两个数据来评判一组数据是不科学的。所以人们在要求 更高的领域不使用极差来评判。其实,离散度就是数据偏离平均值的程度。因此将数据与均 值之差(我们叫它离均差)加起来就能反映出一个准确的离散程度。和越大离散度也就越大。 但是由于偶然误差是成正态分布的,离均差有正有负,对于大样本离均差的代数和为零的。 为了避免正负问题,在数学有上有两种方法:一种是取绝对值,也就是常说的离均差绝对值 之和。而为了避免符号问题,数学上最常用的是另一种方法平方,这样就都成了非负数。 因此,离均差的平方和成了评价离散度一个指标。平均绝对偏差(是否可以交成:平均绝对方差?绝对差?) , 离均差 平方求期望(即方差,即均差平方

4、求期望,即均差平方和除以数量)是 一个层面上的意思方差(S2)由于离均差的平方和与样本个数有关,只能反应相同样本的离散度,而实际工作中做比 较很难做到相同的样本,因此为了消除样本个数的影响,增加可比性,将标准差(这里应该 改为:离均差的平方)求平均值,这就是我们所说的方差成了评价离散度的较好指标。 样 本量越大越能反映真实的情况,而算数均值却完全忽略了这个问题,对此统计学上早有考虑, 在统计学中样本的均差多是除以自由度(n-1),它的意思是样本能自由选择的程度。当选到 只剩一个时,它不可能再有自由了,所以自由度是n-1。标准差( SD)由于方差是数据的平方,与检测值本身相差太大,人们难以直观的

5、衡量,所以常用方差 开根号换算回来这就是我们要说的标准差。 在统计学中样本的均差多是除以自由度(n-1),它是意思是样本能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是 n-1。变异系数(CV)标准差能很客观准确的反映一组数据的离散程度,但是对于不同的检目,或同一项目不 同的样本,标准差就缺乏可比性了,因此对于方法学评价来说又引入了变异系数CV。组数据的平均值及标准差常常同时做为参考的依据。在直觉上,如果数值的中心以平均值来考虑,则标准差为统计分布之一“自然”的测量。定义公式:其中N应为n-1,即自由度标准差与平均值定义公式1、方差 s9=(xl-x)人2+(x2-x)人2

6、+.(xn-x)人2/(n) (x 为平均数)2、标准差=方差的算术平方根error bar。在实验中单次测量总是难免会产生误差,为此我们经常测量多次,然后用测量值的平均值表示测量的量,并用误差条来表征数据的分布,其中误差条的高度为标准误。这里即标准差 standard deviation 和标准误 standard error 的计算公式分别为标准差标准误解释从几何学的角度出发,标准差可以理解为一个从 n 维空间的一个点到一条直线的距离的函数。举一个简单的例子,一组数据中有3个值,X1,X2,X3。它们可以在3维空间中确 定一个点P = (X1,X2,X3)。想像一条通过原点的直线。如果这组

7、数据中的3个值都相等, 则点P就是直线L上的一个点,P到L的距离为0,所以标准差也为0。若这3个值不 都相等,过点P作垂线PR垂直于L,PR交L于点R,则R的坐标为这3个值的平 均数:公式 运用一些代数知识,不难发现点 P 与点 R 之间的距离(也就是点 P 到直线 L 的距离)是。 在 n 维空间中,这个规律同样适用,把3换成 n 就可以了。EXCEL中AVEDEV计算离散度是什么?wj980314 11级 分类:办公软件 被浏览629次2013.06.07检举EXCEL中AVEDEV计主要是AVEDEV这个函数我不晓的在哪种场合下使用,说是可以算离散度,但是离散度是什么?还能算什 么?ap

8、plcom采纳率:44% 11 级 2013.06.07这是属于统计学的内容,它们的均值偏差大,不能通过方差简单地来反映它们之间的波动,在这种情况下 就要用到变异系数了。变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进 行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单 位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值) 来比较。标准差与平均数的比值称为变异系数,记为C.V。变异系数可以消除单位和(或)平均数不同对 两个或多个资料变异程度比较的影响。在EXCEL中用STDEV求标准差

9、,用AVERGE求平均值,在用标准差比上平均数即可,变异系数越小 越稳定。即观测变量各个取值之间的差异程度。它是用离散程度编辑所谓离散程度(Measures of Dispersion),以衡量风险大小的指标中文名离散程度外文名Measures of Dispersion类别指标衡量风险大小含义观测变量各个取值之间的差异程度意义各个观测个体之间的差异大小目录1离散程度的测度意义2离散程度的测度指标1、通过对随机变量取值之间离散程度的测定,可以反映各个观测个体之间的差异大小, 从而也就可以反映分布中心的指标对各个观测变量值代表性的高低。2、通过对随机变量取值之间离散程度的测定,可以反映随机变量次

10、数分布密度曲线的2可用来测度观测变量值之间差异程度的指标有很多,在统计分析推断中最常用的主要 有极差、平均差和标准差等几种。1、极差极差又称全距,是观测变量的最大取值与最小取值之间的离差,也就是观测变量的最大观测值与最小观测值之间的区间跨度。极差的计算公式为:R= Max(xi) - Min(xi)2、平均差平均差是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了 总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动 度越小。3、标准差标准差是随机变量各个取值偏差平方的平均数的算术平方根,是最常用的反映随机变 量分布离散程度的指标。标准差既可以根据

11、样本数据计算,也可以根据观测变量的理论分布 计算,分别称为样本标准差和总体标准差标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代 表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。例如,两组数的集合0, 5, 9, 14和5, 6, 8, 9其平均值都是7,但第二个集合具有 较小的标准差。标准差可以当作不确定性的一种测量。例如在物理科学中,做重复性测量时,测量数 值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值,测量值的标准差 占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则 认为测量值与预测值互相矛盾。这很容易理解,因为值都落在一定数值范围之外,可以合理 推论预测值是否正确。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号