统计学相关知识概述(共26页)

上传人:1537****568 文档编号:221499242 上传时间:2021-12-11 格式:DOC 页数:26 大小:815KB
返回 下载 相关 举报
统计学相关知识概述(共26页)_第1页
第1页 / 共26页
统计学相关知识概述(共26页)_第2页
第2页 / 共26页
统计学相关知识概述(共26页)_第3页
第3页 / 共26页
统计学相关知识概述(共26页)_第4页
第4页 / 共26页
统计学相关知识概述(共26页)_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《统计学相关知识概述(共26页)》由会员分享,可在线阅读,更多相关《统计学相关知识概述(共26页)(26页珍藏版)》请在金锄头文库上搜索。

1、小黄: 这是第三章到第五章的公式及其适用条件,放在公式库中,能与文本中相应的公式链接,学员点击时弹出对话框,并且可以在公式库中搜索。另外几章过段时间给你。课件已发给你,主要是让学员下载。第三章 集中量数算术平均数设变量代表各次观测的结果,为观测的次数,则 (3.1)式中,表示各次观测的结果,为观测的次数;表示从的连加到的的和;公式(3.1)可简写为: 算术平均数的适用条件:1适用于同质数据。 2要求一组数据中每个数据都比比较准确、可靠,若数据模糊不清或分组资料有不确定组限时,不能计算算术平均数。 3无极端值出现。这是由于算术平均数受极端数据影响较大的缘故。4需要得到一个相对精确可靠的集中量数或

2、进个步参与其他运算时。分组资料求算术平均数 (3.2)式中,表示对次数分布表计算的算术平均数;表示各组的组中值;表示各组对应的次数;表示总次数。如果数据已经整理成次数分布表的形式,可根据公式(3.2)来计算算术平均数加权算术平均数 (3.3)式中,表示加权算术平均数;W为每一数值X所对应的权重;表示数据与其对应权数乘积的总和;表示权数之和。在考虑各统计事项在其总体中所占的重要性程度不同,使每一统计数据对算术平均数的影响与各自的重要性程度相吻合时使用此公式。中位数 (3.4)式中,表示中位数;表示中位数所在组的精确下限;表示中位数所在组对应的向上累积次数;表示中位数所在组对应的次数;表示组距;为

3、总次数。中位数的适用条件:(1)当一组数据有极端值出现时;(2)当一组有序数据两端有个别数据模糊不清或分组资料有不确定组限时时;(3)当需要快速估计一组数据的代表值时。 (3.5)式中,表示中位数;表示中位数所在组的精确上限;表示中位数所在组上限以上的累积次数;表示中位数所在组对应的次数;表示组距;为总次数如果次数分布表是自上向下累积,则计算中位数要用公式(3.5)几何平均数 (3.6)式中,为n个数据值(实际上是后一个数是前一个数的倍数)。应用时机:求一组等比或近似等比数据的平均数时;一组数据中,有少数偏大或偏小的数据,数据分布呈偏态,求平均数时;在教育上主要应用几何平均数求平均发展速度或对

4、某项目标进行预测估计。平均发展速度设为各阶段某种统计量值,其中为初期量、为末期量,为各阶段环比发展速度,即,则 (3.7)式中,为初期量、为末期量,为跨年度数如果已知初期量和末期量,就可以用公式(3.7)求平均发展速度。根据平均发展速度可计算平均增长率,并依此对某种教育现象进行预测。平均增长率若以表示平均增长率,则=MG1 (3.8) (3.9)MG为平均发展速度,为初期量、为末期量公式(3.8)是公式(3.9)在教育实践中的应用。在已知平均增长率和初期发展状况的情况下,可预测若干时段以后的发展情况。第四章 差异量数全距指一组观测值中,最大数值与最小数值之差,是描述一组观测值离散程度最简单的一

5、种差异量数,计算公式为: (4.1)式中,为最大观测值;为最小观测值全距只取决于观测值中两个极端数据,不能反映其他数据的分散情况。因此,全距很不稳定、可靠,是一种低效的差异量数。平均差平均差是指一组数据中所有原始数据与平均数绝对离差的平均值,公式为: (4.2)式中,为原始观测值,为组中值;为平均数平均差是根据数据分布中每一个观测值求得的,较好地代表了数据分布的离散程度。但在计算过程中要求离差并求其绝对值,不方便于代数运算,不利于做进一步统计分析,在实践中应用不多。 (4.3)式中,为原始观测值,为组中值;为平均数;为各组次数公式(4.3)适合于计算分组资料的平均差总体方差 (4.4)式中,为

6、原始观测值;为平均数;为观测值个数样本方差 (4.5)式中,为原始观测值;为平均数;为观测值个数适用条件:(1)与算术平均数配合使用,与算术平均数的使用条件相同。即一组数据的一般水平适合算术平均数描述时,其离散程度宜用标准差来描述。(2)进一步参与其他运算时。如计算差异系数、标准分数、相关系数等其他统计量时,要用到标准差。(3)在推断统计,尤其在方差分析时,常用方差表示数据的离散程度。总体标准差: (4.6)式中,表示总体标准差;表示原始观测值;表示由观测值计算的算术平均数;N表示观测总次数样本标准差 (4.7)式中,表示样本标准差;表示原始观测值;表示由观测值计算的算术平均数;N表示观测总次

7、数适用条件:(1)与算术平均数配合使用,与算术平均数的使用条件相同。即一组数据的一般水平适合算术平均数描述时,其离散程度宜用标准差来描述。(2)进一步参与其他运算时。如计算差异系数、标准分数、相关系数等其他统计量时,要用到标准差。(3)在推断统计,尤其在方差分析时,常用方差表示数据的离散程度。由原始观测值计算标准差公式 (4.8)式中,为标准差,为原始观测值,为观测值个数,为原始数据的平方之和该公式适用于用原始数据计算标准差的情况。用原始数据计算标准差,充分利用了每一个原始观测值来计算标准差,精确度很高,同时不需要先求出平均数,计算更简单。次数分布表资料计算标准差的公式 (4.9) (4.10

8、)式中,表示组中值;表示各组对应的次数;为总次数。以上这两个公式适用于对次数分布表计算标准差。分组资料求标准差,用组中值做为各组数据的代表值。适用条件同标准差。 由各样本标准差合成总体标准差 (4.11) (4.12)式中,为总标准差,为总方差,为总体中数据的个数,各部分数据的标准差;为各部分平均数与总平均数之差,即,其中当已知总体中各部分的标准差,合成其总体标准差时可利用此公式。标准差的合成在科研协作和管理中常常用到。四分差公式 (4.13)式中,表示四分差;表示第1四分位数;表示第3四分位数。分差反映的是数据分布中中间50%数据的离散情况,不受极端值的影响,常用于衡量中位数的代表性。其适用

9、条件是:第一,通常与中位数配合使用;第二,一组数据有极端值出现时,常用四分差描述其散布情况;第三,一组数据的两端有个别数据模糊不清或分组资料有不确定组限时。第一四分位数与第三四分位数计算公式: (4.14) (4.15)式中,表示该四分位数所在组的下实限;、表示、所在组的次数;表示该四分位数所在组下一组对应的向上累积次数;表示组距;为总次数差异系数差异系数又称变异系数、相对标准差,是标准差与平均数的比值,不具有实际测量单位 (4.16)式中 ,表示变异系数;表示标准差;表示平均数适用于:(1)两个或两个以上的样本所使用的观测工具不同,所测量的特质不同,进行观测值差异程度的比较;(2)两个或两个

10、以上的样本所使用的观测工具和测量的特质相同,但样本间的水平相差较大时进行观测值差异程度的比较。差异系数大,表明数据的离散程度大,反之数据的离散程度就小。标准分数标准分数是以算术平均数为参照点,以标准差为单位,表示每一个原始数据在其团体中的相对位置,是一个相对位置量数。 (4.17)式中,表示原始数据;表示原始数据的算术平均数;表示原始数据的标准差标准分数主要用于:确定原始分数在其团体中的相对位置;比较不同单位的观测值相对位置的高低;用于考试分数的合成;用于表示标准测验分数标准分数转换公式: (4.18)式中,为标准分数, 、为常数百分等级百分等级是指一组有序数据中某一数据以下所含次数占总次数的

11、百分比。百分等级越低,个体在团体中所处的地位越差 (4.19)式中:PR为百分等级;R为给定分数在团体中的等级;N为总次数适用范围:未分组资料计算百分等级 (4.20)式中:X为给定的计算百分等级的分数;为X所在组以下各组次数之和;为X所在组的精确下限;为所在组的次数;表示组距;为总次数。适用范围:编制成次数分布表的数据资料计算百分等级积差相关积差相关是研究两变量间直线相关方向和程度最基本、最常用的方法,基本公式为: (5.1)式中,、分别为X变量和Y变量的离差;、分别为X变量和Y变量的标准差;N为成对观测值的个数。积差相关系数的适用条件:第一,必须是成对观测值,且一般不能少于30对数据。第二

12、,两列变量各自总体的分布服从正态分布,或接近正态的单峰对称分布。第三,两列变量都是连续变量且两列变量之间是线性相关。 (5.2)式中,为X变量的标准分,为Y变量的标准分适用条件同公式(5.1),适用于用标准分数计算相关系数。 (5.3)或 (5.4)式中,为积差相关系数;X、Y分别为两变量的原始观测值;N为观测值的对数适用于用原始观测值直接求,比较简便。步骤为:第一步,求两列变量各自原始观测值之和,即和;第二步,求两列变量成对观测值之积和积的和;第三步,分别求出和,并计算和;第四步,代入公式(5.3)或(5.4)求出。 (5.5) 式中,是变量各数值与其估计平均数之差;是变量各数值与其估计平均数之差 适用于利用假定平均数的方法计算积差相关系数。斯皮尔曼等级相关是指两列以次序排列的等级变量间的相关,公式为= (5.6)式中,为斯皮尔曼等级相关系数;D为两列变量每对数据等级之差;N为等级数据的对子数适用范围:(1)两列变量的资料为等级变量,且具有线形关系;(2)两列连续变量按大小顺序排列成等级;(3)不要求总体服从正态或单峰对称分布。计算步骤:第一步,确定等级,将两列变量按一定顺序分别定出等级;第二步,计算每一对等级之差及,并求出;第三步,将有关数据代入计算公式(5.4),求出肯德尔和谐系数

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 规章制度

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号