变量的描述统计离散趋势分析和集中趋势分析课件

上传人:汽*** 文档编号:568662175 上传时间:2024-07-25 格式:PPT 页数:67 大小:589KB
返回 下载 相关 举报
变量的描述统计离散趋势分析和集中趋势分析课件_第1页
第1页 / 共67页
变量的描述统计离散趋势分析和集中趋势分析课件_第2页
第2页 / 共67页
变量的描述统计离散趋势分析和集中趋势分析课件_第3页
第3页 / 共67页
变量的描述统计离散趋势分析和集中趋势分析课件_第4页
第4页 / 共67页
变量的描述统计离散趋势分析和集中趋势分析课件_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《变量的描述统计离散趋势分析和集中趋势分析课件》由会员分享,可在线阅读,更多相关《变量的描述统计离散趋势分析和集中趋势分析课件(67页珍藏版)》请在金锄头文库上搜索。

1、 第五讲:单变量描述统计第五讲:单变量描述统计集中趋势测量集中趋势测量 离散趋势测量离散趋势测量1变量的描述统计离散趋势分析和集中趋势分析课件知识点:知识点:两个维度两个维度七个统计量数七个统计量数2变量的描述统计离散趋势分析和集中趋势分析课件学习要求学习要求1、集中趋势各测量法的计算方法;、集中趋势各测量法的计算方法;2、集中趋势各测量法的特点和应用;、集中趋势各测量法的特点和应用;3、离散程度各测量法的计算方法;、离散程度各测量法的计算方法;4、离散程度各测量法的特点与应用;、离散程度各测量法的特点与应用; 3变量的描述统计离散趋势分析和集中趋势分析课件单变量描述统计单变量描述统计n在统计

2、分析中,是否可以找出一个有代表性的数值来说在统计分析中,是否可以找出一个有代表性的数值来说明变量的分布,反映资料的集中或差异情况?明变量的分布,反映资料的集中或差异情况? n集中趋势测量,就是以一个数值来代表变量的资料分布,集中趋势测量,就是以一个数值来代表变量的资料分布,反映的是变量值向中心值聚集的程度,也就是说以这一反映的是变量值向中心值聚集的程度,也就是说以这一个数值(或称典型值)来估计或预测每一个研究对象的个数值(或称典型值)来估计或预测每一个研究对象的数值时发生的错误总数在理论上是最小的。数值时发生的错误总数在理论上是最小的。n离散趋势测量(离散趋势测量(Measures of di

3、spersion)就是用一个)就是用一个值表示数据之间的差异情况。值表示数据之间的差异情况。n离散趋势测量法和集中趋势测量法具有互补作用。在进离散趋势测量法和集中趋势测量法具有互补作用。在进行统计分析时,既要测量变量的集中趋势,也要测量离行统计分析时,既要测量变量的集中趋势,也要测量离散趋势。散趋势。 4变量的描述统计离散趋势分析和集中趋势分析课件集中趋势测量集中趋势测量/分析分析集中趋势测量:集中趋势测量:用某一个典型的变量值或特征值用某一个典型的变量值或特征值来代表全体变量的问题,这个典型的变量值或来代表全体变量的问题,这个典型的变量值或特征值就称作集中值或集中趋势。特征值就称作集中值或集

4、中趋势。 众值(众值(Mode) 定类层次定类层次 中位值(中位值(Median)定序层次定序层次 均值(均值(Mean) 定距层次定距层次5变量的描述统计离散趋势分析和集中趋势分析课件一、众数(一、众数(mode)1、出现频次最多的变量值;、出现频次最多的变量值;2、众数的不唯一性;、众数的不唯一性;3、主要应用于定类变量,当然也可以、主要应用于定类变量,当然也可以应用于定序和定距变量应用于定序和定距变量6变量的描述统计离散趋势分析和集中趋势分析课件众数的特点:不唯一性众数的特点:不唯一性n原始数据:原始数据:4、5、7、8、19(无众值)(无众值)n原始数据:原始数据:4、5、7、5、5、

5、16(一个众值)(一个众值)n原始数据:原始数据:4、4、5、7、7、9(两个众值)(两个众值)7变量的描述统计离散趋势分析和集中趋势分析课件例例1:非连续取值:非连续取值8变量的描述统计离散趋势分析和集中趋势分析课件例例2 分组数据分组数据收入收入(元元)fCfCf500-6991010550700-8996575540900-10991262114751100-12991583693391300-14991415101811500-16994055040总数总数 5509变量的描述统计离散趋势分析和集中趋势分析课件n从分布来看,众数是具有明显集中趋势点的从分布来看,众数是具有明显集中趋势点

6、的数值,一组数据分布的最高峰点所对应的数数值,一组数据分布的最高峰点所对应的数值及为众数值及为众数。10变量的描述统计离散趋势分析和集中趋势分析课件二、中位值(二、中位值(Median)1、把一组数据、把一组数据按顺序排列按顺序排列,处于,处于中间位置中间位置的那个数值就是中位值。的那个数值就是中位值。2、主要应用于定序变量,也可用于定距变、主要应用于定序变量,也可用于定距变量,但不可用于定类变量。量,但不可用于定类变量。50%50%Md11变量的描述统计离散趋势分析和集中趋势分析课件(1)未分组数据求中位数:)未分组数据求中位数: Md位置位置= (2)中位数)中位数=中间位置的值中间位置的

7、值注意:先找位置,再找中位数注意:先找位置,再找中位数将各个个将各个个案由低至高排列案由低至高排列起来,居序列中央位起来,居序列中央位置的个案值就是中位值。置的个案值就是中位值。12变量的描述统计离散趋势分析和集中趋势分析课件(1)、个案数为奇数)、个案数为奇数【例【例1】:甲地的】:甲地的5户人家的人数为:户人家的人数为:2,4,3,6,8,求中位值。,求中位值。 解:Md的位置 3排序排序2,3,4,6,8中位值Md=413变量的描述统计离散趋势分析和集中趋势分析课件(2)个案数为偶数)个案数为偶数【例【例2】:乙地的】:乙地的6户人家的人数为:户人家的人数为:2,4,3,6,8,5求中位

8、值。求中位值。 解:Md的位置 3.5排序排序2,3,4, 5, 6,8Md= =4.514变量的描述统计离散趋势分析和集中趋势分析课件(3)频数分布表)频数分布表【例3】根据下表求中位值。解:Md位置 250.5 中位值Md乙15变量的描述统计离散趋势分析和集中趋势分析课件2、分组数据、分组数据n根据统计表中的累积百分比,找出含有根据统计表中的累积百分比,找出含有50%的区间的区间n找出含有找出含有50%区间的上界值区间的上界值U,下界值,下界值L,上界累计百分数,上界累计百分数U%,下界累计百分,下界累计百分数数L%以及组距等信息以及组距等信息n根据线段对应成比例的原理,计算出累根据线段对

9、应成比例的原理,计算出累计百分比为计百分比为50%的变量值的变量值16变量的描述统计离散趋势分析和集中趋势分析课件nL:中位数组的下限:中位数组的下限nf:中位数组的频数:中位数组的频数nw:中位数组的组距:中位数组的组距(U-L)ncf:低于中位数组下:低于中位数组下限的累加次数限的累加次数nn:全部个案数:全部个案数nMd位置位置=n/2 (上(上下各下各50%的位置)的位置)17变量的描述统计离散趋势分析和集中趋势分析课件例:分组数据:例:分组数据:n首先将各组的次数累加起来首先将各组的次数累加起来n求中位数的位置:求中位数的位置:nMd位置位置=n/2 =212/2=106n第第106

10、个位置在个位置在 25-35之间之间18变量的描述统计离散趋势分析和集中趋势分析课件n分组变量看作是一组连续的数值分组变量看作是一组连续的数值259435124?10610301219变量的描述统计离散趋势分析和集中趋势分析课件【例【例4】:】:根据下表数据求中位值。根据下表数据求中位值。解:解:Md位置位置50;从累积频数从累积频数cf栏找到中位数位栏找到中位数位置所在组为置所在组为“300400”引入公式:引入公式:=35020变量的描述统计离散趋势分析和集中趋势分析课件三、均值三、均值1、均值的定义:总体各单位取值之和除以、均值的定义:总体各单位取值之和除以总体单位数目。总体单位数目。2

11、、仅适用于定距变量仅适用于定距变量,不适用于定类和定,不适用于定类和定序;序;21变量的描述统计离散趋势分析和集中趋势分析课件1、未分组数据、未分组数据(1)简单原始资料求均值)简单原始资料求均值22变量的描述统计离散趋势分析和集中趋势分析课件均值的计算未分组数据【例5】某班10名学生年龄分别为20、21、19、19、20、20、21、22、18、20岁,求他们的平均年龄。解:根据平均数的计算公式有:23变量的描述统计离散趋势分析和集中趋势分析课件(2)、加权平均数)、加权平均数某个变项值重复出现多次,可以先统计每某个变项值重复出现多次,可以先统计每个值(个值(x)的次数()的次数(f),再求

12、次数与相),再求次数与相应变量值的乘积(应变量值的乘积(fx),利用各乘积之),利用各乘积之和求出均值和求出均值。(。(f也称为权数也称为权数,f/n称为权称为权重)重)公式:24变量的描述统计离散趋势分析和集中趋势分析课件未分组数据加权平均数未分组数据加权平均数【例【例6】调查某年】调查某年120名学名学生的年龄,结果如下表,生的年龄,结果如下表,求平均年龄。求平均年龄。解:根据公式得18.9岁25变量的描述统计离散趋势分析和集中趋势分析课件2、分组资料求均值:、分组资料求均值:根据组中值求均值根据组中值求均值n先求出组中值先求出组中值组中值组中值=(上限(上限+下限)下限)/2n计算组中值

13、的和计算组中值的和n计算分组数据的均值计算分组数据的均值组中值组中值26变量的描述统计离散趋势分析和集中趋势分析课件众值、中位数和均值的比较众值、中位数和均值的比较1注:注: 表示该数据类型最适合用的测度值表示该数据类型最适合用的测度值27变量的描述统计离散趋势分析和集中趋势分析课件众数、中位数和平均值的比较众数、中位数和平均值的比较n众数是一组数据中出现次数最多的数众数是一组数据中出现次数最多的数值值。但在社会调查中众数的代表性较小但在社会调查中众数的代表性较小28变量的描述统计离散趋势分析和集中趋势分析课件中位数和平均数的比较中位数和平均数的比较n计算平均数时用到数据中所有的数值,而求中位

14、数时只用到计算平均数时用到数据中所有的数值,而求中位数时只用到数值的相对位置,平均数比中位数利用了更多的有关数据的数值的相对位置,平均数比中位数利用了更多的有关数据的信息信息n平均数容易受到极端值的影响,而中位数则不会受这种影响。平均数容易受到极端值的影响,而中位数则不会受这种影响。当样本中数据值的分布是高度倾斜的,中位数一般比平均数当样本中数据值的分布是高度倾斜的,中位数一般比平均数更适合一些更适合一些如如100,200,400,500,600,均值为均值为360,中位数为,中位数为400100,200,400,500,1000,均值为均值为440,中位数为,中位数为40029变量的描述统计

15、离散趋势分析和集中趋势分析课件n对随机抽样调查来说,平均数比中位数更稳对随机抽样调查来说,平均数比中位数更稳定,它随样本的变化比较小定,它随样本的变化比较小n平均数比中位数更容易进行算术运算。平均数比中位数更容易进行算术运算。30变量的描述统计离散趋势分析和集中趋势分析课件众数、中位数、均值比较众数、中位数、均值比较2但两种情况不宜用均值但两种情况不宜用均值:n(1)(1)分组数据的极端组没有组限分组数据的极端组没有组限。n(2)(2)个别数值非常特殊个别数值非常特殊。31变量的描述统计离散趋势分析和集中趋势分析课件32变量的描述统计离散趋势分析和集中趋势分析课件练习: 求下表求下表(单项数列

16、单项数列)所示数据的算术平均数所示数据的算术平均数 。人口数(人口数(X)户数户数(f)频率频率(P)23456785816106410.100.160.320.200.120.080.02合计合计501.0033变量的描述统计离散趋势分析和集中趋势分析课件 求下表所示数据的的算术平均数求下表所示数据的的算术平均数 间距频数(f) 组中值(X)148152152156156160160164164168168172172176176180180184184188188192192196 1 2 51019251712 5 3 0 1 150154158162166170174178182186

17、190194合计 100 34变量的描述统计离散趋势分析和集中趋势分析课件n 求54,65,78,66,43这些数字的中位数。n求54,65,78,66,43,38 这些数字的中位数。35变量的描述统计离散趋势分析和集中趋势分析课件 某年级学生身高如下,求中位数某年级学生身高如下,求中位数36变量的描述统计离散趋势分析和集中趋势分析课件人口数(人口数(X)户数户数(f)频率频率(P)23456785816106410.100.160.320.200.120.080.02合计合计501.00求下表中的众数求下表中的众数37变量的描述统计离散趋势分析和集中趋势分析课件求下表中的众数求下表中的众数3

18、8变量的描述统计离散趋势分析和集中趋势分析课件 城镇自杀率的分组次数分布城镇自杀率的分组次数分布 自杀率自杀率 次数次数真实组限真实组限组中值组中值向上累积次数向上累积次数3-5126-8359-118112-145215-173018-20721-23924-263合计合计22939变量的描述统计离散趋势分析和集中趋势分析课件单变量的描述统计(单变量的描述统计( 第五讲第五讲2)离散趋势测量离散趋势测量 40变量的描述统计离散趋势分析和集中趋势分析课件离散趋势测量离散趋势测量(Measures of dispersion)n反映的是各变量值偏离其中心值的程度,反映的是各变量值偏离其中心值的程

19、度,是个案与个案之间的差异情况。是个案与个案之间的差异情况。n这种测量法,与前面所讲的集中趋势测这种测量法,与前面所讲的集中趋势测量法具有相互补充的作用。量法具有相互补充的作用。n集中趋势求出的是一个最能代表变量所集中趋势求出的是一个最能代表变量所有资料的值,但是集中趋势值代表性的有资料的值,但是集中趋势值代表性的高低还要看各个个案之间的差异情况。高低还要看各个个案之间的差异情况。41变量的描述统计离散趋势分析和集中趋势分析课件举例:某校举例:某校3个系各选个系各选5名同学参加智力竞赛,名同学参加智力竞赛,他们的成绩如下:他们的成绩如下:中文系:中文系:78,79,80,81,82 ( 80)

20、数学系:数学系:65,72,80,88,95 ( 80)英语系:英语系:35,78,89,98,100 ( 80)如果仅从集中趋势测量(平均分数)来看,这如果仅从集中趋势测量(平均分数)来看,这三个系的成绩都一致,不存在什么差别。三个系的成绩都一致,不存在什么差别。但从直观上可看出,三个系选手之间的差距程但从直观上可看出,三个系选手之间的差距程度(离散程度)很不一样度(离散程度)很不一样?42变量的描述统计离散趋势分析和集中趋势分析课件 n异众比率异众比率/离异比率离异比率(Variation ratio) 定类层定类层次次n四分位差四分位差(Interquartile range)定序层次定

21、序层次n方差方差 (Variance) 标准差标准差 (Standard deviation)定距层次定距层次43变量的描述统计离散趋势分析和集中趋势分析课件一、异众比率一、异众比率(Variation ratio) 1、异众比率、异众比率(简写简写Vr) :指非众值在总数中:指非众值在总数中所占的比率。所占的比率。表示以众数来预测一组数据时,所犯错误表示以众数来预测一组数据时,所犯错误的大小的大小.即即Vr值越大值越大,则众值的代表性就越则众值的代表性就越小小. Vr值越小值越小,则众值的代表性就越大则众值的代表性就越大.2、计算公式:、计算公式:众值的频次众值的频次44变量的描述统计离散趋

22、势分析和集中趋势分析课件异众比率异众比率(先找出众值先找出众值.找到众值的频次分找到众值的频次分布布)【例例1】:根据表根据表1中中的数据,计算众值的数据,计算众值和异众比率。和异众比率。解:解:众值众值Mo “核心家庭核心家庭”异众比率异众比率45变量的描述统计离散趋势分析和集中趋势分析课件例例2:众数和异众比率的比较:众数和异众比率的比较表表2 甲乙两校学生的父亲职业甲乙两校学生的父亲职业n甲乙两校学生的父亲职甲乙两校学生的父亲职业的众数都为业的众数都为“农民农民”n甲校甲校n乙校乙校n众数的代表性中甲校小众数的代表性中甲校小于乙校,甲校中有于乙校,甲校中有47.6%非农民,乙校非农民,乙

23、校只有只有38.5%.46变量的描述统计离散趋势分析和集中趋势分析课件异众比率异众比率&众值众值n异众比率是众值的补充。取值范围是异众比率是众值的补充。取值范围是0,1。n不属于众数的个案所占的比例愈大,就表示众数的代不属于众数的个案所占的比例愈大,就表示众数的代表性愈小,以之作估计或预测时所犯的错误也就愈大。表性愈小,以之作估计或预测时所犯的错误也就愈大。当当 Vr 0,说明变量只有一个值,那就是众值;,说明变量只有一个值,那就是众值;当当 Vr 0,说明资料比较集中,众值的代表性比较高;,说明资料比较集中,众值的代表性比较高;当当 Vr 1,说明资料比较分散,众值的代表性低。,说明资料比较

24、分散,众值的代表性低。47变量的描述统计离散趋势分析和集中趋势分析课件二、四分位差二、四分位差(Interquartile range) 将数据由低至高排列将数据由低至高排列,然后分为四等分(即每个,然后分为四等分(即每个等分包括等分包括25的数据),的数据),第一个四分位置的值(第一个四分位置的值( Q1 )与第三个四分位置的值()与第三个四分位置的值(Q3)的差异)的差异,就是四分位,就是四分位差(简写为差(简写为Q)。)。Q1Q2Q3Q425%25%25%25%48变量的描述统计离散趋势分析和集中趋势分析课件n1.离散程度的测度值之一离散程度的测度值之一n2.也称为内距或四分间距也称为内

25、距或四分间距n3.上四分位数与下四分位数之差上四分位数与下四分位数之差n4.反映了中间反映了中间50%数据的离散程度数据的离散程度n5.不受极端值的影响不受极端值的影响n6.用于衡量中位数的代表性用于衡量中位数的代表性49变量的描述统计离散趋势分析和集中趋势分析课件基本公式基本公式n求位置,找出求位置,找出4分位对应的数值分位对应的数值nQ1= nQ3=四分位差四分位差Q Q3 Q1。50变量的描述统计离散趋势分析和集中趋势分析课件1、根据原始未分组资料求四分位差、根据原始未分组资料求四分位差解:解: Q1 的位置的位置 =75.25 Q3的位置的位置 225.75那么那么 Q1 不满意;不满

26、意; Q3 一般一般Q Q3 Q1 一般不满意一般不满意结论,有一半的家庭对住房评价结论,有一半的家庭对住房评价在不满意到一般之间。在不满意到一般之间。表 甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意 不满意 一般 满意 非常满意2410894443024132226270300合计300【例【例3 3】求下表的四分位差】求下表的四分位差51变量的描述统计离散趋势分析和集中趋势分析课件例例4:调查甲乙两村的家庭人数:调查甲乙两村的家庭人数n其中甲村有其中甲村有11户人家,每户人数为户人家,每户人数为 2,2,3,4,6,9,10,

27、10,11,13,15n乙村有乙村有8户人家,每户人口数为户人家,每户人口数为 2,3,4,7,9,10,12,12则甲村中:则甲村中:Q1 位置位置=(n+1)/4=(11+1)/4=3, Q1 =3 Q3位置位置=3(n+1)/4=9, Q3=11 Q=Q3-Q1=11-3=8则乙村中:则乙村中: Q1 位置位置=(n+1)/4=2.25, Q1 =3+0.25(4-3)=3.25 Q3位置位置=3(n+1)/4=6.75, Q3=10+0.75(12-10)=11.5 Q=Q3-Q1=11.5-3.25=8.25n甲的离散程度低于乙村,以中位置估计甲乙两村的人口数甲的离散程度低于乙村,以

28、中位置估计甲乙两村的人口数时,在甲村犯的错误小于乙村时,在甲村犯的错误小于乙村52变量的描述统计离散趋势分析和集中趋势分析课件2、根据分组资料求四分位差、根据分组资料求四分位差有四步:有四步:n计算向上累加次数计算向上累加次数n求出求出Q1 和和Q3的位置的位置 Q1= Q3=n参考累加次数分布,决定参考累加次数分布,决定Q1和和Q3属于哪一组属于哪一组n从所属组中,计算从所属组中,计算Q1位置和位置和Q3位置的数值。位置的数值。53变量的描述统计离散趋势分析和集中趋势分析课件公式如下:公式如下:nL1=Q1属组之属组之真实真实下限下限nL3=Q3属组之属组之真实真实下限下限nf1=Q1属组之

29、次数属组之次数nf3=Q3属组之次数属组之次数ncf1=低于低于Q1属组之累计属组之累计次数次数ncf3=低于低于Q3属组之累计属组之累计次数次数nw1=Q1属组之组距属组之组距nw3=Q3属组之组距属组之组距nn=全部个案数目全部个案数目54变量的描述统计离散趋势分析和集中趋势分析课件四分位差四分位差&中位数中位数n四分位差反映的是中位数的代表性四分位差反映的是中位数的代表性n差距越大,中位数的代表性越小,用中差距越大,中位数的代表性越小,用中位数估计变量时所犯的错误越大位数估计变量时所犯的错误越大;反之,;反之,中位数的代表性越大,用中位数作估计中位数的代表性越大,用中位数作估计犯的错误越

30、小。犯的错误越小。55变量的描述统计离散趋势分析和集中趋势分析课件三、方差和标准差三、方差和标准差n1.离散程度的测度值之一离散程度的测度值之一n2.最常用的测度值最常用的测度值n3.反映了数据的分布反映了数据的分布n4.反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异n5.根据总体数据计算的,称为总体方差或标根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差准差;根据样本数据计算的,称为样本方差或标准差或标准差4 6 8 10 124 6 8 10 12X = X = 8.38.356变量的描述统计离散趋势分析和集中趋势分析课件三、方差与标准差三、方差与标

31、准差n所谓方差(所谓方差(Variance) ,观察值与其均,观察值与其均值之差的平方和除以全部观察总数值之差的平方和除以全部观察总数N。n方差的平方根就是标准差方差的平方根就是标准差(Standard deviation),用,用 或或S57变量的描述统计离散趋势分析和集中趋势分析课件n表示以均值作代表值时引起的偏差或错误,也就表示以均值作代表值时引起的偏差或错误,也就是说用均值来估计或预测各个个案的数值,所犯是说用均值来估计或预测各个个案的数值,所犯的错误(的错误( )平均是)平均是n标准差是用得最多,也是最重要的离散量数的统标准差是用得最多,也是最重要的离散量数的统计量计量;n方差是统计

32、学上的一个重要概念,在以后的统计方差是统计学上的一个重要概念,在以后的统计方法学习过程中会进一步了解;方法学习过程中会进一步了解;n只适用于定距层次的变量只适用于定距层次的变量;58变量的描述统计离散趋势分析和集中趋势分析课件总体方差和标准差总体方差和标准差n未分组数据:未分组数据:未分组数据:分组数据分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式59变量的描述统计离散趋势分析和集中趋势分析课件样本方差和标准差样本方差和标准差分组数据:分组数据:未分组数据未分组数据:分组数据:分组数据:方差的计算公式方差的计算

33、公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:注意:注意:注意:样本方差用自样本方差用自样本方差用自样本方差用自样本方差用自样本方差用自由度由度由度由度由度由度n-1n-1n-1去除去除去除去除去除去除! !未分组数据未分组数据60变量的描述统计离散趋势分析和集中趋势分析课件样本方差的样本方差的自由度自由度(degree of freedom)(degree of freedom)1.一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数2.当当样样本本数数据据的的个个数数为为 n 时时,若若样样本本均均值值 x

34、 确确定定后后,只只有有n-1个个数数据据可可以以自自由由取取值值,其其中中必必有有一一个个数数据据则不能自由取值则不能自由取值3.例例如如,样样本本有有3个个数数值值,即即x1=2,x2=4,x3=9,则则 x = 5。当当 x = 5 确确定定后后,x1,x2和和x3有有两两个个数数据据可可以以自自由由取取值值,另另一一个个则则不不能能自自由由取取值值,比比如如x1=6,x2=7,那那么么x3则则必必然然取取2,而而不不能能取取其其他他值值4.样样本本方方差差用用自自由由度度去去除除,其其原原因因可可从从多多方方面面来来解解释释,从从实实际际应应用用角角度度看看,在在抽抽样样估估计计中中,

35、当当用用样样本本方方差差去估计总体方差去估计总体方差2时,它是时,它是2的无偏估计量的无偏估计量61变量的描述统计离散趋势分析和集中趋势分析课件n注意:有些书中,也提到抽样的样本较注意:有些书中,也提到抽样的样本较大时,在样本方差和标准差的计算中,大时,在样本方差和标准差的计算中,n-1和和n计算出来的数值相差不大,因此计算出来的数值相差不大,因此有些计算中直接将样本中的个案数目用有些计算中直接将样本中的个案数目用n表示,而不用表示,而不用n-1,如李沛良的书。,如李沛良的书。62变量的描述统计离散趋势分析和集中趋势分析课件1、未分组资料标准差计算、未分组资料标准差计算【例【例5】:求标准差,

36、并进行简单比较。】:求标准差,并进行简单比较。中文系:中文系:78,79,80,81,82 ( 80)数学系:数学系:65,72,80,88,95 ( 80)英语系:英语系:35,78,89,98,100 ( 80)解:根据公式解:根据公式 (中文系)(中文系)1.4141.414分分 (数学系)(数学系)10.810.8分分 (英语系)(英语系)23.823.8分分结论:中文系差结论:中文系差别最小,英语系别最小,英语系差别最大差别最大。63变量的描述统计离散趋势分析和集中趋势分析课件2、分组资料标准差的计算、分组资料标准差的计算n公式公式其中其中Xm是每组的组中值,是每组的组中值,f是该组

37、的次数是该组的次数64变量的描述统计离散趋势分析和集中趋势分析课件例例6 青年人阅读小说的数目青年人阅读小说的数目65变量的描述统计离散趋势分析和集中趋势分析课件四、极差四、极差/全距(全距(Range)n1. 一组数据的最大值与最小值之差一组数据的最大值与最小值之差n2. 离散程度的最简单测度值离散程度的最简单测度值n3. 易受极端值影响易受极端值影响n4. 未考虑数据的分布未考虑数据的分布未分组数据未分组数据未分组数据未分组数据 R R = max(= max(X Xi i) - min() - min(X Xi i) ). .= =组距分组数据组距分组数据组距分组数据组距分组数据 R R 最高组上限最高组上限最高组上限最高组上限 - - 最低组下最低组下最低组下最低组下限限限限5. 5. 计算公式为计算公式为计算公式为计算公式为66变量的描述统计离散趋势分析和集中趋势分析课件小结小结1、集中趋势测量和离散趋势测量具有互补性,、集中趋势测量和离散趋势测量具有互补性,集中趋势反映的是资料的代表性,离散趋势反集中趋势反映的是资料的代表性,离散趋势反映的是资料的差异情况;映的是资料的差异情况;2 2、选何种方法,要注意变量的测量层次,彼此、选何种方法,要注意变量的测量层次,彼此的关系综合如下:的关系综合如下:67变量的描述统计离散趋势分析和集中趋势分析课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号