单变量的描述统计集中趋势分析ppt培训课件

上传人:aa****6 文档编号:57710094 上传时间:2018-10-24 格式:PPT 页数:31 大小:225.50KB
返回 下载 相关 举报
单变量的描述统计集中趋势分析ppt培训课件_第1页
第1页 / 共31页
单变量的描述统计集中趋势分析ppt培训课件_第2页
第2页 / 共31页
单变量的描述统计集中趋势分析ppt培训课件_第3页
第3页 / 共31页
单变量的描述统计集中趋势分析ppt培训课件_第4页
第4页 / 共31页
单变量的描述统计集中趋势分析ppt培训课件_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《单变量的描述统计集中趋势分析ppt培训课件》由会员分享,可在线阅读,更多相关《单变量的描述统计集中趋势分析ppt培训课件(31页珍藏版)》请在金锄头文库上搜索。

1、厦门大学社会学系,1,第四讲:单变量描述统计(2),集中趋势测量 离散趋势测量,厦门大学社会学系,2,知识点: 两个维度七个统计量数,厦门大学社会学系,3,学习要求,1、集中趋势各测量法的计算方法; 2、集中趋势各测量法的特点和应用; 3、离散程度各测量法的计算方法; 4、离散程度各测量法的特点与应用;,厦门大学社会学系,4,单变量描述统计,在统计分析中,是否可以找出一个有代表性的数值来说明变量的分布,反映资料的集中或差异情况? 集中趋势测量,就是以一个数值来代表变量的资料分布,反映的是变量值向中心值聚集的程度,也就是说以这一个数值(或称典型值)来估计或预测每一个研究对象的数值时发生的错误总数

2、在理论上是最小的。 离散趋势测量(Measures of dispersion)就是用一个值表示数据之间的差异情况。 离散趋势测量法和集中趋势测量法具有互补作用。在进行统计分析时,既要测量变量的集中趋势,也要测量离散趋势。,厦门大学社会学系,5,集中趋势测量/分析,集中趋势测量:用某一个典型的变量值或特征值来代表全体变量的问题,这个典型的变量值或特征值就称作集中值或集中趋势。 众值(Mode) 定类层次 中位值(Median)定序层次 均值(Mean) 定距层次,厦门大学社会学系,6,一、众数(mode),1、出现频次最多的变量值; 2、众数的不唯一性; 3、主要应用于定类变量,当然也可以应用

3、于定序和定距变量,厦门大学社会学系,7,众数的特点:不唯一性,原始数据:4、5、7、8、19(无众值) 原始数据:4、5、7、5、5、16(一个众值) 原始数据:4、4、5、7、7、9(两个众值),厦门大学社会学系,8,例1:非连续取值,厦门大学社会学系,9,例2 分组数据,厦门大学社会学系,10,从分布来看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值及为众数。,厦门大学社会学系,11,二、中位值(Median),1、把一组数据按顺序排列,处于中间位置的那个数值就是中位值。 2、主要应用于定序变量,也可用于定距变量,但不可用于定类变量。,Md,厦门大学社会学系,12,(

4、1)未分组数据求中位数: Md位置= (2)中位数=中间位置的值 注意:先找位置,再找中位数 将各个个案由低至高排列起来,居序列中央位置的个案值就是中位值。,厦门大学社会学系,13,(1)、个案数为奇数,【例1】:甲地的5户人家的人数为:2,4,3,6,8,求中位值。 解:Md的位置 3,排序2,3,4,6,8,中位值Md=4,厦门大学社会学系,14,(2)个案数为偶数,【例2】:乙地的6户人家的人数为:2,4,3,6,8,5求中位值。 解:Md的位置 3.5,排序2,3,4, 5, 6,8,Md= =4.5,厦门大学社会学系,15,(3)频数分布表,【例3】根据下表求中位值。,解:Md位置

5、250.5 中位值Md乙,厦门大学社会学系,16,2、分组数据:,L:中位数组的下限 f:中位数组的频数 w:中位数组的组距(U-L) cf:低于中位数组下限的累加次数 n:全部个案数 Md位置=n/2 (上下各50%的位置),厦门大学社会学系,17,例:分组数据:,首先将各组的次数累加起来 求中位数的位置: Md位置=n/2 =212/2=106 第106个位置在 25-35之间,厦门大学社会学系,18,分组变量看作是一组连续的数值,25,94,35,124,?,106,10,30,12,厦门大学社会学系,19,【例4】: 根据下表数据求中位值。,解:Md位置50; 从累积频数cf栏找到中位

6、数位置所在组为“300400” 引入公式:,=350,厦门大学社会学系,20,注意:,分组数据spss统计时的中位数表示的只是中位数的位置,厦门大学社会学系,21,三、均值,1、均值的定义:总体各单位取值之和除以总体单位数目。 2、仅适用于定距变量,不适用于定类和定序;,厦门大学社会学系,22,1、未分组数据 (1)简单原始资料求均值,厦门大学社会学系,23,均值的计算未分组数据,【例5】某班10名学生年龄分别为20、21、19、19、20、20、21、22、18、20岁,求他们的平均年龄。,解:根据平均数的计算公式有:,厦门大学社会学系,24,(2)、加权平均数,某个变项值重复出现多次,可以

7、先统计每个值(x)的次数(f),再求次数与相应变量值的乘积(fx),利用各乘积之和求出均值。(f也称为权重) 公式:,厦门大学社会学系,25,未分组数据加权平均数,【例6】调查某年120名学生的年龄,结果如下表,求平均年龄。,解:根据公式得 18.9岁,厦门大学社会学系,26,2、分组资料求均值:根据组中值求均值,先求出组中值 组中值=(上限+下限)/2 计算组中值的和 计算分组数据的均值,厦门大学社会学系,27,众值、中位数和均值的比较1,注: 表示该数据类型最适合用的测度值,厦门大学社会学系,28,众数、中位数和平均值的比较,众数是一组数据中出现次数最多的数值。但在社会调查中众数的代表性较

8、小,厦门大学社会学系,29,中位数和平均数的比较,计算平均数时用到数据中所有的数值,而求中位数时值用到数值的相对位置,平均数比中位数利用了更多的有关数据的信息 平均数容易受到极端值的影响,而中位数则不会受这种影响。当样本中数据值的分布是高度倾斜的,中位数一般比平均数更适合一些 如100,200,400,500,600, 均值为360,中位数为400 100,200,400,500,1000, 均值为440,中位数为400,厦门大学社会学系,30,对随机抽样调查来说,平均数比中位数更稳定,它随样本的变化比较小 平均数比中位数更容易进行算术运算。,厦门大学社会学系,31,众数、中位数、均值比较2,但两种情况不宜用均值: (1)分组数据的极端组没有组限。 (2)个别数值非常特殊。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号