高中政治 第4章数据的描述性整理

上传人:woxinch****an2018 文档编号:39301050 上传时间:2018-05-14 格式:DOC 页数:9 大小:181.50KB
返回 下载 相关 举报
高中政治 第4章数据的描述性整理_第1页
第1页 / 共9页
高中政治 第4章数据的描述性整理_第2页
第2页 / 共9页
高中政治 第4章数据的描述性整理_第3页
第3页 / 共9页
高中政治 第4章数据的描述性整理_第4页
第4页 / 共9页
高中政治 第4章数据的描述性整理_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《高中政治 第4章数据的描述性整理》由会员分享,可在线阅读,更多相关《高中政治 第4章数据的描述性整理(9页珍藏版)》请在金锄头文库上搜索。

1、30第第 4 章章 数据的描述性整理数据的描述性整理教学内容与要求:教学内容与要求:通过本章教学,使学生了解怎样根据事先做好的统计分组设计方案用手工或计算机对调查数据进行汇总整理,了解怎样针对一批数据的特点为反映数据的次数分布特征对其进行整理。掌握有关数据的次数分布以及次数分布的位置特征数和离散特征数的基本概念,掌握平均数、中位数、众数等位置特征数以及平均数、方差、标准差、离散系数等离散特征数的计算方法和应用。从而使学生学会从数据中提取有用信息的描述性手段。重点内容与难点:重点内容与难点:1 数据分布状态的描述2 数据分布的位置特征数:平均数的计算 3 数据分布的离散特征数:方差、标准差、离散

2、系数的计算和应用4.1 数据的汇总数据的汇总汇总的操作方法可分为手工汇总和电子计算机汇总。一 、手工汇总 1.划记法 2过录法 3折叠法 二、 电子计算机汇总 利用电子计算机技术进行统计汇总的过程主要有以下五步: 1编程序2编码3数据录入4逻辑检查5制表打印三、数据汇总的质量控制(一)汇总前对资料的审核(二) 计算机汇总程序的审核(三) 编码的质量控制(四) 数据录入的质量控制(五)分组及汇总操作的质量控制4.2 数据分布状态的描述数据分布状态的描述一、 社会经济有限总体分布的概念 次数分布:把统计总体按照某个标准(标志)分组后,形成总体单位在在各个组的分 配。31次数又叫频数。 用各组次数除

3、以总次数计算的结构相对数叫频率。 频数分布列:用频数来描述数据的分布状态的分布列。 频率分布列:用频率来描述数据的分布状态的分布列。 分布列:统计分组的各组名称与相应的频数或频率结合在一起所形成的数列。 在频数分布列中有(4.1)NfLii 1在频率分布列中有:(4.2)1)/(1/0 111 LiLiiiLiiiffff和二、 品质型数据分布列和数量型数据分布列 (一)品质型数据分布列品质型数据分布列:对品质型数据资料整理所得到的分布列。或者说是对统计总 体按品质标志分组所得到得分布列。 (二)数量型数据的分布列 数量型数据分布列:对数量型数据资料整理所得到的分布列。或说是对统计总体按数 量

4、标志分组所得到的分布列。 数量型数据分布列又由于拟组形式不同分为单项式数列和组距式数列。 单项式数列,各组名称应成等差。 组距式数列,各组组距应当相等。 有时,我们得到的是一个组距不相等的分组资料,应当把资料中各组的频数(频率) 一一换算成统一组距下的频数(频率) 。换算方法是:(4.3)距组统一的本组实际组距频率本组实际频数 频率的频数统一组距下)( )(频数密度:组距式分布列中,各组频数与该组组距的比值叫做; 频率密度:各组频率与该组组距的比值叫做。频数(频率)密度表明在该组中平均一 个单位组距所拥有的频数(频率) 。 三、分布图 分布列描述了数据的分布状态,但它不够直观。分布图则能更加直

5、观地描述数据的分 布状态。 数据的分布图有:分布棒图、分布直方图、分布折线图、分布曲线图。四、根据事先作好的分组设计描述分布状态 五、探索式地整理数据来描述分布状态 1. 单项式整理 单项式数列的应用场合是:(1)离散型变量;(2)数量型数据的全部结果集中在为 数不多的几个数值上重复出现。 2. 组距式整理组距式整理的步骤。(1)将数据按大小作排序整理。(2)指定初始分组数和组距组数和组距的关系是组距=全距/组数;全距是数据中最大的数值与最小的数值之差。32常见用作组距的是形如1,5,10,15,20,25,30,等等这样一些“整5”、“整10”的数字。(3)确定组限的位置(4)把数据分入各组

6、,计算各组的频数和频率,绘制分布直方图。(5)审查直方图是否反映出数据的分布规律对数据作组距式分组整理时确定组数的原则是:在能够反映出数据分布规律的前提下,分组数尽可能多些。 4.3 数据分布的位置特征数数据分布的位置特征数一、次数分布特征及与之相对应的特征数一、次数分布特征及与之相对应的特征数次数分布的特征数:集中地、概括地说明次数分布(分布直方图)的某种特征的数字1位置特征 平均数、众数、中位数2离散特征 全距、平均差、标准差(方差) 、离散系数3偏斜特征 偏态系数4峰度特征 峰度系数二、几种常见的位置特征数 平均数平均数:由我们所研究的全体数据参加计算得到的代表值。平均数的一般形式叫做幂

7、平均数。常见的有:算术平均数、几何平均数、调和平均数。1.算术平均数.()x算术平均数的基本公式(4.6)总体单位总量总体标志总量算术平均数 实际工作中,因掌握的资料不同,可分为:简单算术平均数和加权算术平均数。(1)简单算术平均数:资料中变量值的作用大小都相同,其计算公式为:nxx(2)加权算术平均数:资料中变量值的作用大小不相同,其计算公式为:绝对数权数: 或比重权数:fxfxffxx影响加权算术平均数的因素:变量值和权数。权数的形式:绝对数形式和比重形式。其中,比重权数反映了权数的实质。当加权算术平均数中的各权数相等时,简单算术平均数是加权算术平均数的一个特例,即二者相等。2. 调和平均

8、数()hM(1)概念:变量值倒数的算术平均数的倒数。(2)分为:简单调和平均数33=hM xn 1加权调和平均数=hM xMM3. 几何平均数()gM(1)概念:变量值连乘积的 n 次方根。(2)分为:简单几何平均数和加权几何平均数。 4. 算术平均数、调和平均数、几何平均数的一般形式算术平均数、调和平均数、几何平均数的一般形式是幂平均数()。幂平均数定pM 义为 NiiNiiikpwwxMk11式中,0,0,为零以外的实数。ixiwk 算术平均数、调和平均数、几何平均数分别是幂平均数当 = 1,= 1, 0 时的kkk 特例。对同一批观察值,用同一套权数计算的这三种平均数之间的关系是 hMg

9、Mx 只有当各个观察值全相等时,上面的等式关系成立。5. 平均数的应用场合(1)作为统计指标的一种表现形式(2)作为统计总体分布的位置特征数(3)反映一个统计变量所有观察值的一般水平(4)抵消掉随机试验中的偶然因素影响,显示出试验的规律性水平(二) 中位数1概念:把变量值按大小顺序排列起来,居中间位置的数值。当为奇数时取正中央N 位置的数值作为中位数,当为偶数时取正中央位置两侧二数值和的一半作为中位数。N单项式分组,总频数和的一半表明中位数的位置。2/ 1 Liif如果恰好等于至某组为止的累计频数,说明中位数位置恰好在本组与再向前的2/ 1 Liif一组之间,中位数等于相邻这两组变量值和的一半

10、;如果不是这种情况,那么累计频数首次超过的组即为中位数所在组,中位数数值是该组的变量值。2/ 1 Liif组距式分组,应先按与单项式情形相同的方法确定中位数所在组。当中位数位置恰好在两组之间时,中位数数值为相邻这两组之间的组界;当中位数位置落在某组内部时,中位数数值要用公式来推算34的组距所在组中位数中位数所在组的频数一组为止的累计频数至中位数所在组以前那 半一总频数的限下所在组中位数 中位数 (三) 众数1 概念:如果次数分布为单峰型,那么次数最多的那个数。2 在单项式分组情形下,频数最大的那一组的变量值即为众数。3组距式分组情形下,频数最大的那一组为众数所在组,在该组内,用下面的公式求众数

11、的近似值组的组距众数所在 组的下限众数所在众数 211式中,1是众数所在组频数减该组以下(小的变量值的组为下,大的变量值的组为上)一组频数之差,2是众数所在组频数减该组以上一组频数之差。 4众数是一种局部极值,有时,根据分组资料绘制次数分布图,会呈现两个峰形。这 提示我们,数据中有两个众数。(四) 算术平均数、中位数、众数的关系 在单峰对称分布中,算术平均数、中位数、众数三者相等。 在单峰偏斜分布中,只要偏斜适度,有下列经验关系:中位数处在算术平均数和众数 之间;上偏时,众数最小,算术平均数最大;下偏时,众数最大,算术平均数最小;中位 数与众数之间的距离大约是中位数与算术平均数之间距离的 2

12、倍(见下图) 。众=中=算 众 中算 算中 众算术平均数、中位数、众数的关系由于算术平均数、中位数、众数的上述关系,一般认为,在较明显的偏斜分布情形下,用中位数来说明次数分布的位置特征较为适中。因为,众数忽略了偏斜一侧的大量数值,而算术平均数又过分强调了这些数值。算术平均数对特异值的反应十分灵敏,而中位数对特异值反应不灵敏。因此,常常把中位数作为探索发现特异值的标准。我们把数据中的每一个数值和中位数相减。可以很容易发现特异值;反之,把每个数值和算术平均数相减却不容易发现特异值。 (五) 算术平均数、中位数的数学性质算术平均数有如下数学性质:(1)变量的各个数值与其算术平均数的离差之和等于 0。

13、0)( 1 Niixx0)( 1 iiwxxNi(2)变量的各个数值与其算术平均数离差平方和较之与其他数值的离差平方之和都小。 即,对关于的下列函数A35 NiiAxQ 12)(iNiiwAxQ 12)(中位数有如下数学性质:变量的各个数值与其中位数离差绝对值之和较之与其他数值离差绝对值之和都小。即,对关于的函数,当等于的中位数时其值最小。A NiAixQ 1|A), 2 , 1(Niix 一、绝对数统计变量的平均数(一)对绝对数统计变量平均数的要求求绝对数统计变量的平均数,一般要求所求的平均数是将各个观察值“截长补短”以后的结果。依这个要求,用平均数代替了各个观察值后,观察值的总和不变。(二

14、)未分组原始资料的平均数nxx(三)单项式分组资料的平均数用各组变量值以各组的频数或频率为权数的加权算术平均数。 (公式如前述)(四)组距式分组资料的平均数 用各组组中值以各组的频数或频率为权数的加权算术平均数。 (公式如前述) 由于各组的组平均数往往并不恰好等于该组组中值,所以,用上法计算出来的平均数 同根据原始数据计算的平均数通常并不相等。前者只是后者的近似数值。三、比(率)类型统计变量的平均数(一)什么是比(率)类型统计变量1概念比(率)类型统计变量:平均指标和相对指标的总称。2基本比式的含义:要弄清比(率)类型统计变量的基本比式,即这个比(率)类型变量的计算公式。指求得这个比值时所依据

15、的分子统计数据和分母统计数据的比式。(二)对于比率类型统计变量平均数的要求对于比率类型统计变量平均数的要求是:所求的平均数是各个个体比率的总比率。 (三)比(率)类型统计变量的平均数1若已知资料为基本比式的比值和分母资料,则权数为分母资料,用 f 表示,采用加权算术平均数。2若已知资料为基本比式的比值和分子资料,则权数为分自资料,用 M 表示,采用加权调和平均数。3当采用同一资料时,加权算术平均数等于加权调和平均数。四、算术平均数与调和平均数中的加权问题1. 权数的确定确定权数的方式有两种:客观方式和主观方式。2. 权数的作用权数的作用是权衡变量的各个被平均数值在平均数中所起作用的轻重。36认识到权数的这种作用,在实践中,有时可以通过调整权数的结构来改变算术平均数或调和平均数水平。在分析算术平均数或调和平均数水平变动的原因时也要注意到这种情况:算术平均数及调和平均数水平的高低,除了受到统计变量观察值水平高低的影响之外,还受到权数结构变化的影响。3. 权数的形式算术平均数或调和平均数的权数可以有绝对数和结构相对数两种形式。 4. 权数的实质内容权数的实质内容在于它的结构,即权值总和中,各项权值之间的比例。4.4 数据分布的离散特征数数据分布的离散特征数一、 离散特征数的作用 1离散特征

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 法律文献 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号