第2章_系统数学模型及其相互转换.ppt

上传人:bao****ty 文档编号:143804484 上传时间:2020-09-02 格式:PPT 页数:115 大小:12.25MB
返回 下载 相关 举报
第2章_系统数学模型及其相互转换.ppt_第1页
第1页 / 共115页
第2章_系统数学模型及其相互转换.ppt_第2页
第2页 / 共115页
第2章_系统数学模型及其相互转换.ppt_第3页
第3页 / 共115页
第2章_系统数学模型及其相互转换.ppt_第4页
第4页 / 共115页
第2章_系统数学模型及其相互转换.ppt_第5页
第5页 / 共115页
点击查看更多>>
资源描述

《第2章_系统数学模型及其相互转换.ppt》由会员分享,可在线阅读,更多相关《第2章_系统数学模型及其相互转换.ppt(115页珍藏版)》请在金锄头文库上搜索。

1、第 2章 统计资料的描述(统计数据的描述、统计数据特征描述),第 2 章 统计资料的描述,2.1 集中趋势的测度 2.2 离散程度的测度 2.3 偏态与峰态的测度,学习目标,1.集中趋势各测度值的计算方法 2.集中趋势各测度值的特点及应用场合 3.离散程度各测度值的计算方法 4.离散程度各测度值的特点及应用场合 偏态与峰态的测度方法 用Excel计算描述统计量并进行分析,数据分布的特征,集中趋势反映了一组资料中各数据所具有的共同趋势,即资料中各数据聚集的位置。通过这种趋势的研究可以了解事物的本质特征,可以掌握事物发展变化的规律。这种趋势在统计学中被称为集中趋势。,与集中趋势相反,离中趋势反映的

2、是一组资料中各观测值之间的差异或离散程度。,集中趋势和离散程度是数据分布的两个重要特征。除此还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度。,数据分布特征的测度,2.1 集中趋势的测度,一. 分类数据:众数 二. 顺序数据:中位数和分位数 三. 数值型数据:均值 四. 众数、中位数和均值的比较,数据分布特征的测度(本节位置),集中趋势(Central tendency),一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据,

3、分类数据:众数,众数(mode),一组数据中出现次数最多的变量值 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和数值型数据,众数(不唯一性),无众数原始数据: 10 5 9 12 6 8,一个众数原始数据: 6 5 9 8 5 5,多于一个众数原始数据: 25 28 28 36 42 42,定性变量的众数确定,1定性变量的众数确定 根据分类变量和顺序变量的不同取值得到频数分布,确定众数时,只需找出频数出现最多所对应的变量取值即为众数。 例: 通过观察频数分布表,可以直观看到受教育水平为高中的频数最大。因此对于3000名被调查者受教育水平来说,众数就是高

4、中学历。,分类数据的众数 (例题分析),解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值 在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即 Mo可口可乐,顺序数据的众数 (例题分析),解:这里的数据为顺序数据。变量为“回答类别” 甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即 Mo不满意,定量变量的众数确定,2定量变量的众数确定 对于离散型变量的取值,计算众数时,只需找出出现次数最多的众数组,该组的变量取值即为众数。 【例】根据表中35名调查员的有效问卷频数分布资料,确定众数

5、。,定量变量的众数确定,解:根据表中所示,问卷数为145份所对应的人数是4人,高于其他所有问卷数对应的人数。因此35名调查员有效问卷的众数是145份。 对于连续性变量的取值,首先根据组距分组得到频数分布。对于等距分组,对应频数最大的组为众数所在组;对于不等距分组,对应频数密度最大的组为众数组。,众数,设众数组的频数为 ,众数前一组的频数为 ,众数后一组的频数为 。 假定数据在众数组均匀分布,众数与其相邻两组的频数分布有如下关系: 下限公式: 上限公式:,众数,18,众数,【例】给出的某项调查中30名被访者的月收入水平分组数据,得到累积频数分布表。,众数,解:首先确定众数组是3000-40000

6、元组,因此,因此,30名被访者的月收入水平的众数是3428.6元。,众数,3.众数的特点 众数根据众数组及相邻组的频率分布信息来确定数据中心点位置的。 众数是一个位置代表值,它不受数据中极端值的影响。 没有利用所有观测值,对原数据信息的代表性也不如均值。 众数的实际代表意义只有在数据量足够多,且有明显的集中趋势时,才能体现得最好。否则,不宜用众数代表集中趋势。,众数在某些场合具有不可替代的作用。如服装和鞋帽尺码对于生产厂商非常重要,但用均值计算的数据可能是不存在的,生产厂商只有按照服装和鞋帽尺码的众数生产才有意义; 众数不仅可以代表数值型变量的集中趋势,还可以代表非数值类型变量的集中趋势。如房

7、地产商关心哪种“格局”房屋销售最多;饮料厂商关心哪种“颜色”的饮料销售最多;灯具厂商关心哪一种“造型”的灯具销售最多等。 众数还有一个作用是,当样本数据出现两个众数时,它提醒我们应怀疑这样的数据是否来自两个不同的总体。如对学生身高的数据进行整理,如果身高的数据出现了两个众数,应考虑是否将男女同学的身高数据混在了一起;将两个厂家生产的灯泡混在一起,检查它们的寿命,如果两个工厂的生产质量有很大差别,则会发现灯泡的寿命会出现两个众数。,顺序数据:中位数和分位数,中位数(median),一组数据按大小排序后处于中间位置上的变量值,不受极端值的影响 主要用于顺序数据,也可用数值型数据,但不能用于分类数据

8、 各变量值与中位数的离差绝对值之和最小,即,中位数,1中位数的确定 变量的取值数据规模较小时,将数据按大小排列。 当数据个数N为奇数时,处在 位置上的变量取值大小即为该组数据的中位数; 当数据个数N为偶数时,处在 和 位置上两个变量取值的简单算术平均数即为中位数。,顺序数据的中位数 (例题分析),解:中位数的位置为 300/2150 从累计频数看,中位数在“一般”这一组别中。因此 Me=一般,数值型数据的中位数 (9个数据的算例),【例】:9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 9

9、60 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9,中位数 1080,数值型数据的中位数 (10个数据的算例),【例】:10个家庭的人均月收入数据 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10,中位数,当变量的取值数据规模较大时,将数据按单项式分组或组距分组,得到频数分布 。对频数分布做向上累计或向下累计: 当 为偶数时,第 个变量值所在的组为中位数所在的组。 当 为奇数时,第 个变量值所在的组为中位数所在的组。 如果是单变量分组,可以该组

10、标志值作为中位数。 如果是组距分组,则采用如下公式近似计算得到计算公式 下限公式: 上限公式:,中位数,【例】给出的某项调查中30名被访者的月收入水平分组数据,得到累积频数分布表,计算其中位数。,中位数,解:,对应的收入水平是3000-4000元,因此该组就是中位数所在组,有,,,(元),(元),因此,30名被访者的月收入水平的中位数是3384.6元。,中位数,2中位数的性质 中位数位于依序排列资料的中间位置,是位置平均数,不易受极端值影响,当次数分配非对称或资料存在极端值时,中位数作为集中趋势的度量较好,是较稳健的集中趋势测度量指标。因此,许多国家政府发布的个人所得和人口年龄的平均值,往往用

11、中位数。 中位数的不足之处在于它的确定只与中间位置的一两个数值有关,忽略了其他数值的大小,缺乏敏感性,并且不适合代数运算。,四分位数(quartile),排序后处于25%和75%位置上的值,不受极端值的影响 主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,将资料按大小顺序排列后,分割成四等分,得到三个分割点, 每个分割点上的数值称为四分位数,用Qi表示,i=1,2,3,Qi称 为第i四分位数。,四分位数(位置的确定),原始数据:,顺序数据:,顺序数据的四分位数 (例题分析),解:QL位置= (300)/4 =75 QU位置 =(3300)/4 =225 从累计频数看, QL在“不满意

12、”这一组别中; QU在“一般”这一组别中。因此 QL = 不满意 QU = 一般,数值型数据的四分位数 (9个数据的算例),【例】:9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9,数值型数据的四分位数 (10个数据的算例),【例】:10个家庭的人均月收入数据 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5

13、6 7 8 9 10,数值型数据:均值,均值(mean),是数据集中趋势的最常用测度值 一组数据的均衡点所在 体现了数据的必然性特征 易受极端值的影响 用于数值型数据,不能用于分类数据和顺序数据,从统计思想上看,算术平均数是同质总体各数据的偶然性、随机性特征 互相抵消后的稳定数值,反映了数据集中的特征。,简单均值与加权均值(simple mean / weighted mean),设一组数据为: x1 ,x2 , ,xn 各组的组中值为:M1 ,M2 , ,Mk 相应的频数为: f1 , f2 , ,fk,简单均值,加权均值,已改至此!,加权均值 (例题分析),加权均值(权数对均值的影响),甲

14、乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩(x ): 0 20 100 人数分布(f ):1 1 8 乙组: 考试成绩(x): 0 20 100 人数分布(f ):8 1 1,可见,均值受到频数f 很大的影响,均值的结果会向f 相对较大 的变量值靠近。,均值(数学性质),1.各变量值与均值的离差之和等于零,2. 各变量值与均值的离差平方和最小,已知数值1,1,2,3的平均数、众数、中位数分别为1.75,1,1.5。若以平均数 来预测,误差分别为-0.75,-0.75,0.25,1.25,误差总和为0.以众数预测,误差为 0,0,1,2,误差总和为3.以中位数来预测,

15、误差为-0.5,-0.5,0.5,1.5,误差总和为1,调和平均数(数据倒数平均数的倒数)(harmonic mean),均值的另一种表现形式 易受极端值的影响 计算公式为,原来只是计算时使用了不同的数据!,调和平均数 (例题分析),【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格,几何平均数(geometric mean),n 个变量值乘积的 n 次方根 适用于对比率数据的平均 主要用于计算平均增长率 计算公式为,5. 可看作是均值的一种变形,几何平均数 (例题分析),【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2

16、001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。,年平均增长率114.91%-1=14.91%,几何平均数 (例题分析),【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率,算术平均:,几何平均:,均值在统计学中的地位,平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。从统计思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。,众数、中位数和均值的比较,均值、中位数、众数之间的比较,从分布的角度看:均值是一组数据全部数值的平均数。中位数是处于一组数据中间位置上的数值。众数始终是一组数据分布的最高峰值。 对于具有单峰分布的大多数数据而

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号