样本数据的分析课件

上传人:桔**** 文档编号:568806299 上传时间:2024-07-26 格式:PPT 页数:76 大小:1.34MB
返回 下载 相关 举报
样本数据的分析课件_第1页
第1页 / 共76页
样本数据的分析课件_第2页
第2页 / 共76页
样本数据的分析课件_第3页
第3页 / 共76页
样本数据的分析课件_第4页
第4页 / 共76页
样本数据的分析课件_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《样本数据的分析课件》由会员分享,可在线阅读,更多相关《样本数据的分析课件(76页珍藏版)》请在金锄头文库上搜索。

1、顺序数据的频数分布表(例题分析)【例例例例】在在一一项项城城市市住住房房问问题题的的研研究究中中,研研究究人人员员在在甲甲乙乙两两个个城城市市各各抽抽样样调调查查300300户户,其其中中的的一一个个问问题题是是:“ “您您对对您您家家庭庭目目前前的的住住房房状状况是否满意?况是否满意?” ” 1 1 非非 常常 不不满满意意;2 2不不满满意意;3 3一一般般;4 4满满意;意;5 5非常满意。非常满意。 顺序数据的图示累计频数分布图 (例题分析)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积甲城市家庭对住

2、房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布宽度宽度未分组数据茎叶图(例题分析)某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图未分组数据茎叶图(扩展的茎叶图)分组方法等距分组等距分组异距分组异距分组单变量值分组(要点)n1. 将一个变量值作为一组n2. 适合于离散变量n3. 适合于变量值较少的情况组距分组 (要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,

3、也可采用不等距分组 组距分组(步骤)2. 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5K 15,1.1.确确定定组组距距:组组距距(class (class width)width)是是一一个个组组的的上上限限与与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值值和和最最小小值值及及所所分分的的组组数来确定,即数来确定,即 组距组距组距组距( ( 最大值最大值最大值最大值 - - 最小值最小值最小值最小值) ) 组数组数组数组数 3.3.统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表 组距分组(几个概念)n1. 下限下

4、限(low limit) :一个组的最小值n2. 上限上限(upper limit) :一个组的最大值n3. 组距组距(class width) :上限与下限之差n4. 组中值组中值(class midpoint) :n重合式组重合式组非重合式组非重合式组缺下限组的组中值上限(邻组组距缺下限组的组中值上限(邻组组距/2)缺上限组的组中值下限(邻组组距缺上限组的组中值下限(邻组组距/2)频数分布表的编制(例题分析)【 例例例例 】 表表 中中是是 某某 电电 脑脑 公公司司 20052005年年 前前四四 个个 月月 各各 天天的的 销销 售售 量量 数数据据( (单单位位:台台) )。试试对对

5、数数据据进行分组进行分组等距分组表(上下组限重叠)等距分组表(上下组限间断)等距分组表(使用开口组)数值型数据的中位数 (9个数据的算例)n【例例】 9个家庭的人均月收入数据n原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630n排排 序序: 750 780 850 960 1080 1250 1500 1630 2000n位位 置置: 1 2 3 4 5 6 7 8 9中位数中位数 1080数值型数据的中位数 (10个数据的算例)n【例例】:10个家庭的人均月收入数据n排排 序序: 660 750 780 850 960 1080 1250 1

6、500 1630 2000n位位 置置: 1 2 3 4 5 6 7 8 9 10 加权平均数 (Weighted mean)设各组的组中值为:设各组的组中值为:MM1 1 ,MM2 2 , ,MMk k 相应的频数为:相应的频数为: f f1 1 , f f2 2 , ,f fk k样本样本样本样本加权平均加权平均总体总体总体总体加权平均加权平均加权平均数加权平均数 (例题分析例题分析)加权平均数(权数对均值的影响)n 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下n 甲组:甲组: 考试成绩(考试成绩(x ): 0 20 100n 人数分布(人数分布(f ):):1 1 8n 乙组:

7、乙组: 考试成绩(考试成绩(x): 0 20 100n 人数分布(人数分布(f ):):8 1 1平均数(数学性质)n1. 各变量值与平均数的离差之和等于零 2. 各变量值与平均数的离差平方和最小中位数和平均数数学性质的验证几何平均数(geometric mean)1. n 个变量值乘积的个变量值乘积的 n 次方根次方根2.适用于对比率数据的平均适用于对比率数据的平均3.主要用于计算平均增长率主要用于计算平均增长率4.计算公式为计算公式为5. 5. 可看作是平均数的一种变形可看作是平均数的一种变形可看作是平均数的一种变形可看作是平均数的一种变形几何平均数 (例题分析)n 【例例】某某水水泥泥生

8、生产产企企业业1999年年的的水水泥泥产产量量为为100万万吨吨,2000年年与与1999年年相相比比增增长长率率为为9%,2001年年与与2000年年相相比比增增长长率率为为16%,2002年年与与2001年年相相比比增长率为增长率为20%。求各年的年平均增长率。求各年的年平均增长率年平均增长率年平均增长率114.91%-1114.91%-1=14.91%=14.91%几何平均数 (例题分析)n 【例例】一一位位投投资资者者购购持持有有一一种种股股票票,在在2000、2001、2002和和2003年年收收益益率率分分别别为为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平

9、均收益率计算该投资者在这四年内的平均收益率 算术平均:算术平均:算术平均:算术平均: 几何平均:几何平均:几何平均:几何平均:四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QQL LQQMMQQU U25%25%25%25%刻度级数据的四分位数 (9个数据的算例)n【例例】:9个家庭的人均月收入数据(4种方法计算)n原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630n排排 序序: 750 780 850 960 1080 1250 1500 16

10、30 2000n位位 置置: 1 2 3 4 5 6 7 8 9方法方法方法方法1 1数值型数据的四分位数 (9个数据的算例)n【例例】:9个家庭的人均月收入数据n原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630n排排 序序: 750 780 850 960 1080 1250 1500 1630 2000n位位 置置: 1 2 3 4 5 6 7 8 9方法方法方法方法2 2未分组数据未分组数据单批数据箱线图单批数据箱线图(箱线图的构成箱线图的构成)中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号