应用统计chapter 3

上传人:wm****3 文档编号:51717493 上传时间:2018-08-16 格式:PPT 页数:62 大小:770KB
返回 下载 相关 举报
应用统计chapter 3_第1页
第1页 / 共62页
应用统计chapter 3_第2页
第2页 / 共62页
应用统计chapter 3_第3页
第3页 / 共62页
应用统计chapter 3_第4页
第4页 / 共62页
应用统计chapter 3_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《应用统计chapter 3》由会员分享,可在线阅读,更多相关《应用统计chapter 3(62页珍藏版)》请在金锄头文库上搜索。

1、应用统计第三章:数据的图表展示(基本问题) 数据的整理与显示 要弄清所面对的数据类型不同类型的数据,采取不同的处理 方式和方法 对分类数据和顺序数据主要是作分类整理 对数值型数据则主要是作分组整理 适合于低层次数据的整理和显示方法也适合 于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据分类数据的整理与图示(基本过程) 分类数据的整理1.列出各类别 2. 2. 计算各类别的频数计算各类别的频数 3. 3. 制作频数分布表制作频数分布表 4. 4. 用图形显示数据用图形显示数据分类频数比例百分比比率AB CDE(可计算的统计量) 分类数据的整理 频数(frequency)

2、 :落在各类别中的数据个数 比例(proportion) :某一类别数据个数占全部数据个数的比值 百分比(percentage) :将对比的基数作为100而计算的比值 比率(ratio) :不同类别数值个数的比值( (例题分析例题分析) ) 分类数据整理分类数据整理频数分布表频数分布表 【例】:根据饮料文摘,“古典可乐”(Coke Classic)、健怡可乐(Diet Coke)、彭伯碳酸饮料(Dr.Pepper)、百事可乐(Pepsi-Cola)、以及雪碧(Sprite)是销售量居前五位的软饮料(华尔街日报,1998),下表是所选择的购买50次的软饮料的样本绿色绿色健康饮品健康饮品( (例题

3、分析例题分析) ) 分类数据整理分类数据整理频数分布表频数分布表( (例题分析例题分析) ) 分类数据整理分类数据整理频数分布表频数分布表品质标志频数相对频数分类数据频数分布表分类数据的图示条形图 用宽度相同的条形的高度或长短来表示各类别数据的图形 有单式条形图、复式条形图等形式 主要用于反映分类数据的频数分布 绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形 图(column chart) 分类数据的图示条形图分类数据的图示对比条形图 分类变量在不同时间或不同空间上有多个取值 对比分类变量的取值在不同时间或不同空间上的差异或变化趋势电脑 品牌一季度二季度联想256468IBM

4、285397康柏247328戴尔563688分类数据的图示对比条形图分类数据的图示帕累托图1.按各类别数据出现的频数多少排序后绘 制的柱形图 2.主要用于展示分类数据的分布分类数据的图示饼图 也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形 主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题 绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部 分数据百分比乘以3600确定分类数据的图示饼图顺序数据的整理与图示(可计算的统计量) 顺序数据的整理1. 累积频数(cumulative frequencies):各类别频数的逐级累加2

5、. 累积频率(cumulative percentages):各类别频率(百分比)的逐级累加 (例题分析) 顺序数据的频数分布表【例例】在一项城市住房问题的研究中,研究人员在甲乙两个城市在一项城市住房问题的研究中,研究人员在甲乙两个城市 各抽样调查各抽样调查300300户,其中的一个问题是:户,其中的一个问题是:“ “您对您家庭目前的住房您对您家庭目前的住房 状况是否满意?状况是否满意?” ”1 1非常不满意;非常不满意;2 2不满意;不满意;3 3一般;一般;4 4满意;满意;5 5非常非常 满意。满意。 甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)百分比 (%)向上累积 向

6、下累积 户数 (户)百分比 (%)户数 (户)百分比 (%)非常不满 意不满意一般满意非常满意24 1089345308 36 31 15 1024 132 225 270 3008.044.075.090.0 100.0300 276 1687530100.0 92 56 25 10合计300100.0(例题分析) 顺序数据的频数分布表乙城市家庭对住房状况评价的频数分布回答类别乙城市户数 (户)百分比 (%)向上累积 向下累积 户数 (户)百分比 (%)户数 (户)百分比 (%)非常不满意不满意一般满意非常满意21 99 78 64 387.0 33.0 26.0 21.3 12.721 1

7、20 198 262 3007.040.066.087.3 100.0300 279 180 10238100.093.060.034.012.7合计300100.0顺序数据的图示累计频数分布图(例题分析)243001322252700100200300400非常不满意不满意 一般 满意 非常满意累 积 户 数(户)(a)向上累积27616830300750100200300400非常不满意不满意 一般 满意 非常满意累 积 户 数(户)(b)向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布数值型数据的整理与展示数值型数据的整理与展示数据分组数值型数据的图数

8、据分组组距分组(要点) 将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 需要遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5K 15。原则上组内频数不少于5个,两端除外两个参考公式:组距分组 (步骤)组距分组 (步骤) 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距( 最大值 - 最小值) 组数组距一般取为正数,多为5,10及其倍数 统计出各组的频数并整理成频数分布表 组距分组 (几个概念)1. 下限(

9、lower limit) :一个组的最小值上限(upper limit) :一个组的最大值a, b). a 代表下限,b 代表上限规定重叠的数值归于后一组的下限2. 组距(class width) :上限与下限之差3. 组中值(class midpoint) :下限与上限之间的中点值下限值下限值+ +上限值上限值2 2组中值组中值 = =组距分组 (几个概念)4.缺上限或缺下限称为开口组缺上(下)限开口组组中值=上(下)限 -(+)相邻组组距/2频数分布表的编制 (例题分析)【例例】某电某电 脑公司脑公司20052005 年前四个月年前四个月 各天的销售各天的销售 量数据量数据( (单位单位

10、:台:台) )。试对。试对 数据进行分数据进行分 组组等距分组表 (上下组限重叠)等距分组表 (上下组限间断)等距分组表 (使用开口组)分组数据分组数据直方图和折线图直方图和折线图数值型数据的图示ExcelExcel分组数据直方图 (histogram) 用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图分组数据的图示 (直方图的绘制)140140 150150210210某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我一眼就看出我一眼就看

11、出 来了,销售量来了,销售量 在在170170180180 之间的天数最之间的天数最 多多! !190190 200200180180160160 170170频频数数( (天天) )25252020151510105 53030220220 230230 240240 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义 直方图的各矩形通常是连续排列,条形图则是分开排列 条形图主要用于展示分类数据,直方图则主要用于展示数值型数据分组数据直方图 (直方图

12、与条形图的区别)数值型数据的图示STATISTICASTATISTICA未未分组数据分组数据茎叶图和箱线图茎叶图和箱线图未分组数据茎叶图 (stem-and-leaf display) 用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成 的 以该组数据的高位数值作树茎,低位数字作树叶 树叶上只保留最后一位数字 5. 茎叶图类似于横置的直方图,但又有区别 直方图可观察一组数据的分布状况,但没有给 出具体的数值 茎叶图既能给出数据的分布状况,又能给出每 一个原始数值,保留了原始数据的信息 直方图适用于大批量数据,茎叶图适用于小批 量数据未分组数据茎叶图 (例题分析)某电

13、脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图未分组数据箱线图 (box plot) 用于显示未分组的原始数据的分布 由一组数据的5个特征值绘制而成,它由一个箱 子和两条线段组成 绘制方法 首先找出一组数据的5个特征值,即最大值、 最小值、中位数Me和两个四分位数(下四分位数QL 和上四分位数QU) 连接两个四分位数画出箱子,再将两个极值点 与箱子相连接 该箱线图也称为Median/Quart./Range箱线图 未分组数据单批数据箱线图 (箱线图的构成)中位数中位数4 46 68 810101212QQU UQQL LX X最大值最大值X X最小值最小值Median/Quart./Ra

14、ngeMedian/Quart./Range箱线图箱线图未分组数据单批数据箱线图 (例题分析)最小值最小值141141最大值最大值237237中位数中位数182182下四分位数下四分位数170.25170.25上四分位数上四分位数197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的某电脑公司销售量数据的 Median/Quart./RangMedian/Quart./Rang箱线图箱线图分布的形状与箱线图不同分布的箱线图不同分布的箱线图左偏分

15、布左偏分布QQL L中位数中位数 QQU ULeft-skewed distributionLeft-skewed distribution右偏分布右偏分布QQL L中位数中位数 QQU URight-skewed distributionRight-skewed distribution对称分布对称分布QQL L中位数中位数 QQU UBell-shaped distributionBell-shaped distribution未分组数据多批数据箱线图(例题分析)【例例】 从某大从某大 学经济管理专学经济管理专 业二年级学生业二年级学生 中随机抽取中随机抽取1111 人,对人,对8 8门主门主 要课程的考试要课程的考试 成绩进行调查成绩进行调查 ,所得结果如,所得结果如 表。试绘制各表。试绘制各 科考试成绩的科考试成绩的 批比较箱线图批比较箱线图 ,并分析各科,并分析各科 考试成绩的分考试成绩的分 布特征布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语 经济数学 西方经济学 市场营销 学 财务管理 基础会计学

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号