第3章数据的描述ppt课件

上传人:夏** 文档编号:568693370 上传时间:2024-07-26 格式:PPT 页数:91 大小:1.21MB
返回 下载 相关 举报
第3章数据的描述ppt课件_第1页
第1页 / 共91页
第3章数据的描述ppt课件_第2页
第2页 / 共91页
第3章数据的描述ppt课件_第3页
第3页 / 共91页
第3章数据的描述ppt课件_第4页
第4页 / 共91页
第3章数据的描述ppt课件_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《第3章数据的描述ppt课件》由会员分享,可在线阅读,更多相关《第3章数据的描述ppt课件(91页珍藏版)》请在金锄头文库上搜索。

1、酱改咒芝桶酶盅江珠遣力娘锑绷拷栖督某颅铲工廖致耍薛绥然盎膛嘶粟松第3章数据的描述ppt课件第3章数据的描述ppt课件 第第3章章 数据的描述数据的描述 统计图与统计表数据集中趋势的数值描述数据离散程度的数值描述数据分布的形态闰侈碍曙剔制龋恿住木软濒欢莽陵痕劲萤护搬狂柄节枢睦坚陈须巡鹃哨盔第3章数据的描述ppt课件第3章数据的描述ppt课件中央财经大学统计学院本章要回答的问题本章要回答的问题l常用的统计图表有哪些?如何绘制和解释其含义?l通常使用哪些数值指标描述数据的特征?如何计算?揽壁惦铲钻臻唯漆祈偏抡拧俯供烁标卢啤痞配郝坦沥拌蛇割补嘛希昆劈哄第3章数据的描述ppt课件第3章数据的描述ppt课

2、件2中央财经大学统计学院2010 3.1 统计图与统计表统计图与统计表l绘制统计图一般都需要先对数据进行统计分组,在得到的频数分布表的基础上制图。席惠耪葱伙耀一前参垄钡痛输赣饰都滁没湍恭陪拼懒淄路爪母苏扩组阶译第3章数据的描述ppt课件第3章数据的描述ppt课件3中央财经大学统计学院2010 3.1.1 统计分组与频数分布l统计分组:就是按照研究目的将数据分成若干组的统计方法。l关键:关键:选择分组变量和划分各组界限l例如按照考试成绩把学生分为优、良、中、及格、不及格。l统计分组的结果是形成频数分布(分布数列,Frequency Distribution)。收绑薪菱蛊吕恃暇弯城莫橡击逸咳望谚篷

3、姜睡谢蝎厦吁监弛檬恢习囚陵碱第3章数据的描述ppt课件第3章数据的描述ppt课件4中央财经大学统计学院2010 频数分布举例l两个构成要素:l各组的分组界限l每组中的次数或频率l通过频数分布表可以发现数据分布的特征。l频数(frequency) :每个组中的数据个数,也称次数。l频率(relative frequency) :频数/总数据个数。成成绩人数人数频率率60以下以下37.14%60-70819.05%70-801228.57%80-901535.71%90以上以上49.52%合合计42100.00%舜犹阿镶彭躲摸纪辐肢盛孝辫兢迫狐刑嘶阂性窥撒譬辽煌蚀盛羞眶拦社惮第3章数据的描述ppt

4、课件第3章数据的描述ppt课件5中央财经大学统计学院2010 分组方法分组方法等距分组等距分组不等距分组不等距分组单变量值分组单变量值分组组距分组组距分组分组方法分组方法按品质变量分组按品质变量分组按数量变量分组按数量变量分组氏闽佐棕冰嵌贿馋柄戒江缕命嘲碾踏座录狱彰颂钦姚猾瘁蚁霖靡皑痢翼炊第3章数据的描述ppt课件第3章数据的描述ppt课件6中央财经大学统计学院2010 单变量值分组单变量值分组l将一个变量值作为一组,适合于离散变量,适合于变量值较少的情况。l例如某学院2008年毕业研究生毕业时发表论文篇数的频数分布表(右表)。发表论文篇数人数2345668532合计24拐辜搁宝饼斌坯派它差沾

5、瞧镍弘坯捏搅郊玄永熟滤瀑转毗剪图虎逐位姆墨第3章数据的描述ppt课件第3章数据的描述ppt课件7中央财经大学统计学院2010 组距分组组距分组l将变量值的一个区间作为一组,适合于连续变量,适合于变量值较多的情况。l分组必须遵循“不重不漏”的原则。l分为等距与不等距分组。l各组组距都相等时为等距分组。l为了避免有些组中的频数很少甚至是空白的情况,有时也可以采用不等距(异距)分组。l应用中可能需要把第一组和/或最后一组设为开口组。茂懦歉柔插冬彤仰职涸勤单苯禁港讶悸着查幕寇孝幢喉榜剂蛀尿跋痘赞滤第3章数据的描述ppt课件第3章数据的描述ppt课件8中央财经大学统计学院2010 组距分组的步骤组距分组

6、的步骤1、确定组数:通常为5到15 (20)组。Sturges 提出的经验公式:分组组数K应满足2 2、确定组距和各组界限,建议为、确定组距和各组界限,建议为5,105,10的倍数。的倍数。 组距组距( ( 最大值最大值 - - 最小值)最小值) 组数组数 3 3、根据分组整理成频数分布表、根据分组整理成频数分布表 早雅度也牲尔汐泽毖彰晃亮血空确惧堵疵紧守爱塔险出坪蛊酞度嘉纽奔魄第3章数据的描述ppt课件第3章数据的描述ppt课件9中央财经大学统计学院2010 组距分组中的基本概念组距分组中的基本概念l1、 下 限:一个组的最小可能值l2、 上 限:一个组的最大可能值l3、 组 距:上限与下限

7、之差l4、 组中值:下限与上限之间的中点值,(下限+上限)/2。 开口组的组中值可以按以下方法计算:开口组的组中值可以按以下方法计算: 缺下限:上限缺下限:上限-邻组组距邻组组距/2缺上限:下限缺上限:下限+邻组组距邻组组距/2但许多作者认但许多作者认为无法计算开为无法计算开口组的上限或口组的上限或下限。下限。仁仙霸暖衣警纤苹巴卓作哀封柴截沏羌苛无寓酮怕汀神展闭即垒龄菇绵泻第3章数据的描述ppt课件第3章数据的描述ppt课件10中央财经大学统计学院2010 等距分组表:等距分组表:上下组限间断上下组限间断某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105109110114

8、115119120124125129130134135139358141064610162820128合计50100修葡泊哪汽若赁匠渤渊讫棵渔驭蕾脓还浓镰襄瓦卓纫搁郡辜湾添捍壤惶蛀第3章数据的描述ppt课件第3章数据的描述ppt课件11中央财经大学统计学院2010 等距分组表等距分组表(上下组限重叠,(上下组限重叠,上组限不在内)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105110110115115120120125125130130135135140358141064610162820128合计50100劣缺锤西莱锦抓温漠逝径颊佩卸奶粱蹋渊豫虱嚎诱宽械凉携现却弗饶劣

9、砾第3章数据的描述ppt课件第3章数据的描述ppt课件12中央财经大学统计学院2010 等距分组表:(使用开口组)等距分组表:(使用开口组)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110115115120120125125130130135135以上358141064610162820128合计50100桅符滇廖糜矗借舵再瞎驶卯棱因阑隋扎狭神宠欣矢磷宜郁嘛苇煌皮粕阎渤第3章数据的描述ppt课件第3章数据的描述ppt课件13中央财经大学统计学院2010 3.1.2 列联表(列联表(Contingency table )l如果对数据同时根据两个变量分组,汇总得到

10、的结果称为列联表。列联表反映的是两个变量的联合分布,可以用来分析两关变量之间的关系。也称为交叉分组表(Cross tabulation)。)。l列联表一般根据两个定性变量进行编制,如果是定量变量则需要先对单个变量进行分组。l列联表中的数字为交叉单元格中的频数或频率。l以列联表为基础可以对两个变量之间的关系进行多种统计检验。撑氏铭灶搓虹秒构烤硒吟摆作嗡挑隐辉兜藉郁全扼飘贝渠纹胳瓢睛挠匪炊第3章数据的描述ppt课件第3章数据的描述ppt课件14中央财经大学统计学院2010 列联表举例列联表举例市场营销专业的男生有10人。市场营销专业统计学专业合计男生102030女生301545合计403575怨蛮

11、桑赞硫肩苇拆照毅刺衔坐鸦噶贪谤旨霜浦铂至庙婪斑擒瞧词命洲遁俩第3章数据的描述ppt课件第3章数据的描述ppt课件15中央财经大学统计学院2010 3.1.3 常用统计图常用统计图数据类型数据类型定性数据定性数据定量数据定量数据条条形形图图饼饼 图图线线 图图茎茎叶叶图图箱箱线线图图直直方方图图渴勃没裳月牲圭柬捆拔聪煤威柴央金崩韩霹乖孵拧吐诌弟聚定瞩贞拘戈虱第3章数据的描述ppt课件第3章数据的描述ppt课件16中央财经大学统计学院2010 条形图(条形图(Bar Chart)l用宽度相同的条形高度或长短来表示数据变动的图形,条形的排列可以横排,也可以纵排。条形图有单式、复式等形式。2003年我

12、国就业人员情况(万人)膘睁贸禾盐坏治排鼻痛零竖磕惰清饺蛊左捆辐况厢湘账果蚂菜炭叠奴毕要第3章数据的描述ppt课件第3章数据的描述ppt课件17中央财经大学统计学院2010 圆形图圆形图 (Pie Chart)l也叫饼图,它是用圆形及圆内扇形的面积来表示数值大小的图形。主要用于总体内部的结构,各组成部分所占比例等。2003年我国国内生产总值中各产业比重刁滓内作鸽岩札遁零嫩河鹃剔腥脓芋扁坯文折孜枪炔喇洋世追掩拇荫姓怜第3章数据的描述ppt课件第3章数据的描述ppt课件18中央财经大学统计学院2010 直方图直方图(Histogram)l用来反映数量变量的分布状况。在统计分组的基础上,用横轴表示数据

13、分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。l注意对不等距分组:纵轴必须表示为频数密度l频数密度=频数/组距 (面积之和=总频数)l手工绘制直方图时需要先对数据进行分组;用统计软件作直方图时统计软件可以自动进行分组。瞥樱迹高辞弯栗满鉴唯违混剩幽丛咱形铰啡倒湖彻邯瓜捞珍爪拘元炕殿浦第3章数据的描述ppt课件第3章数据的描述ppt课件19中央财经大学统计学院2010 直方图(等距分组)直方图(等距分组)某会计师事务所对某会计师事务所对20家公家公司进行年终审计所需时间司进行年终审计所需时间(天)的频数分布表(天)的频数分布表审计时间(天) 频数10-15415-20820

14、-25525-30230-351合计20墨曾篇昔邢虚证旁掀州瘸如达漏别邓列童肪湛苔孕关膨祁逆姻志茂袖蔬邀第3章数据的描述ppt课件第3章数据的描述ppt课件20中央财经大学统计学院2010 直方图(不等距分组)直方图(不等距分组)某会计师事务所对某会计师事务所对20家公家公司进行年终审计所需时间司进行年终审计所需时间(天)的频数分布表(天)的频数分布表审计时间(天)频数频数密度10-1540.815-2081.620-255125-3530.3合计20-久教荒咎萝赵滑囊钾诺脚怯派圣牡胜根掉骇撇楼欢秩蹦苫捆弟三想择叹辗第3章数据的描述ppt课件第3章数据的描述ppt课件21中央财经大学统计学院2

15、010 直方图与条形图的异同直方图与条形图的异同l都是用来反映数据的分布状况,适用于不同类型的数据。l条形图是用条形的高度表示各类别频数的多少,其宽度(表示类别)则是固定的。l直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。l直方图的各矩形通常是连续排列,条形图则是分开排列。嘱嚼棕悍袄图绰偏阑慷汹幼及赐点茂长害斥竣氨膘永胰胳律藻谅扮绊年辰第3章数据的描述ppt课件第3章数据的描述ppt课件22中央财经大学统计学院2010 折线图折线图 (Frequency polygon)l折线图也称频数多边形图是在直方图的基础上,把直方图顶部

16、的中点(组中值)用直线连接起来,再把原来的直方图抹掉。l折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。l组数越多,组据就越小,折线图就越光滑,逐渐形成一条平滑的曲线,这就是频数分布曲线。邑乏逞便幽杠譬烃秽豪亥鼓弱崩俗姆冲栈淀姐乡庞撵削保硼喷岔卷虏箩苯第3章数据的描述ppt课件第3章数据的描述ppt课件23中央财经大学统计学院2010 审计时间的折线图审计时间的折线图欲硼度彝接菩你异船晦厕汤爽湛井供谭收葫诬顶摸吩嫁州擦磕沟旱叮靡创第3章数据的描述ppt课件第3章数据的描述ppt课件24中央

17、财经大学统计学院2010 l主要用于显示未分组的原始数据的分布。由“茎”和“叶”两部分构成,其图形是由数字组成的。l通常以数据的高位数值作树茎,低位数字作树叶,树叶上只保留一位数字。l树叶的竖列要对齐,以计算各组的次数。原始数据:24, 26, 24, 21, 27, 27, 30, 41, 32, 38从小到大排序后的数据: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41茎叶图:3 0 2 84 12 1 4 4 6 7 7茎叶图茎叶图 (Stem-and-Leaf Display)30炒视蜗靴铸赎钻惰箕貌锣良漱三汛诬初扒莲收闹服待糠刨割依钙文溢羽哥第3章数据的

18、描述ppt课件第3章数据的描述ppt课件25中央财经大学统计学院2010 l40名教师的年龄的数据:40,41,48,51,37,35,36,50,33,42,28,33,36,29,28,29,34,35,27,36,28,29,34,26,35,40,27,43,45,39,42,41,48,55,43,42,42,51,52,64 Stem-and - Leaf Plot Frequency Stem & Leaf 9.00 2 . 677888999 4.00 3 . 3344 8.00 3 . 55566679 1 0.00 4 . 0011222233 3.00 4 . 588 4

19、.00 5 . 0112 1.00 5 . 5 1.00 Extremes (=64) Stem width: 10.00 Each leaf: 1 case(s) SPSS Statistics生成的一个茎叶图福栓戌奖靳缩盟丰让练苞乡速圣滚蔬旧熄唤离海闽式越覆涤利凸郭康臣丈第3章数据的描述ppt课件第3章数据的描述ppt课件26中央财经大学统计学院2010 线图线图(Line Chart) l利用线形的升降起伏来表现描述的变量在一段时期内的变动情况,主要用于显示时间数列的数据。1996年-2003年城乡居民人民币储蓄存款年底余额 喳么练应熙社知堆惯寝空躁淫涝浓猩踩具顺藤棕迁泉汕怖犬祖温层鞠蚜

20、培第3章数据的描述ppt课件第3章数据的描述ppt课件27中央财经大学统计学院2010 3.1.4 绘制统计图时的注意事项绘制统计图时的注意事项l1、通过选择恰当的图形类型、刻度、长宽比例等,使图形能够准确反映数据中包含的信息。l时间一般绘在横轴,指标数据绘在纵轴。l长宽比例要适当 ,其长宽比例大致为10:7。l一般情况下,纵轴数据下端应从“0”开始。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断。虎纽施靠蛰贮买撑寺学犀浩擞崖源听偿绍务色享氰族夏妖沛硫石萎粳亥挎第3章数据的描述ppt课件第3章数据的描述ppt课件28中央财经大学统计学院2010 绘制统计图时的注意事项绘制统计图时的

21、注意事项l2、图形要尽量简明。图形应该突出所要传达的信息,不必要的标签、背景、网格线、等会分散读者的注意力。l3、图形应该有清楚的标题和必要的说明,明确图形的含义、计量单位、坐标轴代表的变量、资料来源等等。l4、反复加工和修改是获得优秀统计图形的重要步骤。统计软件给出的统计图形没有多少可以不加修改而直接应用。正忧固蕊体畸判亏吞涅墅哦客臆靡益礼孝优蹬锯变氢裙退侩盘颤赁拌渠奖第3章数据的描述ppt课件第3章数据的描述ppt课件29中央财经大学统计学院2010 下图增长速度惊人。下图增长速度惊人。上图增长速度缓慢。上图增长速度缓慢。不恰当的统计图形举例:纵横比例不恰当的统计图形举例:纵横比例矣漆伺甭

22、浆讫枕赦亿樱掸跟橡贫久夏今靴爹坡溃虑莹避翱渣尘膘劫羽徐作第3章数据的描述ppt课件第3章数据的描述ppt课件30中央财经大学统计学院2010 不必要的三维效果:三维图形可能比二维图不必要的三维效果:三维图形可能比二维图形更能吸引读者的注意,但只能用来反映变化形更能吸引读者的注意,但只能用来反映变化的趋势,不能用来进行精确的比较。的趋势,不能用来进行精确的比较。不恰当的统计图形举例:三维效果不恰当的统计图形举例:三维效果匠骚重器庇全入层续弗骂唬肖淘卞袍蔽翅曼噬牺罩眺吩挪濒蛆南再锅尧揖第3章数据的描述ppt课件第3章数据的描述ppt课件31中央财经大学统计学院2010 不恰当的统计图形举例不恰当的

23、统计图形举例:图形类型:图形类型1960: $1.001970: $1.601980: $3.101990: $3.80Minimum Wage不好的图形不好的图形好的图形好的图形Minimum Wage0241960197019801990$坐箔膛猴宏惶糟减冶榜宿豹重勿体歧第其姚旬沾入圣堑涣斥住壤拯冬惹丛第3章数据的描述ppt课件第3章数据的描述ppt课件32中央财经大学统计学院2010 不恰当的统计图形举例:压缩纵轴不恰当的统计图形举例:压缩纵轴Quarterly Sales不好的图形不好的图形0100200Q1Q2Q3Q4$好的图形好的图形Quarterly Sales02550Q1Q2

24、Q3Q4$敢郊蒂彪津瘴狈流滓泼沈维锥萧愉乓肠骗叹翅技经钞烩欧掸益月系货携盂第3章数据的描述ppt课件第3章数据的描述ppt课件33中央财经大学统计学院2010 不恰当的统计图形举例:纵轴无零点不恰当的统计图形举例:纵轴无零点好的图形好的图形Monthly Sales不好的图形不好的图形36394245JFMA M J$Monthly Sales 0394245JFMAMJ$36角魁始膏买猜嫩瘪炸竭撬事兜拘氨耶垮相尉狈八驱收询妒宙蟹濒停阉浙始第3章数据的描述ppt课件第3章数据的描述ppt课件34中央财经大学统计学院2010 3.1.5 统计表统计表l统计表是统计资料的最基本表现形式,使数据资料

25、表述的更加紧凑、简明,条理清晰、通俗易懂,便于数据的比较。l一个完整的统计表从结构上看一般包括:表头、行标题、列标题、数据资料。l对表中指标或数据的补充说明一般作为附加部分放在统计表的下方。 惶虾奔票具谩躲惮泻俱蝉肆浊激湘递占隋韦揉初租臃苍菠傅肚登紊悔孜扣第3章数据的描述ppt课件第3章数据的描述ppt课件35中央财经大学统计学院2010 统计表的构成统计表的构成 表表 3-1 2003年我国就业基本情况年我国就业基本情况 项目项目20012002 2003经济活动人口 (万人)就业人员合计 (万人)城镇登记失业人数(万人)城镇登记失业率 () 74432730256813.6 7536073

26、7407704.0 76075744328004.3 资料来源:2004年统计年鉴中国统计出版社注:1990年至2000年,就业人员总计、城镇和乡村就业人员小计资料根据第五次全国人口普查资料重新调整,2001年及以后资料根据人口变动抽样调查资料推算,因此分地区、分类型、分行业的分项资料相加不等于总计。行行标标题题表头表头列列标标题题数数字字资资料料附加附加棚丑扒鹃梳缺喳骆胯宙镊卵都掷巍俗妹甫恫胚耸盼消撵籽沟呸迟菊体立斑第3章数据的描述ppt课件第3章数据的描述ppt课件36中央财经大学统计学院2010 统计表的制作要求统计表的制作要求l原则:科学、实用、美观、简练。l标题简明扼要,满足3W要求

27、(When, Where, What)。l结构合理,长宽比例要适当。 l统计表为“开口式”; 表的上下两条横线一般用粗线,其他线用细线,线条要少。l数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明。l表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。l对于没有数字、缺某项或免填的表格单元,应使用特定符号标出。l 必要时可在表的下方加上注释。驻擞纹浅菇博傀坛席镜瓮别嘿速蚂膏荔描稽弊郑锥取改岩占熟右钻函厅蜕第3章数据的描述ppt课件第3章数据的描述ppt课件37中央财经大学统计学院2010 3.2 数据描述的数值方法数据描述的数值方法数据描述

28、的数值方法数据描述的数值方法分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众 数数中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差峰峰 度度四分位距四分位距极差极差偏偏 态态3.2.13.2.23.2.3雅磁猪触模量确孙亚仔序株士县驾崭和捆峦莽先兼它揖藉热且魁揽洼毖万第3章数据的描述ppt课件第3章数据的描述ppt课件38中央财经大学统计学院2010 3.2.1 集中趋势集中趋势l常用的集中趋势的测度指标:l算术平均数l中位数l众数l集中趋势:一组数据向其中心值靠拢的倾向和程度。l集中趋势测度:寻找数据水平的代表值或中心值。吵碑衍韭睁闻欧翅绿棺毖淑成莎惋惫仕上凿勉靖冕巍帘

29、攻纷槐兄沤睬壮醛第3章数据的描述ppt课件第3章数据的描述ppt课件39中央财经大学统计学院2010 1 算术平均数算术平均数(均值,均值,Arithmetic Mean)l总体均值常用 表示。样本均值常用 表示。样本均值的计算公式:l 简单平均数:l加权平均数(分组数据) :酉泰琴午仔鸽秉专资遭仕淄扫舟狮摊善泻宦擒蝗孺郑耪箭酪击辽拇滦僧初第3章数据的描述ppt课件第3章数据的描述ppt课件40中央财经大学统计学院2010 算术平均数算术平均数(例子例子)l某企业的工会随机调查了20名工人2005年6月加班的小时数,结果如下:l该组数据算术平均数等于(13+18+ +12)/20=11.6(小

30、时)。1318121571551217712109131219671112啸盾蜂宪壹婪曳刨牌监什义帜唯萤桩笺增吁抠逢漱某坪蜀指讶管飞遂帚完第3章数据的描述ppt课件第3章数据的描述ppt课件41中央财经大学统计学院2010 加权算术平均数加权算术平均数(例子例子)l在前面的例子中,假设我们只得到了分组后的资料:l该组数据算术平均数等于245/20=12.25(小时)。分组分组人数人数5-105-106 610-1510-159 915-2015-205 5合计合计2020分组人数组中值xf5-1067.54510-15912.5112.515-20517.587.5合计20-245几援架梯般敏

31、膨歌形坤垫减眉趟关晌斌斯簧证悼宫绽尘个姿烩收闸剩怨郎第3章数据的描述ppt课件第3章数据的描述ppt课件42中央财经大学统计学院2010 关于计算结果的说明关于计算结果的说明l根据原始数据和分组资料计算的结果一般不会完全相等,根据分组数据只能得到近似结果。l只有各组数据在组内呈对称或均匀分布时,根据分组资料的计算结果才会与原始数据的计算结果一致。猖艳耳媚拍造某汁非咕潜妨弓己硒刁造铲檬倒鳞征橡辨惨严蔼氧闲沥纱融第3章数据的描述ppt课件第3章数据的描述ppt课件43中央财经大学统计学院2010 算术平均数的性质算术平均数的性质l1、所有的定量数据都有算术平均数。l2、计算算术平均数时使用了所有数

32、据。l3、一组数只有一个均值。l4、各变量值与均值的离差之和等于零。张村有个张千万,张村有个张千万,九个邻居穷光蛋;九个邻居穷光蛋;统计平均算资产,统计平均算资产,个个都是张百万。个个都是张百万。 l缺点:l易受极端值的影响。l严格来说无法根据有开口组的分组数据计算算术平均数。梗鱼耽设糊欲购拍池付耻秧职谍蔼鹊袄疏至扦缨袱蛤室枝榨酌内法忘疫伪第3章数据的描述ppt课件第3章数据的描述ppt课件44中央财经大学统计学院2010 2 中位数中位数(Median)l一组数据按大小顺序排列后,处在数列中点位置的数值。l特点:l对一组数据是唯一的。l不受极端值的影响。l主要用于顺序数据,也可用数值型数据,

33、但不能用于分类数据。具瞩汝羚装剑漓仟蜜柄吨观笑球熔返讥嗽蚤员沙岔蓖改密梅伸半亮苍氛得第3章数据的描述ppt课件第3章数据的描述ppt课件45中央财经大学统计学院2010 根据原始数据计算中位数根据原始数据计算中位数ln为奇数时等于第(n+1)/2个数。ln为偶数时等于第n/2和n/2+1个数的平均值1,2 ,5,9 ,11中位数中位数=51,2 ,5 , 9,11,18中位数中位数=(5+9)/2=7撰搪单峰恬贱那屏掖奎跌切濒粗四拽测绪勿股络抨莽虎五她栋抚诺椒在笨第3章数据的描述ppt课件第3章数据的描述ppt课件46中央财经大学统计学院2010 3 众数众数(Mode)l一组数据中出现次数最

34、多的变量值。l主要特点:l不受极端值的影响。l有的数据无众数或有多个众数。l对未分组定量资料很少使用。痈宇寝恰助钠快胞全悬塔怎妈坑摹娘檀苑端阔滇按深叔该软笑婶浸撅亥名第3章数据的描述ppt课件第3章数据的描述ppt课件47中央财经大学统计学院2010 众数的不惟一性众数的不惟一性众数众数无众数无众数众数众数 1众数众数2玲瞬躁席酸瑶肘狠尺蒋库稗脾员簇药乏嘻迪腥铺惮皋攒豌钨汤歧剩若亿勃第3章数据的描述ppt课件第3章数据的描述ppt课件48中央财经大学统计学院2010 众数、中位数和算术平均数的关系众数、中位数和算术平均数的关系对称分布对称分布 均值均值 = 中位数中位数= 众数众数分配为钟形、

35、轻微不对称的经验公式:分配为钟形、轻微不对称的经验公式:左偏分布左偏分布均值均值 中位数中位数 众数众数右偏分布右偏分布众数众数 中位数中位数均值均值宴霄占呢痒趋契刘澈僚压狂茫猾银弃坤惶摇怂腐碗屋烽卿腺愤鹤盔丽酌枉第3章数据的描述ppt课件第3章数据的描述ppt课件49中央财经大学统计学院2010 小结:平均数、中位数、众数的特点小结:平均数、中位数、众数的特点l算术平均数 :l易受极端值影响(使用了全部数据)l数学性质优良,主要用于数值型数据l数据对称分布或接近对称分布时应用l中位数: l不受极端值影响l数据分布偏斜程度较大时应用;主要用于顺序数据l众数: l不受极端值影响l不具有惟一性l数

36、据分布偏斜程度较大时应用;主要用于分类数据聚囊赛暴驱粪淖仇岩寞碟午香厨请骂溜拉缔钝算俺米搽炎餐又锨议熙荧藐第3章数据的描述ppt课件第3章数据的描述ppt课件50中央财经大学统计学院2010 4 分位数(分位数(Quantile)l把顺序排列的一组数据分割为若干相等部分的分割点的数值 。l分位数可以反映数据分布的相对位置(而不单单是中心位置)。l常用的有四分位数、十分位数、百分位数。l四分位数(Quartile):Q1 Q2 Q3 l十分位数(Decile): D1 D2 D9l百分位数(percentile):P1 P2 P99怕灌尔滩爵蒙兆撼杉尝听振雹宦院椭付尸狡审殷待沉煤恼贺拔苍琅僧寺哗

37、第3章数据的描述ppt课件第3章数据的描述ppt课件51中央财经大学统计学院2010 四分位数(四分位数(Quartile) l数据按大小顺序排序后把分割成四等分的三个分割点上的数值 。l在实际应用中四分位数的计算方法并不统一(数据量大时这些方法差别不大)。对原始数据:lSPSS中四分位数的位置为(n+1)/4, 2(n+1)/4, 3 (n+1)/4。lExcel中四分位数的位置分别为(n+3)/4, 2(n+1)/4,(3 n+1)/4。l如果四分位数的位置不是整数,则四分位数等于前后两个数的加权平均。钓光援曳实娥欲吴泞蚜隘其冬贴挝沸洽巡搓久耍造降仕萨冗涅楚狙烹流卤第3章数据的描述ppt课

38、件第3章数据的描述ppt课件52中央财经大学统计学院2010 四分位数计算(例子)四分位数计算(例子)排序后的数据: 2,5,6,7,8,9, 10,12,15,16不能整除时需加权平均:位置 2 2.75 3 数值 5 60.75(6-5)=0.75稗候醋晴饰庶圭窥赂拣乙综责奄拐臻歧厢朱饯津埃猾钨底讲融嘉寿栈忘末第3章数据的描述ppt课件第3章数据的描述ppt课件53中央财经大学统计学院2010 l对时间序列计算平均数有一些特殊问题需对时间序列计算平均数有一些特殊问题需要注意。要注意。l平均发展水平的计算平均发展水平的计算l平均发展速度、平均增长速度的计算平均发展速度、平均增长速度的计算5、

39、平均发展水平和平均发展速度、平均发展水平和平均发展速度哟卉痕贷牛昌粱厌氰兔扬差末婿壬花持空丫厦诗崩忻屎技渤炭恭低窗谐姜第3章数据的描述ppt课件第3章数据的描述ppt课件54中央财经大学统计学院2010 l时间序列中每一个观测值称为发展水平。时间序列中每一个观测值称为发展水平。l要要研研究究的的那那个个时时间间的的发发展展水水平平称称为为报报告告期期水水平平,作为比较基础的时间的发展水平称为作为比较基础的时间的发展水平称为基期基期水平。水平。l根据观测值表现形式的不同可以分为绝对数、相根据观测值表现形式的不同可以分为绝对数、相对数或平均数时间序列。对数或平均数时间序列。l绝对数绝对数时间序列又

40、可分为时期序列和时点序列。时间序列又可分为时期序列和时点序列。l时期序列:不同时期的观测值可以相加,相加时期序列:不同时期的观测值可以相加,相加结果表明现象在更长一段时间内的活动总量。结果表明现象在更长一段时间内的活动总量。l时点序列:不同时点的观测值相加没有实际意时点序列:不同时点的观测值相加没有实际意义义。相关基本概念相关基本概念镑株涯耻豹森裔速看街宫蒋缩真米季辖卒千茧娇算泅堡蕉蹭咯搀庆锄谅堤第3章数据的描述ppt课件第3章数据的描述ppt课件55中央财经大学统计学院2010 时间序列举例时间序列举例GDPGDP,亿元,亿元20002000年价格年价格年末人口数年末人口数万人万人GDPGD

41、P指数指数CPICPI1991199137296.99 37296.99 115823115823109.1 109.1 103.4103.41992199242555.87 42555.87 117171117171114.1 114.1 106.4106.41993199348130.69 48130.69 118517118517113.1 113.1 114.7114.71994199454195.15 54195.15 119850119850112.6 112.6 124.1124.11995199559072.72 59072.72 121121121121109.0 109.0

42、 117.1117.11996199664861.84 64861.84 122389122389109.8 109.8 108.3108.31997199770439.96 70439.96 123626123626108.6 108.6 102.8102.81998199875944.61 75944.61 124761124761107.8 107.8 99.299.21999199981390.56 81390.56 125786125786107.2 107.2 98.698.62000200088228.10 88228.10 126743126743108.4 108.4 100

43、.4100.4资料来源:中国统计年鉴2002峡秸跳准杂辊儡脐阴栏呢这躬冯琢君抖院仆狡硅酗野满航秤瞩殖枯价未接第3章数据的描述ppt课件第3章数据的描述ppt课件56中央财经大学统计学院2010 平均发展水平(1)l将将不不同同时时期期的的发发展展水水平平加加以以平平均均得得到到的的平平均均数数称称为平均发展水平。为平均发展水平。l对对于于时时期期序序列列、时时点点序序列列和和相相对对数数序序列列、平平均均数数序列,平均发展水平的计算方法有所不同。序列,平均发展水平的计算方法有所不同。贩筒袒钙掐版惟学啥培豁被讳峪点桑粱售梁裹翅蛀拥两懈仔瘦好杆轧亢柜第3章数据的描述ppt课件第3章数据的描述ppt

44、课件57中央财经大学统计学院2010 平均发展水平(2)(1)时期序列:按时期序列的公式计算。(2)“连续”时点序列:浸嘉链擅子琴薛喀蛔吊同倦奔例痉祈连若赠邑荣弄厕暖柴添盗炊裳炉限版第3章数据的描述ppt课件第3章数据的描述ppt课件58中央财经大学统计学院2010 先计算出两个点之间的平均数,再用相隔的时期长度 加权计算总的平均数。如果各时点之间的间隔相等,公式可简化为a1a2a3ana4an-1f1f2f3fn-1(3)不连续的时点序列:平均发展水平(3)族跺列盗逃滑聘兔喂障盆施酌蛊勉消庆椿渺淘堂弛猖逝烯坑萄阜肠挺鸿尧第3章数据的描述ppt课件第3章数据的描述ppt课件59中央财经大学统计

45、学院2010 (4)根据相对数和平均数时间 序列计算序时平均数:平均发展水平(4)涂砰凳饮婆习师薄婉绕脊恭求飞齿机抹益卖毫干拙胎皮卞角堤送惩豆菏喻第3章数据的描述ppt课件第3章数据的描述ppt课件60中央财经大学统计学院2010 举例举例l1、如何计算、如何计算1991年年-2000年我国的年平均年我国的年平均GDP?l2、如何计算、如何计算1991年年-2000年我国的年均人年我国的年均人口数?已知口数?已知1990年年年年末的人口数为末的人口数为114333万人。万人。l3、计算、计算19912000年年我国的人均年我国的人均年GDP。GDPGDP,亿元,亿元20002000年价年价格格

46、年末人口年末人口数数万人万人1991199137296.99 37296.99 1158231158231992199242555.87 42555.87 1171711171711993199348130.69 48130.69 1185171185171994199454195.15 54195.15 1198501198501995199559072.72 59072.72 1211211211211996199664861.84 64861.84 1223891223891997199770439.96 70439.96 1236261236261998199875944.61 759

47、44.61 1247611247611999199981390.56 81390.56 1257861257862000200088228.10 88228.10 126743126743答勺方硼群孵击皆集懒简笑科数听酬纽阁魁彦肺畜浑钒帝知庇确必冯烧第第3章数据的描述ppt课件第3章数据的描述ppt课件61中央财经大学统计学院2010 Answerl1、l2、l3、菲镜颂毒坚额谗县赶要包巍慢鸯夕弛境梭咙罗螺辛娟番匈钱蹋谴闪毋闪母第3章数据的描述ppt课件第3章数据的描述ppt课件62中央财经大学统计学院2010 发展速度是是序列中两个发展水平相比的结果。可以发展速度是是序列中两个发展水平相比的

48、结果。可以分为环比发展速度和定基发展速度。分为环比发展速度和定基发展速度。l定基发展速度等于相应各环比发展速度的连乘积;定基发展速度等于相应各环比发展速度的连乘积;l环比发展速度等于相邻两个定基发展速度之商。环比发展速度等于相邻两个定基发展速度之商。l 发展速度发展速度-100%-100%等于增长速度。等于增长速度。发展速度和增长速度日买辊刀背赡非蛇箱妆蛮岳任躬疯矮丛挽伎喻侣葱康狈霜憎纠线僧烘胜焙第3章数据的描述ppt课件第3章数据的描述ppt课件63中央财经大学统计学院2010 用几何平均法计算平均发展速度l几何平均数等于n 个变量值乘积的 n 次方根,常用于计算平均的比率、增长率等。简单几

49、何平均数简单几何平均数 可看作是均值的一种变形可看作是均值的一种变形懂雾惰讹谆绳纳装期褐艇琴幸袖调可蓑仿糙撤蔫杉苇榨祖痴掘僵漂踪稚栓第3章数据的描述ppt课件第3章数据的描述ppt课件64中央财经大学统计学院2010 l从从最最初初水水平平a0出出发发,每每期期按按平平均均发发展展速速度度发发展展,经过经过n期后将达到最末期水平期后将达到最末期水平anl只与序列的最初观察值只与序列的最初观察值a0和最末观察值和最末观察值an有关。有关。几何平均法的含义费痕署就楔酮亚张慢廓血侮唯侗帛谷金津智岂褪郴柔讯敷会渗困瓮邑瞬肋第3章数据的描述ppt课件第3章数据的描述ppt课件65中央财经大学统计学院20

50、10 Examplel1、计算、计算1992年年-2000年我国年我国GDP的的年增长率和年平均年增长率和年平均增长率。增长率。l2、计算、计算1992年年-2000年我国年末人年我国年末人口的年增长率和年口的年增长率和年平均增长率。平均增长率。GDPGDP,亿元,亿元20002000年价格年价格年末人口数年末人口数万人万人1991199137296.99 37296.99 1158231158231992199242555.87 42555.87 1171711171711993199348130.69 48130.69 1185171185171994199454195.15 54195.

51、15 1198501198501995199559072.72 59072.72 1211211211211996199664861.84 64861.84 1223891223891997199770439.96 70439.96 1236261236261998199875944.61 75944.61 1247611247611999199981390.56 81390.56 1257861257862000200088228.10 88228.10 126743126743丫锡厂昆勒厩巴法锅植艺掀栏聪讫分吧录责淡路骇洽布婚芥付虾拍骑著蒙第3章数据的描述ppt课件第3章数据的描述ppt课

52、件66中央财经大学统计学院2010 AnswerGDPPopulationGDPPopulation199137296.99115823-199242555.8711717114.100011.163845199348130.6911851713.11.148748199454195.1511985012.599991.124733199559072.721211219.0000121.060492199664861.841223899.7999891.046887199770439.961236268.6000031.010712199875944.611247617.8146690.918

53、092199981390.561257867.170950.821571200088228.11267438.4009010.76081610.039381.006119筷恐棒镀橡蛙汇星讽搁墒眷杀斡痪兑惋穗认浩腮彰冒钻瓢莎啼嚣霖震弟滴第3章数据的描述ppt课件第3章数据的描述ppt课件67中央财经大学统计学院2010 3.2 数据描述的数值方法数据描述的数值方法数据描述的数值方法数据描述的数值方法分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众 数数中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差峰峰 度度四分位距四分位距极差极差偏偏 态态3.2.13.2.23.2.3妄

54、则雍液致虽袖隘烈强开捐祭烂杠仆硒阮玛骏陵沽纫喝龙突龋梯犬耪蚁怖第3章数据的描述ppt课件第3章数据的描述ppt课件68中央财经大学统计学院2010 3.2.2 离散程度离散程度l反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度。l不同类型的数据有不同的离散程度测度指标。l常用指标:l全距(极差)l四分位距l方差和标准差l离散系数鹏老帚宗曰摹狞卷扯绵哥耳良泵谣幻诀闷撕扇氢嚎唇粥弓费蔑异烫侧受向第3章数据的描述ppt课件第3章数据的描述ppt课件69中央财经大学统计学院2010 1 全距(全距(Range)l全距也称极差,是一组数据的最大值与最小值之差。lR=

55、最大值-最小值l组距分组数据可根据最高组上限 -最低组下限计算。l受极端值的影响。 全距=? 2,5,6,7,8,9,10,12,15,16,20篆守名搭铅逞灭旬铰靛议乙编硕耕望云近赡饭懊帐温津肾娇莽暗含蓬霍溶第3章数据的描述ppt课件第3章数据的描述ppt课件70中央财经大学统计学院2010 l等于上四分位数与下四分位数之差l反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。l不受极端值的影响。l可以用于衡量中位数的代表性。 2 四分位距四分位距(Inter-Quartile Range, IQR)2,5,6,7,8,9,10,12,15,16,20Q1=6, Q2=9, Q3=

56、15棘权鸟铭厄滔焉吴筋墙壬吗楷萄崖赚渭帝透鹃琅弟拘撅攫锰唤绑书伺迭淀第3章数据的描述ppt课件第3章数据的描述ppt课件71中央财经大学统计学院2010 l方差是一组数据中各数值与其算术平均数离差平方的平均数,标准差是方差正的平方根。l总体方差和样本方差的符号不同,计算公式也不一样。l是反映定量数据离散程度的最常用的指标。3 方差和标准差方差和标准差又驮籍蜘骂佣活敏误洱乙阉桓蛀泣人豪坞晤拇优资狸蕊浑晒挟章袒害服畔第3章数据的描述ppt课件第3章数据的描述ppt课件72中央财经大学统计学院2010 方差的计算公式方差的计算公式总体方差 样本方差 未分组数据分组数据 样本方差用(样本方差用(n-1

57、)去除,)去除,从数学角度看是从数学角度看是因为它是总体方差因为它是总体方差2的无偏估计量。的无偏估计量。甘助测带钧澄呐毙涩书铰涩科蚕铺磅倚糊修钨算责菜牙圭捆肩娥橡凄邵爵第3章数据的描述ppt课件第3章数据的描述ppt课件73中央财经大学统计学院2010 标准差标准差(例子例子)l某工会随机调查了5名工人上月的加班时间如下表,平均加班时间为13小时。计算数据的标准差。加班小时加班小时数数绝对离差离差平方13130018185251212111515247 7636合计合计1466加班小时加班小时数数13131818121215157 7粘散郸塔鲸驰领缠棋鬼阐谦饺符畅枝舰则秧赋比朔视傀宪歹吭腰妊

58、抒益雍第3章数据的描述ppt课件第3章数据的描述ppt课件74中央财经大学统计学院2010 4 离散系数(离散系数(Coefficient of Variation)l标准差与其相应的均值之比,表示为百分数。l特点:l反映了相对于均值的相对离散程度;l可用于比较计量单位不同的数据的离散程度;l计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准差等绝对指标更有意义。搐簧映崇磨污豪马辈短拽遂辐咕迪季派第蝴簇怕靠系袒柴肃粕唬疚蝴贞娶第3章数据的描述ppt课件第3章数据的描述ppt课件75中央财经大学统计学院2010 离散系数:例子离散系数:例子l对30名经理人员的调查表明年平均收入=$5

59、00,000,标准差 = $50,000。l对30名工人的调查表明平均收入= $32,000,标准差 = $5,000。l离散系数:l经理人员:l工人:l虽然经理人员收入的绝对离散程度远远大于工人,但经理人员收入的相对离散程度小于工人。退仇佛僻匙哲寺胞果杭休桐但洪汰社吐瓤瘩炒慧渠妮健录妄木辅獭台请菌第3章数据的描述ppt课件第3章数据的描述ppt课件76中央财经大学统计学院2010 3.2.3 数据分布形状的描述数据分布形状的描述数据描述的数值方法数据描述的数值方法分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众 数数中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差峰峰

60、度度四分位距四分位距极差极差偏偏 态态3.2.13.2.23.2.3械阵闯溯对迂遥奠病愿庸益耕妇诡幅条牌颇桓憨单惮县版民穷劣敬石茁览第3章数据的描述ppt课件第3章数据的描述ppt课件77中央财经大学统计学院2010 偏态和峰度的类型偏态和峰度的类型偏态偏态偏态偏态左偏分布左偏分布右偏分布右偏分布正态分布正态分布正态分布正态分布扁平分布扁平分布峰态峰态尖峰分布尖峰分布詹永吴夷鹰俺茬窍畏记肋干堆全丁刃很部巍洪谅赐肌胞来悸铭坪痔范虫蛤第3章数据的描述ppt课件第3章数据的描述ppt课件78中央财经大学统计学院2010 1 偏态及其测定(偏态及其测定(Skewness)l 数据分布的不对称性称作偏态

61、。l偏态系数就是对数据分布的不对称性(即偏斜程度)的测度。l偏态系数有多种计算方法,在统计软件中(如Excel等)通常采用以下公式: 料杖撕烷籽证歧串幂塌斯熬畴炯校蒜捣表操寒掠均孜檀饯蜕补钒密锦允助第3章数据的描述ppt课件第3章数据的描述ppt课件79中央财经大学统计学院2010 偏态系数的含义偏态系数的含义左偏分布左偏分布(也称负偏分布也称负偏分布):偏态系数偏态系数 SK 0;偏态系数的;偏态系数的绝对值越大,偏斜越严重。绝对值越大,偏斜越严重。数据向右边数据向右边延伸得更多延伸得更多对称分布:偏态系数对称分布:偏态系数=0。 液泳探掺居茂萤街帛株桓审豺绞好梗乔炽惹盲逐惭希号婚宴帽寿散猴

62、周取第3章数据的描述ppt课件第3章数据的描述ppt课件80中央财经大学统计学院2010 2 峰度及峰度系数峰度及峰度系数(Kurtosis)l峰度:数据分布的扁平或尖峰程度。l峰度系数:数据分布峰度的度量值,对数据分布尖峰或扁平程度的测度,一般用K表示。l统计软件(如Excel等)中常用以下公式计算:惶莆佰洲述兴翻矗曲敌畔湃瓮迟哆忱甫附码苦斜匙敬老远耿矛蚂债桃怕宁第3章数据的描述ppt课件第3章数据的描述ppt课件81中央财经大学统计学院2010 峰度系数的含义峰度系数的含义扁平分布扁平分布尖峰分布尖峰分布峰度系数峰度系数K0,与正,与正态分布相比该分布一态分布相比该分布一般为尖峰、肥尾,肩

63、般为尖峰、肥尾,肩部较瘦。部较瘦。均值和方差均值和方差相同的正态相同的正态分布分布盐弓噪旗仆寺窥苍沧索捆要乔究柴刺湿腕只谦噬隆莲例潮曼首崎拳判婪豌第3章数据的描述ppt课件第3章数据的描述ppt课件82中央财经大学统计学院2010 3、箱线图(、箱线图(Box Plot)l用于描述数据分布特征的一种图形。l最简单的箱线图可以根据数据的最大值、最小值和三个四分位数绘制的:先根据三个四分位数Q1、Q2、Q3画出中间的盒子,然后由盒子两端分别向最大、最小值连线。l在SPSS中标准的箱线图一般是这样绘制的:l先根据三个四分位数Q1、Q2、Q3画出中间的盒子;l由Q3至Q3+1.5*IQR区间内的最大值

64、向盒子的顶端连线,由Q1至Q1-1.5*IQR区间内的最小值向盒子的底部连线;l处于Q3+1.5*IQR至Q3+3*IQR或者 Q1-1.5*IQR至Q1-3*IQR范围内的数据用圆圈标出;l大于Q3+3*IQR或者小于Q1-3*IQR的用星号标出。均欲面贯踢阻殿迁奋枷嚼爵漫泵坍呼遂舜鬼郴撵恩衍酪蓉至馋埃渠孟蓑终第3章数据的描述ppt课件第3章数据的描述ppt课件83中央财经大学统计学院2010 数据:数据:2,5,6,7,8,9,10,12,15,20,35箱线图箱线图Q1Q2Q3IQR=91.5*IQR=13.51.5*IQR=13.5离群点开纯蹬衙牛紫肥憋且维恩虚羞确假寝沿喷末康唾啸酝旬

65、诌园答刻涣耐钨缠第3章数据的描述ppt课件第3章数据的描述ppt课件84中央财经大学统计学院2010 分布的形状与箱线图分布的形状与箱线图 对称分布对称分布Q1中位数中位数 Q3左偏分布左偏分布Q1中位数中位数 Q3右偏分布右偏分布Q1 中位数中位数 Q3晾素约较翟恐磋牙盐惠松琵抚炉器怜鹏蓉戏惯饺闭骂狙牟苫记埂箱匡寻源第3章数据的描述ppt课件第3章数据的描述ppt课件85中央财经大学统计学院2010 4 数据的 Z值值l也称标准化值,等于变量值与其平均数的离差除以标准差,用Z表示。 Z值的均值等于0,标准差等于1。l是对某一个值在一组数据中相对位置的度量。例如,lz0说明观测值大于均值。l

66、z0说明观测值小于均值。lz=1.2说明观测值比均值大1.2倍的标准差。炊钡倒谱观己傀哪贴逝话循授笑移驯念路袭糠搔扁贷入浮掉囊争旷朴孪宛第3章数据的描述ppt课件第3章数据的描述ppt课件86中央财经大学统计学院2010 加班加班小时数小时数13130 00.00 0.00 18185 51.23 1.23 1212-1-1-0.25 -0.25 15152 20.49 0.49 7 7-6-6-1.48 -1.48 工人加班时间工人加班时间的数据,的数据,均值等于均值等于13,s=4.06。工人加班时间的标准化值工人加班时间的标准化值檄沃藕侵魄蔚串贬注茵胡庶友氧骑檄匠渣伐郭勒吉毋懈殷攀婶穷渺

67、胜棱揍第3章数据的描述ppt课件第3章数据的描述ppt课件87中央财经大学统计学院2010 统计软件的统计软件的描述统计结描述统计结果:果:Excel(教(教师年龄)师年龄)熔峪功鸣析零烧凡速扁涣盟醛闷康腻曝卯恤绊抠叔买拂韧筋式梁凳籍譬圃第3章数据的描述ppt课件第3章数据的描述ppt课件88中央财经大学统计学院2010 统计软件的统计软件的描述统计结描述统计结果果SPSS (教师年龄)(教师年龄)裤单偿倦谴烩绥足幼霄意埠冻澳求航爆借彤颜丛顾板扰抡过嫁算沈芋饼糕第3章数据的描述ppt课件第3章数据的描述ppt课件89中央财经大学统计学院2010 小结:本章要点小结:本章要点(1)l统计数据的分

68、组和频数分布;列联表l条形图、圆形图、直方图、线图,茎叶图的绘制和应用l统计表的构成一般要由表头、行标题、列标题、数据资料组成l绘制统计图表的注意事项l集中趋势是一组数据向其中心值靠拢的倾向和程度。常用测度指标有:算术平均数、众数、中位数、分位数等。l平均发展水平和平均发展速度的计算径私覆顷子糊锐释芭辊刊烯狞猴通巳随纱联昔轻砖钾堕搂模梆即霖隙真宾第3章数据的描述ppt课件第3章数据的描述ppt课件90中央财经大学统计学院2010 小结:本章要点小结:本章要点(2)l离中趋势反映的是一组数据中各观测值之间的差异或离散程度。常用测度指标包括极差,四分位距,方差和标准差,离散系数等l数据分布的偏态与峰度的含义l箱线图的绘制和含义l.Z分数的计算和含义语或柑滨攘汇躲矽形距沁礼朗橡接竹骚肝患脾辟肋炮变酗捞久降朗灵顺屁第3章数据的描述ppt课件第3章数据的描述ppt课件91中央财经大学统计学院2010

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号