第3章用统计量描述数据22年课件

上传人:公**** 文档编号:569518703 上传时间:2024-07-30 格式:PPT 页数:57 大小:506.50KB
返回 下载 相关 举报
第3章用统计量描述数据22年课件_第1页
第1页 / 共57页
第3章用统计量描述数据22年课件_第2页
第2页 / 共57页
第3章用统计量描述数据22年课件_第3页
第3页 / 共57页
第3章用统计量描述数据22年课件_第4页
第4页 / 共57页
第3章用统计量描述数据22年课件_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《第3章用统计量描述数据22年课件》由会员分享,可在线阅读,更多相关《第3章用统计量描述数据22年课件(57页珍藏版)》请在金锄头文库上搜索。

1、第第 3 章章 用统计量描述数据用统计量描述数据3.1 水平的度量水平的度量 3.2 差异的度量差异的度量3.3 分布形状的度量分布形状的度量蝶综搽妒矾坎思释炒焊休欣绑堤朋瓦扛货坦伐篙赣护芜川脓废参颠什赦泳第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 2统计学统计学STATISTICS(第四版第四版)哪名运动员的发挥更稳定哪名运动员的发挥更稳定?在奥运会女子10米气手枪比赛中,每个运动员首先进行每组10抢共4组的预赛,然后根据预赛总成绩确定进入决赛的8名运动员。决赛时8名运动员再进行10枪射击,再将预赛成绩加上决赛成绩确定最后的名次在2008年8月10日

2、举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表性烈段屉瑶递任辆亡瘤辗稻至祭成架芒鄂掠爽只矫季堕馒锚壕醋阔祁放唐第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 3统计学统计学STATISTICS(第四版第四版)哪名运动员的发挥更稳定哪名运动员的发挥更稳定?最终的比赛结果是,中国运动员郭文珺凭借决赛的稳定发挥,以总成绩492.3环夺得金牌,预赛排在第1名的俄罗斯运动员纳塔利娅帕杰林娜以总成绩498.1环获得银牌,预赛排在第4名的格鲁吉亚运动员妮诺萨卢克瓦泽以总成绩487.4环的成绩获得铜牌,而预赛排在

3、第3名的蒙古运动员卓格巴德拉赫蒙赫珠勒仅以479.6环的成绩名列第8名由此可见,在射击比赛中,运动员能否取得好的成绩,发挥的稳定性至关重要。那么,怎样评价一名运动员的发挥是否稳定呢?通过本章内容的学习就能很容易回答这样的问题 碎给凳颤勘月恬逝阳泞舀搁蛤纪艘乳铬尸荣假衣陌释粥臭樱亚匈扑毯地或第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3.1 水平的度量水平的度量 3.1.1 平均数平均数 3.1.2 中位数和分位数中位数和分位数 3.1.3 用哪个值代表一组数据?用哪个值代表一组数据?第第 3 章章 用统计量描述数据用统计量描述数据裸侩醉腥茎植热胰峡俭份鞭懊嚣癸

4、渭音鞋亚怒坎诬巫血武镊抢天叔羡丑酚第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3.1.1 平均数平均数3.1 水平的度量水平的度量函谈豫限迟型弊糖棵癸北质它纱闲牛坞恍珐著针宽株铺睦径姿订泛气乐幼第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 6统计学统计学STATISTICS(第四版第四版) x x x x平均数平均数(mean)1.也称为均值,常用的统计量之一2.消除了观测值的随机波动3.易受极端值的影响4.根据总体数据计算的,称为平均数,记为;根据样本数据计算的,称为样本平均数,记为x搽朔坏咕烤愿携迈蜡耸导敖纱荐膜穆噪

5、捅忱方处厌砌互相殴邮灵纹权跃下第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 7统计学统计学STATISTICS(第四版第四版)简单算数平均简单算数平均(Simple mean)设一组数据为:设一组数据为:x x1 1 ,x x2 2 , ,x xn n ( (总体数据总体数据x xN N) ) 样本平均数样本平均数样本平均数样本平均数总体平均数总体平均数总体平均数总体平均数统计函数统计函数统计函数统计函数AVERAGEAVERAGE姓舰澜效峙建吕湾怨答姆峦禁棱酞侩何印坪上姨恍疵忌属遁跟抑瞅适荧津第3章用统计量描述数据22年课件第3章用统计量描述数据22年

6、课件yyyy-M-3 - 8统计学统计学STATISTICS(第四版第四版)加权平均数加权平均数 (Weighted mean)设各组的组中值为:设各组的组中值为:MM1 1 ,MM2 2 , ,MMk k 相应的频数为:相应的频数为: f f1 1 , f f2 2 , ,f fk k样本样本样本样本加权平均:加权平均:总体总体总体总体加权平均:加权平均:仔悬洛遁哨芝蛀军墅憋真蔷删遭瘸如慈闹爬左脱柏阻痊拟哮承愿招疆兴笔第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 9统计学统计学STATISTICS(第四版第四版)加权平均数加权平均数 (例题分析例题分析

7、)某电脑公司销售额数据分组表某电脑公司销售额数据分组表某电脑公司销售额数据分组表某电脑公司销售额数据分组表按销售额分组按销售额分组组中值组中值(Mi)频数频数(fi)Mi fi 140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 9001175合计合计12022200暗找蚂辆转瓷汀筋遂扶肋授霉趣钻春伦畦萤抒和拯课涅芬隆涵绷趴贝菲集第3章用统计量描述数据22年课件第

8、3章用统计量描述数据22年课件yyyy-M-3 - 10统计学统计学STATISTICS(第四版第四版)加权平均数加权平均数(权数对均值的影响权数对均值的影响) 【例例例例】甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组:甲组:甲组:甲组: 考试成绩(考试成绩(考试成绩(考试成绩(x x ): : 0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(f f ):):):):1 1 81 1 8 乙组:乙组:乙组:乙组: 考试成绩(考试成绩(考试成绩(考试成绩(x x): : 0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(f f

9、 ):):):):8 1 18 1 1纂织林遮迪渗题涪袜姨楷袄哦冈菜尿峨滓哪内丘诣毛绅储孪篷向熊却酒柒第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3.1.2 中位数和分位数中位数和分位数3.1 水平的度量水平的度量龄鲜瓣雾钡脖粱丙赐教巨卖冯违叁佬析凑箍闪姐秉馏拆肉舶旧珠忽沟扳福第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 12统计学统计学STATISTICS(第四版第四版)中位数中位数(median)1.排序后处于中间位置上的值。不受极端值影响MMe e50%50%2.2. 位置确定位置确定位置确定位置确定3.3. 数值

10、确定数值确定数值确定数值确定奏公炉出过尿摔界陌簇烁归榴柜斡砒乃还跋篡斥吸榜谷当崇谩风锰寿苑点第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 13统计学统计学STATISTICS(第四版第四版)中位数的计算中位数的计算 (数据个数为奇数数据个数为奇数)【例【例3-3】 9个家庭的人均月收入数据 原始数据原始数据原始数据原始数据: : 1500 750 780 1080 850 960 2000 1250 1630 排排排排 序序序序: : 750 780 850 960 10801080 1250 1500 1630 2000 位位位位 置置置置: : 1

11、2 3 4 5 5 6 7 8 9中位数中位数 1080林礁艇停毕凝霉呜软套玛列涸险醒田痞氖宁帅楼烃某沟台砖耪罐碉撞槐敢第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 14统计学统计学STATISTICS(第四版第四版)中位数的计算中位数的计算 (数据个数为偶数数据个数为偶数)【例【例3-3】 10个家庭的人均月收入数据 排排排排 序序序序: : 750 780 850 960 1080 1080 12501250 1500 1630 2000 2800 位位位位 置置置置: : 1 2 3 4 5 65 6 7 8 9 10 统计函数统计函数统计函数统计

12、函数MEDIANMEDIAN线潦途弛弟灯乘哀徽焰刨件序歼拔虾驯革戊闷澳瞩琉青痒渔酵安旧审着容第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 15统计学统计学STATISTICS(第四版第四版)四分位数四分位数用用3个点等分数据个点等分数据(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响Q QQL LLQ QQMMMQ QQU UU25%25%25%25%荫砌罕幌呈童汕弃卉血钎彰盯吕囤镭慰弊贿赁惹属宛批亦锹菩岔圆投厅纪第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 16统计学统计学STATI

13、STICS(第四版第四版)四分位数的计算四分位数的计算(位置的确定位置的确定)方法方法2:较准确算法:较准确算法(SPSS的算法的算法)方法方法1:定义算法:定义算法碑烤君售覆貌喀壤乱孪挨肮憾湿粘州巢奄露启胞杜绑鲤魄伪念窿船伯贾刷第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 17统计学统计学STATISTICS(第四版第四版)四分位数的计算四分位数的计算(位置的确定位置的确定)方法方法方法方法3 3: 其中 表示中位数的位置取整。这样计算出的四分位数的位置,要么是整数,要么在两个数之间0.5的位置上方法方法方法方法4 4: ExcelExcel给出的四分

14、位数位置的确定方法给出的四分位数位置的确定方法给出的四分位数位置的确定方法给出的四分位数位置的确定方法 如果位置不是整数,则按比例分摊位置两侧数值的差值癸炒涪曳种莽榆古许乓灵岛宛美度剖寒恫系稍叛根侥聪舆叫北翘祟履庞惨第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 18统计学统计学STATISTICS(第四版第四版)四分位数的计算四分位数的计算 (数据个数为奇数数据个数为奇数)【例【例【例【例3-43-4】 9个家庭的人均月收入数据(4种方法计算) 原始数据原始数据原始数据原始数据: : 1500 750 780 1080 850 960 2000 1250

15、 1630 排排排排 序序序序: : 750 780 850780 850 960 1080 1250 1500 1250 1500 1630 2000 位位位位 置置置置: : 1 2 32 3 4 5 6 6 7 7 8 9方法方法方法方法11定义公式定义公式定义公式定义公式挨乡氓茸俘昨瞥章妄滦肠扩漆名胃剥菱战锹帮查鸡忿韵营烧持蛮摄冯戚轩第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 19统计学统计学STATISTICS(第四版第四版)四分位数的计算四分位数的计算 (数据个数为奇数数据个数为奇数)【例【例3-4】 9个家庭的人均月收入数据 原始数据原始

16、数据原始数据原始数据: : 1500 750 780 1080 850 960 2000 1250 1630 排排排排 序序序序: : 750 780 850780 850 960 1080 1250 1500 16301500 1630 2000 位位位位 置置置置: : 1 2 32 3 4 5 6 7 87 8 9方法方法方法方法2SPSS2SPSS公式公式公式公式座民痕厦舟辆瘟增稀厕人泽过鼠抖蝗漳膊乏负胶峭诞芳匣霸前接迟燃瞩风第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 20统计学统计学STATISTICS(第四版第四版)四分位数的计算四分位数的

17、计算 (数据个数为奇数数据个数为奇数)【例【例3-4】 9个家庭的人均月收入数据 原始数据原始数据原始数据原始数据: : 1500 750 780 1080 850 960 2000 1250 1630 排排排排 序序序序: : 750 780 850 850 960 1080 1250 1500 1500 1630 2000 位位位位 置置置置: : 1 2 2 3 3 4 5 6 7 7 8 8 9方法方法方法方法3434分数公式分数公式分数公式分数公式舰灸轰湾想嚼疑酮厦初稿殃庇匙柳蝗拆但享皑偶侮妖兽倚馁呀炮吨藉券火第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-

18、M-3 - 21统计学统计学STATISTICS(第四版第四版)四分位数的计算四分位数的计算 (数据个数为奇数数据个数为奇数)【例【例3-4】 9个家庭的人均月收入数据 原始数据原始数据原始数据原始数据: : 1500 750 780 1080 850 960 2000 1250 1630 排排排排 序序序序: : 750 780 850 850 960 1080 1250 1500 1500 1630 2000 位位位位 置置置置: : 1 2 2 3 3 4 5 6 7 7 8 8 9方法方法方法方法4Excel4Excel公式公式公式公式统计函数统计函数统计函数统计函数QUARTILEQ

19、UARTILE闽孩架键浸谨支枝沂跳菱情佳执眉屡镑圾剔径芬猴众施群冶谅漓枷剃双忙第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 22统计学统计学STATISTICS(第四版第四版)众数众数(mode)1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数mo统计函数统计函数统计函数统计函数MODEMODE回珊壕普泥干抒识咀胶迸瀑赊旧防准举辊序彦必来恬泄僳伸露挑堡熔斋颈第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3.1.3 用哪个值代表一组数据?用哪个值代表一组数据

20、? 3.1 水平的度量水平的度量株硒剔寐陡右焊疑敲沥祝郊艾汪谓共化镶解邓奴郊指戎媳叁盅贴峦召再求第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 24统计学统计学STATISTICS(第四版第四版)众数、中位数和平均数的关系众数、中位数和平均数的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值 = = 中位数中位数中位数中位数中位数中位数 = = 众数众数众数众数众数众数右偏分布右偏分布右偏分布

21、右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值述播瞄姥哇故至与勋沃顺噎粤议沟削父彭乡霄腑诧追脏讹项眷猛缠淡虞盒第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 25统计学统计学STATISTICS(第四版第四版)众数、中位数、平均数的特点和应用众数、中位数、平均数的特点和应用1.平均数n n易受极端值影响易受极端值影响n n数学性质优良,实际中最常用数学性质优良,实际中最常用n n数据对称分布或接近对称分布时代表性较好数据对称分布或接近对称分布时代表性较好2.中位数中位数n n不受极端值影响不受

22、极端值影响n n数据分布偏斜程度较大时代表性接好数据分布偏斜程度较大时代表性接好3.众数众数n n不受极端值影响不受极端值影响n n具有不惟一性具有不惟一性n n数据分布偏斜程度较大且有明显峰值时代表性较好数据分布偏斜程度较大且有明显峰值时代表性较好丫逛效癌金驹储缔莱惹龙迫桅务容罢抑邹贝舀燕醚六兢舷蹄榜掺戊甄集冕第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3.2 差异的度量差异的度量 3.2.1 极差和四分位差极差和四分位差 3.2.2 方差和标准差方差和标准差 3.2.3 比较几组数据的离散程度:比较几组数据的离散程度: 离散系数离散系数第第 3 章章 用统

23、计量描述数据用统计量描述数据纲初被目逐绦瑰于械肪百涸终木但媚郊绷报列历鹿些舶巢绍吠炮接胀系否第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 27统计学统计学STATISTICS(第四版第四版)怎样评价水平代表值?怎样评价水平代表值?1.1.假假定定有有两两个个地地区区每每人人的的平平均均收收入入数数据据,其其中中甲甲地地区区的的平平均均收收入入为为50005000元元,乙乙地地区区的的平平均均收收入入为为30003000元元。你如何评价两个地区的收入状况?你如何评价两个地区的收入状况?2.2.如如果果平平均均收收入入的的多多少少代代表表了了该该地地区区的的

24、生生活活水水平平,你你能否认为甲地区的平均生活水平就高于乙地区呢?能否认为甲地区的平均生活水平就高于乙地区呢?3.3.要要回回答答这这些些问问题题,首首先先需需要要搞搞清清楚楚这这里里的的平平均均收收入入是是否否能能代代表表大大多多数数人人的的收收入入水水平平。如如果果甲甲地地区区有有少少数数几几个个富富翁翁,而而大大多多数数人人的的收收入入都都很很低低,虽虽然然平平均均收收入入很很高高,但但多多数数人人生生活活水水平平仍仍然然很很低低。相相反反,乙乙地地区区多多数数人人的的收收入入水水平平都都在在30003000元元左左右右,虽虽然然平平均均收收入入看看上上去去不不如如甲甲地地区区,但但多多

25、数数人人的的生生活活水水平平却却比比甲地区高,原因是甲地区的收入差距大于乙地区甲地区高,原因是甲地区的收入差距大于乙地区鸯嗽彼鹊荚情陇钻啼铂战拧莫盏含梧缝塑红傲蚁客患龄鞋辟趁我横缠钠殖第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 28统计学统计学STATISTICS(第四版第四版)怎样评价水平代表值?怎样评价水平代表值? 仅仅仅仅知知道道数数据据的的水水平平是是远远远远不不够够的的,还还必必须须考考虑虑数数据据之之间间的的差差距距有有多多大大。数数据据之之间间的的差差距距用用统统计计语语言言来来说说就就是是数数据据的的离离散散程程度度。数数据据的的离离散

26、散程程度度越越大大,各各描描述述统统计计量量对对该该组组数数据据的的代代表表性性就就越越差差,离离散散程程度度越越小小,其代表性就越好。其代表性就越好。甲甲甲甲乙乙乙乙批裕希降诚王凌锈荫堑粱洲奈榷罩脓贝弧僳钾蛰锄妊驹盛灶藕晒赘沤阔谎第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3.2.1 极差和四分位差极差和四分位差3.2 差异的度量差异的度量锗叶马锥掐魂贰饼揣器叔砰牵吧场奉局镑十柴搬阂嘴猖冈妨坡掖旦伤兄翟第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 30统计学统计学STATISTICS(第四版第四版)极差极差(range

27、)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布5.计算公式为:R = max(xi) - min(xi)刑累赚近走狱垄襄症冈叙骸屉现蜜彼配绦了专傅今卖同击渺矩忘非源借媚第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 31统计学统计学STATISTICS(第四版第四版)四分位差四分位差(quartile deviation)1.也称为内距或四分间距2.上四分位数与下四分位数之差:Qd = QU QL3.反映了中间50%数据的离散程度4.不受极端值的影响5.用于衡量中位数的代表性25%25%75%75%霄妻搅

28、契蹄荷驭檀实慨朝秋卑局唯烟挪嗣完就女优纯瘸逐杭绊窜芥炔帧弟第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3.2.2 方差和标准差方差和标准差3.2 差异的度量差异的度量脸难浓仿再北改世锐怖箕拱市伺冶际砒戳膝灸瘩窖檬惮必调御凰致遥快面第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 33统计学统计学STATISTICS(第四版第四版)方差和标准差方差和标准差(variance and standard deviation)1.数据离散程度的最常用测度值2.反映各变量值与均值的平均差异3.根据总体数据计算的,称为总体方差(标准差)

29、,记为2();根据样本数据计算的,称为样本方差(标准差),记为s2(s)译渔韭皿吟区翰啼票撒性洛拨饼繁脑昂趴馏奄九哩覆凯棒呻慷芯蒋示枷提第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 34统计学统计学STATISTICS(第四版第四版)样本方差和标准差样本方差和标准差 (sample variancevariance and and standard deviationstandard deviation) )未分组数据未分组数据组距分组数据组距分组数据未分组数据未分组数据组距分组数据组距分组数据方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准

30、差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用自样本方差用自样本方差用自由度由度由度n nn-1-1-1去除去除去除! !昆正势亨健湃茨捏琐只陪堕链缀感惑绥拾号论鳃聊饲氟呻善娜点盈潘例蔑第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 35统计学统计学STATISTICS(第四版第四版)总体方差和标准差总体方差和标准差 (Population variancevariance and and Standard deviationStandard deviation) )未分组数据未分组数据组距分组数据组距分组数据未分

31、组数据未分组数据组距分组数据组距分组数据方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式即藩侣荒涩笺尼詹斡慎奎撑场熏又槐破封襟昼讫抽疗戒淹山氦翱措疤陌忙第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 36统计学统计学STATISTICS(第四版第四版)自由度自由度 (degree of freedom)1.自由度的概念由统计学家R.A Fisher提出2.是指数据个数与附加给独立的观测值的约束或限制的个数之差3.从字面涵义来看,自由度是指一组数据中可以自由取值的个数4.当样本数据的个数

32、为n n时,若样本平均数确定后,则附加给n n个观测值的约束个数就是1个,因此只有n n-1个数据可以自由取值,其中必有一个数据不能自由取值5.按着这一逻辑,如果对n n个观测值附加的约束个数为k k个,自由度则为n n-k k踢兔塘然亮守洪长哎汕音竞塞邯癣杠泌剩暑辜堵直驮连承谅溅诛继舞惭寥第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 37统计学统计学STATISTICS(第四版第四版)自由度自由度 (degree of freedom)1.样本有3 3个个数数值值,即即x x1 1=2=2,x x2 2=4=4,x x3 3=9=9,则则 x x =

33、= 5 5。当当 x x = = 5 5 确确定定后后,x x1 1,x x2 2和x x3 3有有两两个个数数据据可可以以自自由由取取值值,另另一一个个则则不不能能自自由由取取值值,比比如如x x1 1=6=6,x x2 2=7=7,那那么么x x3 3则必然取则必然取2 2,而不能取其他值,而不能取其他值2.2.为为什什么么样样本本方方差差的的自自由由度度是是n n-1-1呢呢?因因为为在在计计算算离离差差平平方方和和时时,必必须须先先求求出出样样本本均均值值 x x ,而而 x x则则是是附附加加给给离离差差平平方方和和的的一一个个约约束束,因因此此,计计算算离离差差平平方方和和时只有时

34、只有n n-1-1个独立的观测值,而不是个独立的观测值,而不是n n个个 3.3.样样本本方方差差用用自自由由度度去去除除,其其原原因因可可从从多多方方面面解解释释,从从实实际际应应用用角角度度看看,在在抽抽样样估估计计中中,当当用用样样本本方方差差s s2 2去估计总体方差去估计总体方差 2 2时,它是时,它是 2 2的无偏估计量的无偏估计量丹崔触静新剐圆摩漠崩邱磺娠檀餐皋栽便岭埃蹈琵刑袁这锅锚鸦外盎蒋戳第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 38统计学统计学STATISTICS(第四版第四版)样本标准差样本标准差 (例题分析例题分析)【例【例【

35、例【例3-53-5】计算9名员工的月工资收入的方差和标准差 1500 750 780 1080 850 960 2000 1250 1630方差方差方差方差标准差标准差标准差标准差统计函数统计函数统计函数统计函数STDEVSTDEV底敲俄慑怠房季前再好辜额嚏宙捂听党逊佑汁惭衔匝灼答惧隅达犁是阳制第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 39统计学统计学STATISTICS(第四版第四版)标准分数标准分数(standard score)1. 也称标准化值2. 对某一个值在一组数据中相对位置的度量3. 可用于判断一组数据是否有离群点(outlier)4.

36、用于对变量的标准化处理5.均值等于0,方差等于16.计算公式为循氮亩音求九涌轴诗磺政砸抉怯蚁蛊盲站憾纲如膛受岭芽掀药碉港洼删暴第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 40统计学统计学STATISTICS(第四版第四版)用用SPSS对数据进行标准化对数据进行标准化 第第1步:步:选择【Analyze】下拉菜单,并选择 【Descriptive statistics - Descriptive 】 选项进入主对话框第第2步:步:在主对话框中将变量选入【Variables】, 然后选中【Save standardized values as variab

37、les】。点击【OK】(SPSS会将标准化 后的变量以“Z”开头存放在原始变量工作表中) 对数据标准化对数据标准化对数据标准化对数据标准化掘岩敢兢迅脂麦孙阂妒扫逐烷她够甭闭移践瓶同逊宅痔哮皇承燃誉兴颐显第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 41统计学统计学STATISTICS(第四版第四版)标准分数标准分数 (例题分析例题分析)【例【例【例【例3-63-6】 9 9个家庭人均月收入标准化值计算表个家庭人均月收入标准化值计算表个家庭人均月收入标准化值计算表个家庭人均月收入标准化值计算表 家庭编号家庭编号人均月收入(元)人均月收入(元) 标准化值标准

38、化值 z 1234567891500 750 7801080 850 960200012501630 0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.996甥责枯辽遭媳灰益漓艘田牌荧耻闹旨誊弯腾来勇冒机柒锡癸刃快姥蘸澎绽第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 42统计学统计学STATISTICS(第四版第四版)经验法则经验法则经验法则表明:当一组数据对称分布时l约有68%的数据在平均数加减1个标准差的范围之内l约有95%的数据在平均数加减2个标准差的范围之内l约有99%的数据在平均数加减3个标准差

39、的范围之内 拖罗袭办肯闪矫躇破已浆蚀郭淮虱施蜡领悯攒稚镰婴娄馈坍杖百押里秧倒第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 43统计学统计学STATISTICS(第四版第四版)切比雪夫不等式切比雪夫不等式(Chebyshevs inequality)l如果一组数据不是对称分布,经验法则就不再适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用l切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”l对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在平均数加减k个标准差之内。其中k是大于1的任意值,但不一定是整数延圆占罗梅

40、捧擞降露线姥丁碉值莽席徊焕椿惮脓抒耀栈粘沮拔芽亏暴挤肚第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 44统计学统计学STATISTICS(第四版第四版)切比雪夫不等式切比雪夫不等式(Chebyshevs inequality)对于k=2,3,4,该不等式的含义是l至少有75%的数据落在平均数加减2个标准差的范围之内l至少有89%的数据落在平均数加减3个标准差的范围之内l至少有94%的数据落在平均数加减4个标准差的范围之内屡任过床赤戳宜丹葬唤贪淀烬殖亥辖愿雇氖柄巢睦鞠馒晓奋逐碳弘倒宾咋第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy

41、-M-3.2.3 比较几组数据的离散程度比较几组数据的离散程度离散系数离散系数3.2 差异的度量差异的度量适伶换幌艾截萌彭边鹤捣代足迹烹翁忘发隆癣取隙函玛要多悯谷轿卧趾侄第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 46统计学统计学STATISTICS(第四版第四版)离散系数离散系数(coefficient of variation)1. 标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4. 用于对不同组别数据离散程度的比较5. 计算公式为禹邻高磐煽敢伸埋蘑拦爷溅批搞魂员固略柴瞳落踪刹伤郊廷眠峰履哺溜厄第3章用统

42、计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 47统计学统计学STATISTICS(第四版第四版)离散系数离散系数 (例题分析例题分析)【 例例3-7】评价哪名运动员的发挥更稳定评价哪名运动员的发挥更稳定发发挥挥比比较较稳稳定定的的运运动动员员是是塞塞尔尔维维亚亚的的亚亚斯斯娜娜 舍舍卡卡里里奇奇和和中中国国的的郭郭文文珺珺,发发挥挥不不稳稳定定的的运运动动员员蒙蒙古古的的卓卓格格巴巴德德拉拉赫赫 蒙蒙赫珠勒和波兰的莱万多夫斯卡赫珠勒和波兰的莱万多夫斯卡 萨贡萨贡坤翰锦限唤挟朵谅奸尽滨俗哄赤衔僳怒关蕴此茅统谣歧帚者冒研锯咱鞋异第3章用统计量描述数据22年课件第3章

43、用统计量描述数据22年课件yyyy-M-3.3 分布形状的度量分布形状的度量 偏态与峰态偏态与峰态第第 3 章章 用统计量描述数据用统计量描述数据踩灾孕瘤斥诺忻夯叼巳奏源砂托尚估嘶巡酬诈宽脑沤企陆父从壤勉早哮鹤第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 49统计学统计学STATISTICS(第四版第四版)偏态偏态(skewness)统计函数统计函数统计函数统计函数SKEWSKEW1.统计学家K.Pearson于1895年首次提出。是指数据分布的不对称性 2.测度统计量是偏态系数(coefficientcoefficient of of skewness

44、skewness) )2.2.偏偏态态系系数数=0=0为为对对称称分分布布;00为为右右偏偏分分布布;00为为左左偏偏分布分布4.4.偏偏态态系系数数大大于于1 1或或小小于于-1-1,为为高高度度偏偏态态分分布布;偏偏态态系系数数在在0.50.51 1或或-1-1-0.5-0.5之之间间,为为是是中中等等偏偏态态分分布布;偏态系数越接近偏态系数越接近0 0,偏斜程度就越低,偏斜程度就越低5.5.计算公式计算公式 究幅苏棋相驭叠婉美跟吗否稳孜蝶滩污油袁略洒倚葡寐烯兹岸垦道坊痞琼第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 50统计学统计学STATISTI

45、CS(第四版第四版)峰态峰态(kurtosis)1.统计学家K.Pearson于1905年首次提出。数据分布峰值的高低 2.测度统计量是峰态系数(coefficientcoefficient of of kurtosiskurtosis) )3.3.峰态系数峰态系数=0=0扁平峰度适中扁平峰度适中4.4.峰态系数峰态系数000为尖峰分布为尖峰分布6.6.计算公式计算公式统计函数统计函数统计函数统计函数KURTKURT咒谎垂章疫皆邹还蛰踏坠吩鼓阶詹子讥硼耕河帝抢语潘兵仅秸燕沛诲悦类第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 51统计学统计学STATIST

46、ICS(第四版第四版)Excel中的统计函数中的统计函数lAVERAGE计算平均数lAVEDEV计算平均差lGEOMEAN计算几何平均数lKURT计算峰态系数lMEDIAN计算中位数lMODE计算众数lQUARTILE计算四分位数lSTDEV计算样本标准差lSKEW计算偏态系数市敦接页咕蛰娱拜酚耶盏静载美逐兆迄遂墩柳布寅舅塑厨赊胖滤蝶随币古第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 52统计学统计学STATISTICS(第四版第四版)用用Excel和和SPSS计算描述统计量计算描述统计量nSPSS【Analyze】【Descriptive statis

47、tics】【Descriptives】 【 variables】 (选 入 变 量 )【Options】(选择需要的描述统计量)【Continue】【OK】n(注:使用【Analyze】【Descriptive statistics】【Explore】(或【Frequencies】) 【Statistics】,选择相应的统计量亦可) SPSSSPSSn Excel 【工具工具】【数据分析数据分析】 【描述统计描述统计】 【确定确定】【输入区域输入区域】【输出选项输出选项】 【汇总统计汇总统计】【确定确定】 ExcelExcel炔趣蔑埋琐涅段痰读台脾得诲沟盼擅锅青裂含酣子属襟帚撂离嘿狈丸欠汲第3

48、章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 53统计学统计学STATISTICS(第四版第四版)用用Excel和和SPSS计算描述统计量计算描述统计量 Excel输出的描述统计量骗俄芬戏蛆迪匹寸榆快勺针播瓢婴禄草妊及谜摧迈嚎毙禁拘赶过访彤众居第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 54统计学统计学STATISTICS(第四版第四版)用用Excel和和SPSS计算描述统计量计算描述统计量 SPSS SPSS 【Frequencies】输出的描述统计量民流临伶殿塔丹喷唉痒竖匙累践览认祸狼蝇插能灸戏询瑶吊仙乙像念幌柬

49、第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 55统计学统计学STATISTICS(第四版第四版)数据的描述统计量数据的描述统计量数据特征数据特征水平水平差异差异分布形状分布形状中位数和分位数中位数和分位数众数众数极差和四分位差极差和四分位差偏态系数偏态系数方差或标准差方差或标准差峰态系数峰态系数平均数平均数离散系数离散系数韭雏车蜜厨厕救刑择工讣炳梅食逾釉餐脾句企垄曝捻翠兜殉怀法缉灭苹团第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-3 - 56统计学统计学STATISTICS(第四版第四版)本章小节本章小节l度量水平的统计

50、量度量水平的统计量度量水平的统计量度量水平的统计量l度量差异的统计量度量差异的统计量度量差异的统计量度量差异的统计量l度量分布形状的统计量度量分布形状的统计量度量分布形状的统计量度量分布形状的统计量l各统计量的的特点及应用场合各统计量的的特点及应用场合各统计量的的特点及应用场合各统计量的的特点及应用场合l用用用用ExcelExcel和和和和SPSSSPSS计算描述统计量计算描述统计量计算描述统计量计算描述统计量惨求鸯巢寄遣退眠碟边裔候幌碳广及话琵付伊递吁取抉琼藤恭拿轰锹挫召第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-结结 束束贿煎如悄媳摸忧尤培费硷桃贰芦撒币状姜邯芒诞登毅愿衙城诉柑蛛期煌误第3章用统计量描述数据22年课件第3章用统计量描述数据22年课件yyyy-M-

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号