有序样品的聚类

上传人:206****923 文档编号:51486508 上传时间:2018-08-14 格式:PPT 页数:6 大小:457.50KB
返回 下载 相关 举报
有序样品的聚类_第1页
第1页 / 共6页
有序样品的聚类_第2页
第2页 / 共6页
有序样品的聚类_第3页
第3页 / 共6页
有序样品的聚类_第4页
第4页 / 共6页
有序样品的聚类_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《有序样品的聚类》由会员分享,可在线阅读,更多相关《有序样品的聚类(6页珍藏版)》请在金锄头文库上搜索。

1、有序样品的聚类为了了解儿童的生长发育规律,今随机抽样统计了男孩 从出生到11岁平均增长的重量数据表如下,试问:男孩发 育可分为几个阶段?n记与年龄对应的儿童增重数的11个数据,表示儿童的增重数,例如 表示8岁儿童的平均年增重为 2 (千克)。如果要把增重数 分成保持次序的3个组这时可以有 种选择。例如 , , 就是一种可选择的分类方法。一个好的分类方法就是应该使处于同一类事物之间的差别尽 可能地小,而使类与类之间的差别尽可能地大。为了表示类 内部事物与事物的差别,我们借用统计中全距(直径)的计 算方法, 以 、 、 这个分类为例来说 明计算类内差别的方法:其中第一类 对应的数据为9.3、1.8

2、、1.9,最大值为 9.3,最小值为1.8,这一类的差异我们用全距9.3-1.8=7.5 第二类 中最大值为2.0,最小值为1.3,则2.0-1.3=0.7 第三类 中的最大值为2.3,最小值为1.9,则2.3-1.9=0.4为衡量上述分类方法的优劣,我们计算此种分类方法中的三 个类内的平均差异,即规定该分类方法的优劣指标K为n对于另一种分类方法 1.、2、3、4 、5、6、7、 8、9、10、11 其第一类的类内差异为7.6,第二类的类内差异为0.2 第三类的类内差异为0.9。该分类方法的优劣指标K 为2.9。相比之下,此分类方法不如前一种分类方法好 。n试问:分三类最好的分类方法应怎么分?

3、n把11个有序数据分成3类共有45种方法,计算每类分 法的优劣指标并加以比较,可以得到最好的(分三类) 方法为 1、2,3,4,5,6,7 、8、9、10、11 此分 类方法的优劣指标K是 0.3 以同样的方法分析,可知把这11个数据分成 两类的最好分类方法是这时的优劣指标K为 0.5那么这11个数据分成几类为宜呢?为此我们分别找到把11个数据分成1类、2类、11类 的最好的分类法,计算出各最好分类方法的优劣指标,列 表如下:由表可看到,如果把1至11岁的数据只分成一类时,K8 ,优劣指标值太大;而对n大于4时的K值相差不多;而当 n3或n4时,K值已降为0.30和0.20.而n=5及其以上时 ,K相差太小,而类分得太多无意义,因此分成3类或4类 为宜。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号