利用Matlab软件实现聚类分析

上传人:人*** 文档编号:510679587 上传时间:2024-01-21 格式:DOCX 页数:7 大小:38.33KB
返回 下载 相关 举报
利用Matlab软件实现聚类分析_第1页
第1页 / 共7页
利用Matlab软件实现聚类分析_第2页
第2页 / 共7页
利用Matlab软件实现聚类分析_第3页
第3页 / 共7页
利用Matlab软件实现聚类分析_第4页
第4页 / 共7页
利用Matlab软件实现聚类分析_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《利用Matlab软件实现聚类分析》由会员分享,可在线阅读,更多相关《利用Matlab软件实现聚类分析(7页珍藏版)》请在金锄头文库上搜索。

1、8 利用Matlab和SPSS软件实现聚类分析1.用Mat lab编程实现运用Matlab中的一些基本矩阵计算方法,通过自己编程实现聚类算法,在 此只讨论根据最短距离规则聚类的方法。调用函数:min1.m求矩阵最小值,返回最小值所在行和列以及值的大小min2.m比较两数大小,返回较小值std1.m用极差标准化法标准化矩阵ds1.m用绝对值距离法求距离矩阵cluster.m应用最短距离聚类法进行聚类分析print1.m调用各子函数,显示聚类结果聚类分析算法假设距离矩阵为vector, a阶,矩阵中最大值为max,令矩阵上三角元素 等于max聚类次数二aT,以下步骤作a-1次循环:求改变后矩阵的阶

2、数,计作c求矩阵最小值,返回最小值所在行e和列f以及值的大小gfor l=1:c,为 vector(c+1,l)赋值,产生新类令第c+1列元素,第e行和第f行所有元素为,第e列和第f列所有元素为max源程序如下:%stdl.m,用极差标准化法标准化矩阵function std=std1(vector)max=max(vector);%对列求最大值min=min(vector);a,b二size(vector);%矩阵大小,a为行数,b为列数for i=1:afor j=1:bstd(i,j)= (vector(i,j)-min(j)/(max(j)-min(j);endend%ds1.m,用绝

3、对值法求距离function d=ds1(vector);a,b=size(vector);d=zeros(a);for i=1:afor j=1:afor k=1:b d(i,j)=d(i,j)+abs(vector(i,k)-vector(j,k);endendendfprintf(绝对值距离矩阵如下:n);disp(d)%min1.m,求矩阵中最小值,并返回行列数及其值function v1,v2,v3=min1(vector);%v1 为行数,v2 为列数,v3 为其值 v,v2=min(min(vector);v,v1=min(min(vector);v3=min(min(vecto

4、r);%min2.m,比较两数大小,返回较小的值function v1=min(v2,v3);if v2v3v1=v3;elsev1=v2;end%cluster.m,最短距离聚类法function result=cluster(vector);a,b=size(vector); max=max(max(vector);for i=1:afor j=i:bvector(i,j)=max;endend;for k=1:(b-1)c,d=size(vector);fprintf(第纟次聚类:n,k);e,f,g=min1(vector);fprintf(最小值=%g,将第g区和第g区并为一类,记作

5、G%gnn,g,e,f,c+1); for l=1:cif l=min2(e,f) vector(c+1,l)=min2(vector(e,l),vector(f,l); elsevector(c+1,l)=min2(vector(l,e),vector(l,f);endend;vector(1:c+1,c+1)=max;vector(1:c+1,e)=max;vector(1:c+1,f)=max;vector(e,1:c+1)=max;vector(f,1:c+1)=max;end%print1,调用各子函数function print二print 1(filename,a,b); %a

6、为地区个数,b 为指标数 fid=fopen(filename,r) vector=fscanf(fid,%g,a b);和rintf(标准化结果如下:n)v1=std1(vector)v2=ds1(v1);cluster(v2);%输出结果print1(fname,9,7)2.直接调用Matlab函数实现2.1调用函数层次聚类法(Hierarchical Clustering)的计算步骤: 计算n个样本两两间的距离dj,记D 构造n个类,每个类只包含一个样本; 合并距离最近的两类为一新类; 计算新类与当前各类的距离;若类的个数等于1,转到5);否则回3); 画聚类图; 决定类的个数和类;Ma

7、tlab软件对系统聚类法的实现(调用函数说明):cluster从连接输出(linkage)中创建聚类clusterdata从数据集合(X)中创建聚类dendrogram画系统树状图linkage连接数据集中的目标为二元群的层次树pdist_计算数据集合中两两元素间的距离(向量)squareform将距离的输出向量形式定格为矩阵形式zscore对数据矩阵X进行标准化处理各种命令解释 T = clusterdata(X,cutoff)其中X为数据矩阵,cutoff是创建聚类的临界值。即表示欲分成几类。以上语句等价与以下几句命令:Y=pdist(X,euclid)Z=linkage(Y,single

8、)T=cluster(Z,cutoff)以上三组命令调用灵活,可以自由选择组合方法! T = cluster(Z, cutoff)从逐级聚类树中构造聚类,其中Z是由语句likage产生的(n-1) X3阶矩阵, cutoff是创建聚类的临界值。 Z = linkage(Y)Z = linkage(Y, method)创建逐级聚类树,其中 Y 是由语句 pdist 产生的 n(n-1)/2 阶向 量,method表示用何方法,默认值是欧氏距离(si ngle)。有complete 最长距离法;average类平均距离;centroid重心法;ward 递增平方和等。 Y = pdist(X)Y

9、= pdist(X, metric)计算数据集X中两两元素间的距离,metric表示使用特定的方法,有 欧氏距离euclid、标准欧氏距离SEuclid、马氏距离mahal、明可 夫斯基距离Minkowski 等。 H = dendrogram(Z) H = dendrogram(Z, p)由likage产生的数据矩阵z画聚类树状图。P是结点数,默认值是30。2.2举例说明示,根据最短距离法设某地区有八个观测点的数据,样本距离矩阵如表1聚类分析。%最短距离法系统聚类分析X=7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29;7.68 50.37 11.35

10、 13.3 19.25 14.59 2.75 14.87;9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76;9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35;10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81;BX=zscore(X); %标准化数据矩阵Y=pdist(X) %用欧氏距离计算两两之间的距离 D=squareform(Y) %欧氏距离矩阵Z = linkage(Y) %最短距离法T = cluster(Z,3) 等价于 T=clusterdata(X,3) find(T=3) %第3类集合中的元素H,T=dendrogram(Z) %画聚类图聚类谱系图如图1所示:图 1 聚类谱系图

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号