《降鑫磊2010221014统计学.doc》由会员分享,可在线阅读,更多相关《降鑫磊2010221014统计学.doc(5页珍藏版)》请在金锄头文库上搜索。
1、第一题:clearclca= 4.1000 3.7000 3.5000 3.9000 4.1000 3.5000 3.5000 3.6000 4.1000 4.0000 4.1000 4.0000 3.7000 4.3000 4.2000 3.2000 3.8000 3.4000 3.4000 3.9000 3.9000 3.3000 3.4000 4.0000 3.9000 3.7000 3.4000 3.5000 3.6000 3.9000 3.3000 4.0000 3.5000 3.4000 3.6000;b=3.9000 4.2000 3.9000 4.5000 4.0000 4.4
2、000 4.1000 3.3000 4.0000 3.4000 4.5000 3.8000 4.7000 3.6000 4.3000 3.5000 3.9000 3.8000 4.8000 3.8000 3.8000 3.4000 3.8000 4.1000 4.7000 4.3000 3.3000 3.9000 3.8000 3.8000 4.6000 4.1000 3.4000 3.8000 4.2000;u=a-b;h,p,ci,stats=ttest(u,0,0.01)结果:h = 1p = 0.0030ci = -0.4767 -0.0376stats = tstat: -3.195
3、5 df: 34 sd: 0.4761第二题:将13类鼠标质量按ward聚类分为3类第一类 微软 SideWinder 罗技 G9第二类 Razer 3G Razer 巨腹蛇 双飞燕 XL-750FS 微软 Habu 罗技 新版MX518第三类 美心 点击王 苹果新概念 MG09V5U 明基 幻影熊 多彩 T2 优派 黑甲鼠 新贵 狙激豹聚类图程序代码:x,textdata=xlsread(problem2.xls); x=zscore(x); y = pdist(x); z = linkage(y,ward);obslabel=textdata(2:14); H,T = dendrogram
4、(z,orientation,Right,labels,obslabel); set(H,LineWidth,2,Color,k)xlabel(ward聚类);Taverage = clusterdata(x,linkage,ward,maxclust,3); obslabel(Taverage = 1) ans = 微软 SideWinder 罗技 G9 obslabel(Taverage = 2)ans = Columns 1 through 4 Razer 3G Razer 巨腹蛇 双飞燕 XL-750FS 微软 Habu Column 5 罗技 新版MX518obslabel(Tave
5、rage = 3)ans = Columns 1 through 4 美心 点击王 苹果新概念 MG09V5U 明基 幻影熊 多彩 T2 Columns 5 through 6优派 黑甲鼠 新贵 狙激豹clear x,textdata=xlsread(problem4.xls); xz=zscore(x); COEFF,SCORE,latent,tsquare = princomp(xz); explained = 100*latent/sum(latent); m, n = size(x); result1 = cell(n+1, 4); %定义一个n+1行,4列的元胞数组result1(1
6、,:) = 特征值, 差值, 贡献率, 累积贡献率;result1(2:end,1) = num2cell(latent); %存放特征值result1(2:end-1,2) = num2cell(-diff(latent); %存放特征值之间的差值result1(2:end,3:4) = num2cell(explained, cumsum(explained) %存放(累积)贡献率result1 = 特征值 差值 贡献率 累积贡献率 4.7255 3.4912 67.5071 67.5071 1.2343 0.7857 17.6334 85.1406 0.4487 0.1425 6.409
7、5 91.5500 0.3061 0.0924 4.3731 95.9231 0.2138 0.1532 3.0536 98.9767 0.0606 0.0495 0.8653 99.8421 0.0111 0.1579 100.0000 varname = textdata(1,2:end); result2 = cell(n+1, 3); result2(1,:) = 标准化变量, 特征向量t1, 特征向量t2; % result2的第一行result2(2:end, 1) = varname; % result2的第一列result2(2:end, 2:end) = num2cell(C
8、OEFF(:,1:2) % 存放前2个主成分表达式的系数数据result2 = 标准化变量 特征向量t1 特征向量t2 GDP 0.4416 0.0739 Income 0.4472 -0.0292 Consumption 0.4356 -0.0163 Employment 0.1230 0.8277 Education 0.3650 -0.3977 Health 0.3740 0.3074 Life 0.3564 -0.2358 cityname = textdata(2:end,1); sumXZ = sum(XZ,2); %每一个地区总的消费性支出? Undefined function
9、 or variable XZ. sumXZ = sum(xz,2); %每一个地区总的消费性支出 s1, id = sortrows(SCORE,1); result3 = cell(m+1, 4); %定义一个m+1行,3列的元胞数组 result3(1,:) = 地区, 总经济水平, 第一主成分得分y1, 第二主成分得分y2; result3(2:end, 1) = cityname(id); % result3的第一列,即排序后地区名 % 存放排序后每一个地区总的消费性支出,以及前2个主成分的得分数据 result3(2:end, 2:end) = num2cell(sumXZ(id)
10、, s1(:,1:2)result3 = 地区 总经济水平 第一主成分得分y1 第二主成分得分y2 青 海 -5.1316 -1.8965 0.3304 西 藏 -4.0911 -1.6337 0.6633 海 南 -4.2221 -1.5939 -0.4598 云 南 -4.5430 -1.5789 0.3730 甘 肃 -3.3752 -1.5033 0.6002 宁 夏 -3.0067 -1.2978 0.5351 四 川 -3.5763 -1.2732 -0.6003 新 疆 -1.7637 -1.2596 2.0278 河 南 -2.4855 -1.1370 0.3846 广 西 -2.8384 -0.9381 -0.8768 湖 北 -2.3275 -0.8794 -0.3325 内蒙古 -1.7877 -0.6675 -0.0044 山 西 -0.8871 -0.5810 0.4050 黑龙江 -1.0172 -0.5717 0.4189 陕 西 -0.7798 -0.4932 0.0640