数学部分第8章统计实验(因子分析)

上传人:woxinch****an2018 文档编号:39308425 上传时间:2018-05-14 格式:DOC 页数:9 大小:303KB
返回 下载 相关 举报
数学部分第8章统计实验(因子分析)_第1页
第1页 / 共9页
数学部分第8章统计实验(因子分析)_第2页
第2页 / 共9页
数学部分第8章统计实验(因子分析)_第3页
第3页 / 共9页
数学部分第8章统计实验(因子分析)_第4页
第4页 / 共9页
数学部分第8章统计实验(因子分析)_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数学部分第8章统计实验(因子分析)》由会员分享,可在线阅读,更多相关《数学部分第8章统计实验(因子分析)(9页珍藏版)》请在金锄头文库上搜索。

1、1实验四实验四 R R 型因子分析型因子分析1 1实验目的实验目的: 本实验讨论利用 R 型因子分析从具有错综复杂关系的变量中,找出数量较少的几个公因子 来描述原始的变量,并且尽量减少信息的损失。通过该实验,能够起到如下的效果:(1) 理解因子分析的作用、思想、数学基础、方法和步骤;(2) 熟悉如何利用因子分析,提出 问题、分析问题、解决问题、得出结论; (3)会调用 SAS 软件实现因子分析的各个步骤, 根据计算的结果进行分析,得出正确的结论,解决实际的问题。2 2知识准备:知识准备: R 型因子分析是从具有错综复杂关系的变量中,找出数量较少的几个公因子来描述原始的 变量,并且尽量减少信息的

2、损失。其思想是:找出少量的不相关的若干个随机变量(公因 子) , ) )尽最大信息的描述原始众多的关系复杂的变量。其数学模型有很多,如正交因子模 型【1】 ,因子分析模型 L【4】等,它们的数学模型和方法均有不相同。我们下面采用因子 分析模型 L 来进行分析。R 型因子分析的步骤大体分为:首先正向化指标;然后计算样本 相关阵的特征值、单位特征向量和方差贡献率,根据方差贡献率选取适当数量的初始因子, 并得到初始因子载荷阵;再对初始因子进行旋转,选用行及列的元素的绝对值向 0、1 分化 严重的旋转因子载荷阵对应的旋转因子作为最终的公因子;最后利用因子载荷阵求出因子 得分函数。3 3实验内容:实验内

3、容: 表的数据是全国 30 个省市自治区经济发展基本情况,其中 X1- GDP ,X2-居民消费水平, X3-固定资产投资,X4-职工平均工资,X5-货物周转量,X6-居民消费价格指数,X7-商品零 售价格指数,X8-工业总产值,数据来源:1996 年中国统计年鉴 ;见【】 表表 1 1 全全国国 3 30 0 个个省省市市自自治治区区经经济济发发展展基基本本情情况况序号省市X1X2X3X4X5X6X7X81北京1394.892505519.018144373.9117.3112.6843.43 2天津920.112720345.466501342.8115.2110.6582.51 3河北2

4、849.521258704.8748392033.3115.2115.81234.85 4山西1092.481250290.94721717.3116.9115.6697.25 5内蒙832.881387250.234134781.7117.5116.8419.39 6辽宁2793.372397387.9949111371.1116.11141840.55 7吉林1129.21872320.454430497.4115.2114.2762.47 8黑龙江2014.532334435.734145824.8116.1114.31240.37 9上海2462.575343996.489279207

5、.4118.71131642.95 10江苏5155.2519261434.9559431025.5115.8114.32026.64 11浙江3524.7922491006.396619754.4116.6113.5916.59 12安徽2003.5812544744609908.3114.8112.7824.14 13福建2160.522320553.975857609.3115.2114.4433.67 14江西1205.111182282.844211411.7116.9115.9571.84 15山东5002.3415271229.5551451196.6117.6114.22207

6、.69 16河南3002.741034670.3543441574.4116.5114.91367.92 17湖北2391.421527571.684685849120116.61220.72 18湖南2195.71408422.6147971011.8119115.5843.83219广东5381.7226991639.838250656.5114111.61396.35续续表表序号省市X1X2X3X4X5X6X7X820广西1606.151314382.595105556118.4116.4554.97 21海南364.171814198.355340232.1113.5111.364.3

7、3 22四川35341261822.544645902.3118.51171431.81 23贵州630.07942150.844475301.1121.4117.2324.72 24云南1206.6812613345149310.4121.3118.1716.65 25西藏55.98111017.8773824.2117.3114.95.57 26陕西1000.031208300.274396500.9119117600.98 27甘肃553.351007114.815493507119.8116.5468.79 28青海165.31144547.76575361.6118116.3105.

8、8 29宁夏169.75135561.985079121.8117.1115.3114.4 30新疆834.571469376.955348339119.7116.7428.76 (1)利用因子分析模型 L 进行分析,找出适当的公共因子公共因子及相应的因子得分函数; (2)利用上面的因子得分函数对样品进行聚类分析,并给出适当的结论。4 4实验步骤:实验步骤: (1 1)利用因子分析模型利用因子分析模型 L L 进行分析,找出适当的进行分析,找出适当的公共因子公共因子及相应的因子得分函数:及相应的因子得分函数:1. 读入数据,并且正向化指标;SASSAS 程序程序: :DataData econ

9、omy1;input X1-X8;cards; 1394.89 2505519.018144373.9117.3112.6843.43 920.112720345.466501342.8115.2110.6582.51 2849.52 1258704.8748392033.3115.2115.81234.85 1092.48 1250290.94721717.3116.9115.6697.25 832.881387250.234134781.7117.5116.8419.39 2793.37 2397387.9949111371.1116.1114.01840.55 1129.21872320

10、.454430497.4115.2114.2762.47 2014.53 2334435.734145824.8116.1114.31240.37 2462.57 5343996.489279207.4118.7113.01642.95 5155.25 19261434.95 59431025.5115.8114.32026.64 3524.79 22491006.39 6619754.4116.6113.5916.59 2003.58 1254474 4609908.3114.8112.7824.14 2160.52 2320553.975857609.3115.2114.4433.67 1

11、205.11 1182282.844211411.7116.9115.9571.84 5002.34 15271229.55 51451196.6117.6114.22207.69 3002.74 1034670.3543441574.4116.5114.91367.92 2391.42 1527571.684685849 120 116.61220.72 2195.71408422.6147971011.8119 115.5843.8335381.72 26991639.83 8250656.5114 111.61396.35 1606.15 1314382.595105556 118.41

12、16.4554.97 364.171814198.355340232.1113.5111.364.33 35341261822.544645902.3118.5117 1431.81 630.07942 150.844475301.1121.4117.2324.72 1206.68 1261334 5149310.4121.3118.1716.65 55.98111017.8773824.2 117.3114.95.57 1000.03 1208300.274396500.9119 117 600.98 553.351007114.815493507 119.8116.5468.79 165.

13、31144547.76575361.6118 116.3105.8 169.75135561.985079121.8117.1115.3114.4 834.571469376.955348339 119.7116.7428.76 ; runrun; DataData economy2; set economy1; X9=100100/X6; X10=100100/X7; runrun;语句解释:语句解释: “Data economy1; ;”指将原始数据输入到文件“economy1”中; “Input X1-X8;cards;”指将后面的数据对应地赋予变量 X1-X8; “Data econo

14、my2; set economy1;”指调用 “economy1”中的数据,经计算后存入 “economy2” ; “X9=100100/X6; X10=100100/X7”指将变量“X6、X7”进行正向化的计算,正向化后的数据分别 存入变量“X9、X10” ;. 调用因子分析程序,计算样本相关阵的特征值、单位特征向量和方差贡献率,并根据 方差贡献率选取适当数量的因子作为初始因子;SASSAS 程序程序: :ProcProc factorfactor data=economy2 M=prin priors=one p=0.80.8 simple corr;var X1-X5 X9 X10 X8

15、; runrun;语句解释:语句解释: “Proc factor”指调用因子分析程序; “data= economy2”指调用“economy2”中的数据; “M=prin”指定因子提取的方法;可供选择的方法有:prin(主成份法)、prinit(主因子法)、 mlim(最大似然法)等; “priors=one”指定所有变量的初始共性方差估计值为 1; “p=0.8”指定选用的初始因子的累积贡献率和刚好大于 0.8; “simple”指显示均值、标准差及观察个数;4“corr”指显示相关系数阵或偏相关系数阵; “var X1-X5 X9 X10 X8”指需要分析的变量是“X1-X5 X9 X1

16、0 X8” , 其它更多的语句参 见书【2】 。运行结果及解释:运行结果及解释:图图 相关阵的特征值、累计贡献率相关阵的特征值、累计贡献率 图数据“Eigenvalue”指相 关系数阵的特征值; “Difference”指本行特征值 与下行特征值之差; “Proportion”指本行特征值 对应初始因子的方差贡献率; “Cumulative”指本行及上面 各行特征值对应初始因子的累 积贡献率;图图 因子载荷阵因子载荷阵 图1中数据结果说明:前3个因子的累 计贡献率为0.8957,大于0.8,因此 可以只取前3个因子作为初始因子; 图、图中数据“Factor1- Factor3”是三个初始因子;图2中数 据显示:载荷矩阵中元素的绝对值向 0、分化不明显,需要作因子旋转;图图 方差贡献率方差贡献率 图4中数据是变量“X1-X5 X9 X10 X8” 的共同度,数据显示

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号