土木规划学教学课件PPT调查数据处理的方法

上传人:ji****72 文档编号:25952323 上传时间:2017-12-20 格式:PDF 页数:51 大小:1.95MB
返回 下载 相关 举报
土木规划学教学课件PPT调查数据处理的方法_第1页
第1页 / 共51页
土木规划学教学课件PPT调查数据处理的方法_第2页
第2页 / 共51页
土木规划学教学课件PPT调查数据处理的方法_第3页
第3页 / 共51页
土木规划学教学课件PPT调查数据处理的方法_第4页
第4页 / 共51页
土木规划学教学课件PPT调查数据处理的方法_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《土木规划学教学课件PPT调查数据处理的方法》由会员分享,可在线阅读,更多相关《土木规划学教学课件PPT调查数据处理的方法(51页珍藏版)》请在金锄头文库上搜索。

1、 现状分析的一般步骤 1)确定分析对象:弄清需要把握什么现象? 2)拟定因果关系:搞清是什么在产生影响? 3)因果关系的分类、整理:明确是何种构造? 现状分析的主要方法 多元分析( multivariate analysis) 多元分析方法: 重回归分析、相关分析、判别分析、数量化方法、主成分分析、因子分析、层次分类分析等。 使用方法的选择: 1) 判别作为分析对象的数据是属于有目的变量的多元分析,还 是无目的变量的多元分析 2) 判别作为对象的分析数据是数量数据还是非数量数据。 2 现状分析常用的方法 用途 方法名称 概要 其他 数据整理 单纯做表分析 Simple Tabulation 将

2、调查的数据整理成表格,通常可以使用 Excel,或是用数据库软件来整理、列表,之后可以绘制更为直观的图,如柱状图、饼状图等。 交叉列表分析 Cross Tabulation 社会学调查中对“定性”的信息作分析时,交叉表分析是较为有效的方法之一。通过列表直观地表示出两种变量直接的关系。这种方法用作初步的分析,是数据分析的一个部分、一个过程。 时序 图表分析 Time Series Tabulation 在土木规划中,许多现象是随着时间变化的,因此需要以时间序列的方式考察现象的发展。时序图表分析就是把现象变化按时间序列制成图表进行展示。 直方图(频率分布)分析 Histogram 当分析对象的变量

3、较大时,可以将变量分为若干个区间,获取各个区间的变量值的频率分布,以及累积频率分布。在人口调查,以及交通量调查中应用最为普遍。具体可以直方图的形式表示。 3 现状分析常用的方法 问题分类 判别分析 Discriminate Analysis 标本的分类方法 。 判别分析是指目标函数为非量化变量 ( 定性数据 ) , 说明变量为量化数据的分析方法 。 有外部基准 数量化理论 II类方法 标本的分类方法 。 是从样本的种种特性中 , 判别这个样本属于哪一组群的方法 , 与判别分析不同的是这里的自变量为定性数据 。 有外部基准 聚类分析法 Cluster Analysis 寻找个体与个体之间的类似性

4、,将分析对象按照其属性的特征进行简化,以便简单容易地掌握其中的区别和特性的一种方法。通常分析对象的列为聚类分析的评价对象,行是指分析对象的属性。当被分析的行和列都不大的情况下,就没有必要进行聚类分析。 无外部基准 树形图 dendrogram 列举法的一种 。 求概率时使用 。 多维尺度法 多维尺度法是一种将多维空间的研究对象 ( 样本或变量 ) 简化到低维空间进行定位 、 分析和归类 , 同时又保留对象间原始关系的数据分析方法 。 4 现状分析常用的方法 回归预测 方差分析analysis of variance 发现数据的变动要因 。 有外部基准 相关分析 correlation anal

5、ysis 探讨变量、个体之间的相互关联。 无外部基准 回归分析 regression analysis 有简单回归 、 多重回归 , 利用此方法发现关系式 、预测公式 。 需要做假设检验 , F检验用于评估偶然出现较高 F值的可能性 , t检验用于检验回归公式的所有变量的有效性 。 有外部基准 数量化理论 I类方法 把目标函数与可能对其产生影响的说明变量表示为关系式 , 并利用该式进行预测的方法 。 基本上与回归分析相同 。 但是多元回归分析中的自变量为定量数据 , 这里使用的是定性数据 。 发现关系式 、 预测公式 , 非数量数据 , 与数量数据的回归方法相对应 。 有外部基准 5 现状分析

6、常用的方法 主元素提取 主成分分析 Principal Component Analysis 从复杂的因素或是变量中发现合成变量 , 对个体 、 变量进行分类 。 因子分析 Factor Analysis 发现共通因子 , 对个体 、 变量进行分类的方法 。 通过研究各个被测变量相互间的关系 , 寻找其间存在的一种新的 、概括性的 、 让人更容易理解和掌握的关系属性 , 即因子 。 其他 ISM模型 寻找 AHP方法中的阶层构造的最有效的方法之一 。 本方法通过因素间的关系矩阵 , 可达矩阵及构造化矩阵达到阶层构造图形化的目的 。 产业关联分析 (input/output analysis)

7、投入产出法 , 作为一种科学的方法来说 , 是研究经济体系( 国民经济 、 地区经济 、 部门经济 、 公司或企业经济单位 )中各个部分之间投入与产出的相互依存关系的数量分析方法 。 计量经济模型 Econometric analysis 计量经济模型是根据经济行为理论和样本数据表示出变量间的关系的数学表达式 。 选择模型数学形式的主要依据是经济行为理论 。 层次分析法 ( AHP方法 ) 在从多个方案中选择确定最合理方案时 , 当这种 “ 决定 ”无法在全部数量化的情况下进行比较分析时 , 采用 AHP是非常有效的方法之一 。 6 世界上公认的三大数据分析软件: SAS、SPSS和 SYST

8、AT SPSS是“社会科学统计软件包”( Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。 Statistical Product and Service solutions(统计产品与服务解决方案) Excel可以处理一般的数据分析 7 2.1 判别分析 判别分析 ( discriminate analysis) 判别分析是判断样本所属类别的统计分析方法。一般用于通过把现象分类、归纳成群,然后分析对于分类的现象有影响的项目,来说明该现象的构造。例如,用于分析住宅的类别(购买,还是租赁)与收入、通勤距离的关系等

9、。 判别分析的任务 根据已掌握的一批分类明确的总体(或样本),建立较好的判别函数,使产生错判的事例最少,进而对给定的一个分类未知的新样本,判断它来自哪个总体。分类明确的样本称为“训练样本”。 8 2.1 判别分析 判别分析的分类 根据资料的性质 定性资料的判别分析、定量资料的判别分析 根据判别类数 二类判别、多类判别 根据判别时所处理的变量方法 逐步判别和序贯判别 根据区分不同总体所用的数学模型 线性判别分析和非线性判别分析 根据判别准则的不同 费歇( Fisher)判别、贝叶斯( Bayes)判别、马哈拉诺比斯( Mahalanobis)距离判别 9 2.1 判别分析 费歇二类线性判别分析

10、具有 n个样本 m个说明变量的数据模型如下所示 假定目的变量为 Z,说明变量为 X1, X2, , Xm , 此时,其判断方程为 Z=a0+a1X1+a2X2+amXm 1 1 1 2 1 12 1 2 2 2 21212: : : : : : : : : : :jmkmjkj j jk jmm m m k m mS S S SS S S SSS S S SS S S S 变量 X1 X2 Xj Xm Z 样本 1 X11 X12 X1j X Z1 2 X21 X22 X2j X Z2 i Xi1 X12 Xij Xim Zi n Xn1 Xn2 Xnj Xnm Zn 10 2.1 判别分析

11、费歇二类线性判别分析 为了求得常数项( a0)和系数( a1, a2, am),需要计算各个变量的偏差平方和与乘积和,做成矩阵 Sjk 1 1 1 2 1 12 1 2 2 2 21212: : : : : : : : : : :jmkmjkj j jk jmm m m k m mS S S SS S S SSS S S SS S S S 1 1 1 2 1 12 1 2 2 2 21212: : : : : : : : : : :jmkmjkj j jk jmm m m k m mS S S SS S S SSS S S SS S S S ( ) ( ) ( ) ( )11( )( )inn

12、jk ij l j l ik l k lliS X X X X 11 2.1 判别分析 费歇二类线性判别分析 由于对象只有两类,上式中的下标则为( l=1, 2)。假定第一类的平均值为 ,第二类的平均值为 于是可以得到下列联立方程。此处,平均值的下标中的括号中数字表示群。 1 1 1 2 1 12 1 2 2 2 21212: : : : : : : : : : :jmkmjkj j jk jmm m m k m mS S S SS S S SSS S S SS S S S 1 ( 1 ) 2 ( 1 ) ( 1 ), , , mX X X 1 ( 2 ) 2 ( 2 ) ( 2 ), , ,

13、 mX X X1 ( 1 ) 1 ( 2 )1 1 1 1 2 2 12 ( 1 ) 2 ( 2 )2 1 1 2 2 2 2( 1 ) ( 2 )1 1 2 2( 1 ) ( 2 )1 1 2 2:mmmmjjj j jm mmmm m m m mS a S a S a X XS a S a S a X XS a S a S a X XS a S a S a X X 12 2.1 判别分析 费歇二类线性判别分析 通过求解上述联立方程即可获得常数项 a0 在此, 判别对象的判别分数 Z( X)可以由最初给出的式子 Z=a0+a1X1+a2X2+amXm 求出 1 1 1 2 1 12 1 2

14、2 2 21212: : : : : : : : : : :jmkmjkj j jk jmm m m k m mS S S SS S S SSS S S SS S S S 0 1 1 2 2() mma a M a M a M ( 1 ) ( 2 )( ) / 2mmmM X X 13 例题 5.2.1 判别分析 表 5-2中列出了利用平行的两种铁路(动车组 =1组,普通客运 2组)的 10名男性的对于票价与舒适程度的满意度的调查结果( 10分满分)。在此调查结果的基础上,判断票价满意度为 2,舒适程度满意度为 8的男性属于哪一组。判断时使用线性判别函数法。 14 样本 票价 舒适程度 组别 样本 票价 舒适程度 组别 1 3 9 1 6 1 5 2 2 3 8 1 7 4 6 2 3 4 7 1 8 3 2 2 4

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号