《多变量的图表示法1》由会员分享,可在线阅读,更多相关《多变量的图表示法1(10页珍藏版)》请在金锄头文库上搜索。
1、 多变量的图表示法多变量的图表示法 图形是对资料进行探索性研究的重要图形是对资料进行探索性研究的重要工具,当人们在运用其他统计方法对所工具,当人们在运用其他统计方法对所得资料进行分析之前,往往习惯于把各得资料进行分析之前,往往习惯于把各资料在一张图上画出来,以直观地反映资料在一张图上画出来,以直观地反映资料的分布情况及各变量之间的相关关资料的分布情况及各变量之间的相关关系。系。 当变量较少时,可以采用直方图、当变量较少时,可以采用直方图、条形图、饼图、散点图或是经验分布的条形图、饼图、散点图或是经验分布的密度图等方法。密度图等方法。 对于变量少于对于变量少于3 3个的情个的情况这样做简单而有效
2、。况这样做简单而有效。 当变量个数大于三个时,就不能用当变量个数大于三个时,就不能用通常的方法作图了。通常的方法作图了。 借助图形来描述多元资料的特性使借助图形来描述多元资料的特性使图形更加直观,简洁。图形更加直观,简洁。 13.1 散点图矩阵散点图矩阵 散点图矩阵是借助两变量散点图的散点图矩阵是借助两变量散点图的作图方法,它可以看作一个大的图形作图方法,它可以看作一个大的图形方阵,其每一个非对角元素的位置上方阵,其每一个非对角元素的位置上是对应是对应行行的变量与对应的变量与对应列列的的变量的散变量的散点图,而主对角元素位置上是各变量点图,而主对角元素位置上是各变量名,这样可以清晰的看到所研究
3、多个名,这样可以清晰的看到所研究多个变量两两之间的相关关系。变量两两之间的相关关系。 由此也可以看出,散点图矩阵方由此也可以看出,散点图矩阵方法还不是真正意义上的多变量作图法还不是真正意义上的多变量作图方法,它所研究的仍是两两方法,它所研究的仍是两两变量变量之之间的相关关系,而不能直接反映多间的相关关系,而不能直接反映多个变量之间的关系,借助它来对资个变量之间的关系,借助它来对资料分类也是比较困难的。料分类也是比较困难的。 然而,因其直观、简单、容易理然而,因其直观、简单、容易理解,散点图矩阵还是越来越受到广解,散点图矩阵还是越来越受到广大实际工作者的喜爱,很多统计软大实际工作者的喜爱,很多统
4、计软件也加入了作散点图矩阵的功能。件也加入了作散点图矩阵的功能。 下面举例说明如何用下面举例说明如何用spssspss软件作软件作散点图矩阵对资料进行研究:散点图矩阵对资料进行研究: 以spss软件自带的World95.sav资料为例: 该资料共有该资料共有2626个变量、个变量、109109条观测,是条观测,是19951995年年世界世界109109个国家和地区的基本发展情况的资料。个国家和地区的基本发展情况的资料。选择该数据如下几个变量作图:选择该数据如下几个变量作图:density(density(每每平方公里人口数)、平方公里人口数)、lifeexpf(lifeexpf(女性预期寿命)
5、女性预期寿命)、lifeexpm(lifeexpm(男性预期寿命)、男性预期寿命)、babymort(babymort(婴婴儿死亡率)、儿死亡率)、gdp_cap(GDPgdp_cap(GDP是总资产的倍数)、是总资产的倍数)、calories(calories(每日摄入热量)每日摄入热量)。 生成的矩阵图形如下: 由散点图矩阵可以看到,每平方公里人口数与其他各变量的相关性均不明显,男性的预期寿命、女性的预期寿命及婴儿死亡率三个变量之间有明显的线性相关性,而GDP是总资产的倍数与上面三个变量存在着某种曲线相关关系。 资料集World95.sav中变量religion的含义主要的宗教信仰,在Sactterplot Matrix对话框中将regligion变量选作标记变量(选入Set markers by),则在输出的散点图矩阵中,不同宗教信仰的国家以不同的颜色画出,这样可以做更详细的分析。