地球化学数据统计基础.ppt

上传人:m**** 文档编号:573014002 上传时间:2024-08-14 格式:PPT 页数:23 大小:439.51KB
返回 下载 相关 举报
地球化学数据统计基础.ppt_第1页
第1页 / 共23页
地球化学数据统计基础.ppt_第2页
第2页 / 共23页
地球化学数据统计基础.ppt_第3页
第3页 / 共23页
地球化学数据统计基础.ppt_第4页
第4页 / 共23页
地球化学数据统计基础.ppt_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《地球化学数据统计基础.ppt》由会员分享,可在线阅读,更多相关《地球化学数据统计基础.ppt(23页珍藏版)》请在金锄头文库上搜索。

1、地球化学数据统计分析与解释龚庆杰龚庆杰推荐用书数据统计分析与SPSS应用余建英 何旭宏 编著人民邮电出版社 出版第一讲第一讲 地球化学数据统计基础地球化学数据统计基础一、地化数据的特点一、地化数据的特点一、地化数据的特点一、地化数据的特点各种地球化学特征在不同的研究对象(样品或测点)上进行测试,各种地球化学特征在不同的研究对象(样品或测点)上进行测试,各种地球化学特征在不同的研究对象(样品或测点)上进行测试,各种地球化学特征在不同的研究对象(样品或测点)上进行测试,可以得到各自的数值。这种在不同对象上可以取值的地球化学特征称可以得到各自的数值。这种在不同对象上可以取值的地球化学特征称可以得到各

2、自的数值。这种在不同对象上可以取值的地球化学特征称可以得到各自的数值。这种在不同对象上可以取值的地球化学特征称为地球化学变量。为地球化学变量。为地球化学变量。为地球化学变量。地球化学变量具有地球化学变量具有地球化学变量具有地球化学变量具有3 3个特点。即它具有随机变量的性质,又具有个特点。即它具有随机变量的性质,又具有个特点。即它具有随机变量的性质,又具有个特点。即它具有随机变量的性质,又具有确定性变量的特征,还具有区域化变量的结构性。确定性变量的特征,还具有区域化变量的结构性。确定性变量的特征,还具有区域化变量的结构性。确定性变量的特征,还具有区域化变量的结构性。l l随机性随机性随机性随机

3、性 1.1.地球化学样品的采取具有抽样的性质地球化学样品的采取具有抽样的性质地球化学样品的采取具有抽样的性质地球化学样品的采取具有抽样的性质 2.2.从成因上看,地球化学变量的取值受多因素的控制从成因上看,地球化学变量的取值受多因素的控制从成因上看,地球化学变量的取值受多因素的控制从成因上看,地球化学变量的取值受多因素的控制 3.3.地球化学变量在测试过程中有测试误差,误差就带有随机性特点地球化学变量在测试过程中有测试误差,误差就带有随机性特点地球化学变量在测试过程中有测试误差,误差就带有随机性特点地球化学变量在测试过程中有测试误差,误差就带有随机性特点l l确定性确定性确定性确定性 每一个研

4、究对象在指定的时刻,某种地球化学特征的真实数值是客每一个研究对象在指定的时刻,某种地球化学特征的真实数值是客每一个研究对象在指定的时刻,某种地球化学特征的真实数值是客每一个研究对象在指定的时刻,某种地球化学特征的真实数值是客观存在的,是有确定数值的。这个值不依赖于人们是否已经测试到了。观存在的,是有确定数值的。这个值不依赖于人们是否已经测试到了。观存在的,是有确定数值的。这个值不依赖于人们是否已经测试到了。观存在的,是有确定数值的。这个值不依赖于人们是否已经测试到了。l l区域结构性区域结构性区域结构性区域结构性 所谓结构性是指地球化学变量由于受地质因素的控制,在不同方向所谓结构性是指地球化学

5、变量由于受地质因素的控制,在不同方向所谓结构性是指地球化学变量由于受地质因素的控制,在不同方向所谓结构性是指地球化学变量由于受地质因素的控制,在不同方向上变化率的不同,具有不同的自相关的特性。当一个变量分布在空间上变化率的不同,具有不同的自相关的特性。当一个变量分布在空间上变化率的不同,具有不同的自相关的特性。当一个变量分布在空间上变化率的不同,具有不同的自相关的特性。当一个变量分布在空间内时(即赋于其空间位置时),称为区域化变量内时(即赋于其空间位置时),称为区域化变量内时(即赋于其空间位置时),称为区域化变量内时(即赋于其空间位置时),称为区域化变量二、地球化学变量的分类二、地球化学变量的

6、分类二、地球化学变量的分类二、地球化学变量的分类按取值范围内的可能,分为按取值范围内的可能,分为按取值范围内的可能,分为按取值范围内的可能,分为3 3类:类:类:类:1.1.连续型变量连续型变量连续型变量连续型变量连续型变量在取值范围内有不可数无限多个值。这种变量可连续型变量在取值范围内有不可数无限多个值。这种变量可连续型变量在取值范围内有不可数无限多个值。这种变量可连续型变量在取值范围内有不可数无限多个值。这种变量可以取在某一个数值区间内的任何数值。以取在某一个数值区间内的任何数值。以取在某一个数值区间内的任何数值。以取在某一个数值区间内的任何数值。2.2.离散型变量离散型变量离散型变量离散

7、型变量离散型变量在取值范围内取有限多个或可数无限个值。离散型变量在取值范围内取有限多个或可数无限个值。离散型变量在取值范围内取有限多个或可数无限个值。离散型变量在取值范围内取有限多个或可数无限个值。3.3.二元变量二元变量二元变量二元变量二元变量也称二态变量或有无变量,它是一种只有两个取值二元变量也称二态变量或有无变量,它是一种只有两个取值二元变量也称二态变量或有无变量,它是一种只有两个取值二元变量也称二态变量或有无变量,它是一种只有两个取值的离散变量。的离散变量。的离散变量。的离散变量。根据给予某个变量具体数值的方式,划分为根据给予某个变量具体数值的方式,划分为根据给予某个变量具体数值的方式

8、,划分为根据给予某个变量具体数值的方式,划分为4 4类:类:类:类:为叙述方便,先设变量为叙述方便,先设变量为叙述方便,先设变量为叙述方便,先设变量x x在两个观测对象在两个观测对象在两个观测对象在两个观测对象A A与与与与B B中的取值分别为中的取值分别为中的取值分别为中的取值分别为x xA A和和和和x xB B。1.1.名义型变量名义型变量名义型变量名义型变量名义型变量把观测值分成互不相交的组别。这些组别名义型变量把观测值分成互不相交的组别。这些组别名义型变量把观测值分成互不相交的组别。这些组别名义型变量把观测值分成互不相交的组别。这些组别可以用它们的名字、特征或符号来标识。可以用它们的

9、名字、特征或符号来标识。可以用它们的名字、特征或符号来标识。可以用它们的名字、特征或符号来标识。2.2.有序型变量有序型变量有序型变量有序型变量有序型变量对观测特征可以列出一个等级大小的顺序。有序型变量对观测特征可以列出一个等级大小的顺序。有序型变量对观测特征可以列出一个等级大小的顺序。有序型变量对观测特征可以列出一个等级大小的顺序。对于对于对于对于A A和和和和B B两个对象,它不仅能区别出两个对象,它不仅能区别出两个对象,它不仅能区别出两个对象,它不仅能区别出x xA A= =x xB B或或或或x xA AxxB B,还,还,还,还能进一步区分出能进一步区分出能进一步区分出能进一步区分出

10、x xA A x xB B或或或或x xA A x xB B,即有了大小顺序的差别。,即有了大小顺序的差别。,即有了大小顺序的差别。,即有了大小顺序的差别。但它们的级差不是等距的。但它们的级差不是等距的。但它们的级差不是等距的。但它们的级差不是等距的。3.3.间隔型变量间隔型变量间隔型变量间隔型变量间隔型变量不但能区分它们之间的值是相等、不等、谁大谁小,间隔型变量不但能区分它们之间的值是相等、不等、谁大谁小,间隔型变量不但能区分它们之间的值是相等、不等、谁大谁小,间隔型变量不但能区分它们之间的值是相等、不等、谁大谁小,而且还能表示谁比谁大多少。间隔型变量可以定量地表示它们之间的而且还能表示谁比

11、谁大多少。间隔型变量可以定量地表示它们之间的而且还能表示谁比谁大多少。间隔型变量可以定量地表示它们之间的而且还能表示谁比谁大多少。间隔型变量可以定量地表示它们之间的差异,但间隔型变量没有绝对零值。差异,但间隔型变量没有绝对零值。差异,但间隔型变量没有绝对零值。差异,但间隔型变量没有绝对零值。4.4.比例型变量比例型变量比例型变量比例型变量比例型变量比间隔型变量更进一步。它具有间隔型变量的标识功比例型变量比间隔型变量更进一步。它具有间隔型变量的标识功比例型变量比间隔型变量更进一步。它具有间隔型变量的标识功比例型变量比间隔型变量更进一步。它具有间隔型变量的标识功能,而且还有真正的零点。能,而且还有

12、真正的零点。能,而且还有真正的零点。能,而且还有真正的零点。以上以上以上以上4 4类变量中,名义型变量和有序型变量属于定性变量,间隔类变量中,名义型变量和有序型变量属于定性变量,间隔类变量中,名义型变量和有序型变量属于定性变量,间隔类变量中,名义型变量和有序型变量属于定性变量,间隔型变量和比例型变量为定量变量。一般来说,定性变量只能参加布尔型变量和比例型变量为定量变量。一般来说,定性变量只能参加布尔型变量和比例型变量为定量变量。一般来说,定性变量只能参加布尔型变量和比例型变量为定量变量。一般来说,定性变量只能参加布尔运算,定量变量可作代数运算。运算,定量变量可作代数运算。运算,定量变量可作代数

13、运算。运算,定量变量可作代数运算。地球化学变量按其预处理取值方法的不同还可以分为:地球化学变量按其预处理取值方法的不同还可以分为:地球化学变量按其预处理取值方法的不同还可以分为:地球化学变量按其预处理取值方法的不同还可以分为:1.1.实测变量实测变量实测变量实测变量它又叫观察变量或原始变量。它是用仪器或特定的分析手段对研它又叫观察变量或原始变量。它是用仪器或特定的分析手段对研它又叫观察变量或原始变量。它是用仪器或特定的分析手段对研它又叫观察变量或原始变量。它是用仪器或特定的分析手段对研究对象直接测定所得。究对象直接测定所得。究对象直接测定所得。究对象直接测定所得。2.2.综合变量综合变量综合变

14、量综合变量综合变量是将两个或多个原始观察值加以综合,组成一个新的变综合变量是将两个或多个原始观察值加以综合,组成一个新的变综合变量是将两个或多个原始观察值加以综合,组成一个新的变综合变量是将两个或多个原始观察值加以综合,组成一个新的变量,具有特定的地质意义。量,具有特定的地质意义。量,具有特定的地质意义。量,具有特定的地质意义。3.3.人为变量人为变量人为变量人为变量它是根据地质人员对地质现象和成矿理论人为确定的变量。它是根据地质人员对地质现象和成矿理论人为确定的变量。它是根据地质人员对地质现象和成矿理论人为确定的变量。它是根据地质人员对地质现象和成矿理论人为确定的变量。地球化学数据统计的基本

15、内容地球化学数据统计的基本内容 数据统计基础数据统计基础方差分析方差分析相关分析相关分析回归分析回归分析聚类分析聚类分析判别分析判别分析因子分析因子分析统计描述统计描述1.1.均值(均值(均值(均值(MeanMean)和均值标准误差()和均值标准误差()和均值标准误差()和均值标准误差(S.E.meanS.E.mean)定义:均值(平均值、平均数)表示的是某变量所有取值的集中定义:均值(平均值、平均数)表示的是某变量所有取值的集中定义:均值(平均值、平均数)表示的是某变量所有取值的集中定义:均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。趋势或平均水平。趋势或平均水平。趋势或

16、平均水平。计算公式:计算公式:计算公式:计算公式:总体平均数总体平均数总体平均数总体平均数 :样本平均数:样本平均数:样本平均数:样本平均数:2.2.中位数(中位数(中位数(中位数(MedianMedian)定义:定义:定义:定义:把一组数据按递增或递减的顺序排列,处于中间位置上的变量把一组数据按递增或递减的顺序排列,处于中间位置上的变量把一组数据按递增或递减的顺序排列,处于中间位置上的变量把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值值就是中位数。它是一种位置代表值,所以不会受到极端数值值就是中位数。它是一种位置代表值,所以不会受

17、到极端数值值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。的影响,具有较高的稳健性。的影响,具有较高的稳健性。的影响,具有较高的稳健性。计算公式:计算公式:计算公式:计算公式:一个大小为一个大小为一个大小为一个大小为N N的数列,要求其中位数,首先应把该数列按大小的数列,要求其中位数,首先应把该数列按大小的数列,要求其中位数,首先应把该数列按大小的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果顺序排列好,如果顺序排列好,如果顺序排列好,如果N N为奇数,那么该数列的中位数就是为奇数,那么该数列的中位数就是为奇数,那么该数列的中位数就是为奇数,那么该数列

18、的中位数就是(N+1)/2(N+1)/2位置上的数;如果位置上的数;如果位置上的数;如果位置上的数;如果N N为偶数,中位数则是该数列中第为偶数,中位数则是该数列中第为偶数,中位数则是该数列中第为偶数,中位数则是该数列中第N/2N/2与第与第与第与第N/2+1N/2+1位置上两个数值的平均数位置上两个数值的平均数位置上两个数值的平均数位置上两个数值的平均数统计描述统计描述3.众数(众数(Mode)定义:定义:定义:定义:众数是指一组数据中,出现次数最多的那个变量值。众数是指一组数据中,出现次数最多的那个变量值。众数是指一组数据中,出现次数最多的那个变量值。众数是指一组数据中,出现次数最多的那个

19、变量值。众数在描述数据集中趋势方面有一定的意义。众数在描述数据集中趋势方面有一定的意义。众数在描述数据集中趋势方面有一定的意义。众数在描述数据集中趋势方面有一定的意义。计算公式:计算公式:计算公式:计算公式:手工计算众数比较麻烦,需要统计数据的次数分布。手工计算众数比较麻烦,需要统计数据的次数分布。手工计算众数比较麻烦,需要统计数据的次数分布。手工计算众数比较麻烦,需要统计数据的次数分布。统计描述统计描述4.全距(全距(Range)定义:定义:定义:定义:全距也称为极差,是数据的最大值与最小值之间的绝全距也称为极差,是数据的最大值与最小值之间的绝全距也称为极差,是数据的最大值与最小值之间的绝全

20、距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的对差。在相同样本容量情况下的两组数据,全距大的对差。在相同样本容量情况下的两组数据,全距大的对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。一组数据要比全距小的一组数据更为分散。一组数据要比全距小的一组数据更为分散。一组数据要比全距小的一组数据更为分散。计算公式:计算公式:计算公式:计算公式:Range=Range=最大值最大值最大值最大值- -最小值最小值最小值最小值统计描述统计描述5.方差(方差(Variance)和标准差()和标准差(Standard Deviat

21、ion)定义:定义:定义:定义:方差是所有变量值与平均数偏差平方的平均值,它表示了方差是所有变量值与平均数偏差平方的平均值,它表示了方差是所有变量值与平均数偏差平方的平均值,它表示了方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方一组数据分布的离散程度的平均值。标准差是方差的平方一组数据分布的离散程度的平均值。标准差是方差的平方一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差根,它表示了一组数据关于平均数的平均离散程度。方差根,它表示了一组数据关于平均数的平均离散程度。方差根,它表示了一组数

22、据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数和标准差越大,说明变量值之间的差异越大,距离平均数和标准差越大,说明变量值之间的差异越大,距离平均数和标准差越大,说明变量值之间的差异越大,距离平均数这个这个这个这个“ “中心中心中心中心” ”的离散趋势越大。的离散趋势越大。的离散趋势越大。的离散趋势越大。统计描述统计描述5.方差(方差(Variance)和标准差()和标准差(Standard Deviation)计算公式:计算公式:计算公式:计算公式:总体方差:总体方差:总体方差:总体方差: 总体标准差:总体标准差:总体标准差:总体标准差:样本方差:样本方差:

23、样本方差:样本方差: 样本标准差:样本标准差:样本标准差:样本标准差:统计描述统计描述6.四分位数(四分位数(Quartiles)、十分位数)、十分位数(Deciles)和百分位数()和百分位数(Percentiles)定义:定义:定义:定义:四分位数是将一组个案由小到大(或由大到小)排序四分位数是将一组个案由小到大(或由大到小)排序四分位数是将一组个案由小到大(或由大到小)排序四分位数是将一组个案由小到大(或由大到小)排序后,用后,用后,用后,用3 3个点将全部数据分为四等份,与个点将全部数据分为四等份,与个点将全部数据分为四等份,与个点将全部数据分为四等份,与3 3个点上相对应的个点上相对

24、应的个点上相对应的个点上相对应的变量称为四分位数,分别记为变量称为四分位数,分别记为变量称为四分位数,分别记为变量称为四分位数,分别记为Q1Q1(第一四分位数)、(第一四分位数)、(第一四分位数)、(第一四分位数)、Q2Q2(第二四分位数)、(第二四分位数)、(第二四分位数)、(第二四分位数)、Q3Q3(第三四分位数)。其中,(第三四分位数)。其中,(第三四分位数)。其中,(第三四分位数)。其中,Q3Q3到到到到Q1Q1之间的距离的一半又称为四分位差,记为之间的距离的一半又称为四分位差,记为之间的距离的一半又称为四分位差,记为之间的距离的一半又称为四分位差,记为QQ。四分位。四分位。四分位。四

25、分位差越小,说明中间的数据越集中;四分位数越大,则意味差越小,说明中间的数据越集中;四分位数越大,则意味差越小,说明中间的数据越集中;四分位数越大,则意味差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。着中间部分的数据越分散。着中间部分的数据越分散。着中间部分的数据越分散。统计描述统计描述十分位数是将一组数据由小到大(或由大到小)排序十分位数是将一组数据由小到大(或由大到小)排序十分位数是将一组数据由小到大(或由大到小)排序十分位数是将一组数据由小到大(或由大到小)排序后,用后,用后,用后,用9 9个点将全部数据分为十等份,与个点将全部数据分为十等份,与个点将全部数据

26、分为十等份,与个点将全部数据分为十等份,与9 9个点位置上向对个点位置上向对个点位置上向对个点位置上向对应的变量称为十分位数,分别记为应的变量称为十分位数,分别记为应的变量称为十分位数,分别记为应的变量称为十分位数,分别记为D D1 1,D D2 2,D D9 9,表示,表示,表示,表示10%10%的数据落在的数据落在的数据落在的数据落在D D1 1下,下,下,下,20%20%的数据落在的数据落在的数据落在的数据落在D D2 2下,下,下,下,90%90%落落落落在在在在D D9 9下。下。下。下。百分位数是将一组数据由小到大(或由大到小)排序百分位数是将一组数据由小到大(或由大到小)排序百分

27、位数是将一组数据由小到大(或由大到小)排序百分位数是将一组数据由小到大(或由大到小)排序后分割为后分割为后分割为后分割为100100等份,与等份,与等份,与等份,与9999个分割点位置上相对应的变量称个分割点位置上相对应的变量称个分割点位置上相对应的变量称个分割点位置上相对应的变量称为百分位数,分别记为为百分位数,分别记为为百分位数,分别记为为百分位数,分别记为P P1 1,P P2 2,P P9 9,表示,表示,表示,表示1%1%的数据的数据的数据的数据落在落在落在落在P P1 1下,下,下,下,2%2%的数据落在的数据落在的数据落在的数据落在P P2 2下,下,下,下,99%99%落在落在

28、落在落在P P9999下。下。下。下。7.频数(频数(Frequency)定义:定义:定义:定义:频数就是一个变量在各个变量值上取值的个案数。如频数就是一个变量在各个变量值上取值的个案数。如频数就是一个变量在各个变量值上取值的个案数。如频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分要了解学生某次考试的成绩情况,需要计算出学生所有分要了解学生某次考试的成绩情况,需要计算出学生所有分要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数取值,以及每个分数取值有多少个人,这就需要用到频数取值,以及每个分

29、数取值有多少个人,这就需要用到频数取值,以及每个分数取值有多少个人,这就需要用到频数分析。数分析。数分析。数分析。变量的频数分析正是实现上述分析的最好手段,它可变量的频数分析正是实现上述分析的最好手段,它可变量的频数分析正是实现上述分析的最好手段,它可变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。以使人们非常清楚地了解变量取值的分布情况。以使人们非常清楚地了解变量取值的分布情况。以使人们非常清楚地了解变量取值的分布情况。统计描述统计描述统计描述统计描述8.8.峰度(峰度(峰度(峰度(KurtosisKurtosis)定义:定义:定义:定义:峰度是描述某

30、变量所有取值分布形态陡缓程度的统计量。峰度是描述某变量所有取值分布形态陡缓程度的统计量。峰度是描述某变量所有取值分布形态陡缓程度的统计量。峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为这个统计量是与正态分布相比较的量,峰度为这个统计量是与正态分布相比较的量,峰度为这个统计量是与正态分布相比较的量,峰度为0 0表示其数表示其数表示其数表示其数据分布与正态分布的陡缓程度相同;峰度大于据分布与正态分布的陡缓程度相同;峰度大于据分布与正态分布的陡缓程度相同;峰度大于据分布与正态分布的陡缓程度相同;峰度大于0 0表示比正表示比正表示比正表示比正态分布高峰要更加

31、陡峭,为尖顶峰;峰度小于态分布高峰要更加陡峭,为尖顶峰;峰度小于态分布高峰要更加陡峭,为尖顶峰;峰度小于态分布高峰要更加陡峭,为尖顶峰;峰度小于0 0表示比正表示比正表示比正表示比正态分布的高峰要平坦,为平顶峰。态分布的高峰要平坦,为平顶峰。态分布的高峰要平坦,为平顶峰。态分布的高峰要平坦,为平顶峰。计算公式:计算公式:计算公式:计算公式: 统计描述统计描述9.9.偏度(偏度(偏度(偏度(SkewnessSkewness)定义:定义:定义:定义:偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统偏度也是描述数据分布形态的,它

32、是描述某变量取值分布对称性的统偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。计量。计量。计量。计算公式:计算公式:计算公式:计算公式:这个统计量是与正态分布相比较的量,偏度为这个统计量是与正态分布相比较的量,偏度为这个统计量是与正态分布相比较的量,偏度为这个统计量是与正态分布相比较的量,偏度为0 0表示其数据分布表示其数据分布表示其数据分布表示其数据分布形态与正态分布偏度形态与正态分布偏度形态与正态分布偏度形态与正态分布偏度x x相同;偏度大于相同;偏度大于相同;偏度大于相同;偏度大于0 0表示正偏差数值较大,为正表示正偏差数值较大,为正表示正偏差数值较大,为正表示正偏差数

33、值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于偏或右偏,即有一条长尾巴拖在右边;偏度小于偏或右偏,即有一条长尾巴拖在右边;偏度小于偏或右偏,即有一条长尾巴拖在右边;偏度小于0 0表示负偏差数值大,表示负偏差数值大,表示负偏差数值大,表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。分布形态的偏斜程度越大。分布形态的偏斜程度越大。分布形态的偏斜程度越大。 统计

34、描述统计描述10.10.标准化标准化标准化标准化Z Z分数及其线性转换分数及其线性转换分数及其线性转换分数及其线性转换定义:定义:定义:定义:Z Z分数定义:从平均数为分数定义:从平均数为分数定义:从平均数为分数定义:从平均数为 ,标标标标准差准差准差准差为为为为 的的的的总总总总体中抽出体中抽出体中抽出体中抽出一个一个一个一个变变变变量量量量值值值值x x,Z Z分数表示的是此分数表示的是此分数表示的是此分数表示的是此变变变变量大于或小于平均数量大于或小于平均数量大于或小于平均数量大于或小于平均数几个几个几个几个标标标标准差。由于准差。由于准差。由于准差。由于Z Z分数分母的分数分母的分数分

35、母的分数分母的单单单单位与分子相同,故位与分子相同,故位与分子相同,故位与分子相同,故Z Z分分分分数没有数没有数没有数没有单单单单位,因此能位,因此能位,因此能位,因此能够够够够用来比用来比用来比用来比较较较较两个从不同两个从不同两个从不同两个从不同单单单单位位位位总总总总体中抽体中抽体中抽体中抽出的出的出的出的变变变变量量量量值值值值。计算公式:计算公式:计算公式:计算公式: 将原始数据直接转换为将原始数据直接转换为将原始数据直接转换为将原始数据直接转换为Z Z分数时,常会出现负数和带分数时,常会出现负数和带分数时,常会出现负数和带分数时,常会出现负数和带小数点的值,实际使用起来很不方便。

36、因此,在有些情况小数点的值,实际使用起来很不方便。因此,在有些情况小数点的值,实际使用起来很不方便。因此,在有些情况小数点的值,实际使用起来很不方便。因此,在有些情况下,可以对下,可以对下,可以对下,可以对Z Z分数进一步加以线性转换,使之称为正的数分数进一步加以线性转换,使之称为正的数分数进一步加以线性转换,使之称为正的数分数进一步加以线性转换,使之称为正的数值。最典型的一种值。最典型的一种值。最典型的一种值。最典型的一种Z Z分数线性转换就是分数线性转换就是分数线性转换就是分数线性转换就是T T分数。分数。分数。分数。计算公式:计算公式:计算公式:计算公式: 基础示例基础示例数据说明:数据说明:湖南柿竹园矿区湖南柿竹园矿区1:5万化探数据,共万化探数据,共961样,每样分析样,每样分析20个元素。个元素。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号