《厦门大学应用多元统计分析第多元正态分布的参数估计》由会员分享,可在线阅读,更多相关《厦门大学应用多元统计分析第多元正态分布的参数估计(63页珍藏版)》请在金锄头文库上搜索。
1、第二章 多元正态分布的参数估计第一节第一节 引言引言 第二节第二节 基本概念基本概念第三节第三节 多元正态分布多元正态分布第四节第四节 多元正态分布的参数估计多元正态分布的参数估计第五节第五节 多元正态分布参数估计的多元正态分布参数估计的 实例与计算机实现实例与计算机实现第一节第一节 引言引言 n多元统计分析涉及到的都是随机向量或多个随机向量放在一多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵。例如在研究公司的运营情况时,要考虑起组成的随机矩阵。例如在研究公司的运营情况时,要考虑公司的获利能力、资金周转能力、竞争能力以及偿债能力等公司的获利能力、资金周转能力、竞争能力以及
2、偿债能力等财务指标;又如在研究国家财政收入时,税收收入、企业收财务指标;又如在研究国家财政收入时,税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等都是需贷款归还收入、国家预算调节基金收入、其他收入等都是需要同时考察的指标。显然,如果我们只研究一个指标或是将要同时考察的指标。显然,如果我们只研究一个指标或是将这些指标割裂开分别研究,是不能从整体上把握研究问题的这些指标割裂开分别研究,是不能从整体上把握研究问题的实质的,解决这些问题就需要多元统计分析方法。为了更好实质的,解决这些问
3、题就需要多元统计分析方法。为了更好的探讨这些问题,本章我们首先论述有关随机向量的基本概的探讨这些问题,本章我们首先论述有关随机向量的基本概念和性质。念和性质。n在实用中遇到的随机向量常常是服从正态分布或近似正态分在实用中遇到的随机向量常常是服从正态分布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于正态分布,或虽本身不是正态分布,但它的样本均值近似于正态分布。因此现实世界中许多实际问题的解决办法都是以总体服布。因此现实世界中许多实际问题的解决办法都是以总体服从正态分布或近似正态分布为前提的。在多元统计分析中,从正态分布或近似正态分布为前提的。在多元统计分析中, 多元正态分布占有很重要
4、地位,本书所介绍的方法大都假定多元正态分布占有很重要地位,本书所介绍的方法大都假定数据来之多元正态分布。为此,本章将要介绍多元正态分布数据来之多元正态分布。为此,本章将要介绍多元正态分布的定义和有关性质。的定义和有关性质。n 然而在实际问题中,多元正态分布中均值向量和协差阵通常然而在实际问题中,多元正态分布中均值向量和协差阵通常是未知的,一般的做法是由样本来估计。这是本章讨论的重是未知的,一般的做法是由样本来估计。这是本章讨论的重要内容之一,在此我们介绍最常见的最大似然估计法对参数要内容之一,在此我们介绍最常见的最大似然估计法对参数进行估计,并讨论其有关的性质。进行估计,并讨论其有关的性质。第
5、二节第二节 基本概念基本概念一一 随机向量随机向量二二 多元分布多元分布三三 随机向量的数字特征随机向量的数字特征 一、随机向量一、随机向量n我们所讨论的是多个变量的总体,所研究的数据是同时我们所讨论的是多个变量的总体,所研究的数据是同时p个个指标(变量),又进行了指标(变量),又进行了n次观测得到的,我们把这个次观测得到的,我们把这个p指标指标表示为表示为X1 ,X2,Xp,常用向量,常用向量X = (X1 , X2 , , XP)n表示对同一个体观测的表示对同一个体观测的p个变量。这里我们应该强调,在多个变量。这里我们应该强调,在多元统计分析中,仍然将所研究对象的全体称为总体,它是由元统计
6、分析中,仍然将所研究对象的全体称为总体,它是由许多(有限和无限)的个体构成的集合,如果构成总体的个许多(有限和无限)的个体构成的集合,如果构成总体的个体是具有体是具有p个需要观测指标的个体,我们称这样的总体为个需要观测指标的个体,我们称这样的总体为p维维总体(或总体(或p元总体)。上面的表示便于人们用数学方法去研元总体)。上面的表示便于人们用数学方法去研究究p维总体的特性。这里维总体的特性。这里“维维”(或(或“元元”)的概念,表示)的概念,表示共有几个分量。若观测了共有几个分量。若观测了n个个体,则可得到如表个个体,则可得到如表2.1的数据,的数据,称每一个个体的称每一个个体的p个变量为一个
7、样品,而全体个变量为一个样品,而全体n个样品组成一个样品组成一个样本。个样本。 n n 二、多元分布二、多元分布n n n n n n n n n n n n 三、随机向量的数字特征三、随机向量的数字特征 n n n n n n n n 第三节第三节 多元正态分布多元正态分布一一 多元正态分布的定义多元正态分布的定义 二二 多元正态分布的性质多元正态分布的性质 一、多元正态分布的定义一、多元正态分布的定义n n n n n 二、多元正态分布的性质二、多元正态分布的性质 n n n n 第四节第四节 多元正态分布的参数估多元正态分布的参数估 计计 一一 多元样本的数字特征多元样本的数字特征 二二
8、 均值向量与协差阵的最大似然估计均值向量与协差阵的最大似然估计 三三 Wishart分布分布 一、多元样本的数字特征一、多元样本的数字特征 n n n 二、均值向量与协差阵的最大似然二、均值向量与协差阵的最大似然 估计估计 n n n n n n n 三、三、Wishart分布分布n n n n n 第五节第五节 多元正态分布参数估计多元正态分布参数估计 的实例与计算机实现的实例与计算机实现 一一 均值向量的估计均值向量的估计二二 协差阵的估计协差阵的估计 n通过上面的理论分析知道,多元正态总体均值向量和协差阵通过上面的理论分析知道,多元正态总体均值向量和协差阵的最大似然估计分别是样本均值向量
9、和样本协差阵。利用的最大似然估计分别是样本均值向量和样本协差阵。利用SPSS软件可以迅速地计算出多元分布的样本均值向量、样本软件可以迅速地计算出多元分布的样本均值向量、样本离差阵和样本协差阵。下面通过一个实例来说明多元正态分离差阵和样本协差阵。下面通过一个实例来说明多元正态分布参数估计的布参数估计的SPSS实现过程。实现过程。n从沪深两市上市公司中随机抽取从沪深两市上市公司中随机抽取300家公司,取其三个反映家公司,取其三个反映收益情况的三个财务指标:每股收益率(收益情况的三个财务指标:每股收益率(eps)、净资产收)、净资产收益率(益率(roe)和总资产收益率()和总资产收益率(roa)。现
10、要求对这三个指标)。现要求对这三个指标的均值和协差阵进行估计。的均值和协差阵进行估计。一、均值向量的估计一、均值向量的估计n在在SPSS中计算样本均值向量的步骤如下:中计算样本均值向量的步骤如下:1. 选择菜单项选择菜单项AnalyzeDescriptive StatisticsDescriptives,打开,打开Descriptives对话框,如图对话框,如图2.1。将待估计的三个变量。将待估计的三个变量移入右边的移入右边的Variables列表框中。列表框中。图图2.1 Descriptives对话框对话框2. 单击单击Options按钮,打开按钮,打开Options子对话框,如图子对话框
11、,如图2.2所示。所示。在对话框中选择在对话框中选择Mean复选框,即计算样本均值向量。单击复选框,即计算样本均值向量。单击Continue按钮返回主对话框。按钮返回主对话框。图图2.2 Options子对话框子对话框3. 单击单击OK按钮,执行操作。则在结果输出窗口中给出样本按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表均值向量,如表2.2。即样本均值向量为(。即样本均值向量为(0.175,0.044,0.026)。)。表表2.2 样本均值向量样本均值向量二、协差阵的估计二、协差阵的估计n在在SPSS中计算样本协差阵的步骤如下:中计算样本协差阵的步骤如下:1. 选择菜单项选择菜单项
12、AnalyzeCorrelateBivariate,打开,打开Bivariate Correlations对话框,如图对话框,如图2.3。将三个变量移入右。将三个变量移入右边的边的Variables列表框中。列表框中。 图图2.3 Bivariate Correlations对话框对话框2. 单击单击Options按钮,打开按钮,打开Options子对话框,如图子对话框,如图2.4。选择。选择Cross-product deviations and covariances复选框,即计算样复选框,即计算样本离差阵和样本协差阵。单击本离差阵和样本协差阵。单击Continue按钮,返回主对话框。按钮
13、,返回主对话框。图图2.4 Options子对话框子对话框3. 单击单击OK按钮,执行操作。则在结果输出窗口中给出相关按钮,执行操作。则在结果输出窗口中给出相关分析表。表中分析表。表中Pearson Correlation给出皮尔逊相关系数矩阵,给出皮尔逊相关系数矩阵,Sum of Squares and Cross-products给出样本离差阵,给出样本离差阵,Covariance给出样本协差阵。给出样本协差阵。n值得注意的是,这里给出的样本协差阵是值得注意的是,这里给出的样本协差阵是S/(n-1) ,而不是,而不是S/n 。表表2.3 样本相关系数矩阵、离差阵与协差阵样本相关系数矩阵、离差阵与协差阵本章结束本章结束