《协方差相关系数和矩》由会员分享,可在线阅读,更多相关《协方差相关系数和矩(12页珍藏版)》请在金锄头文库上搜索。
1、4.3 协方差、相关系数和矩协方差、相关系数和矩 一、协方差和相关系数的概念一、协方差和相关系数的概念 对于二维随机变量对于二维随机变量 ,除了关心它的各个分,除了关心它的各个分量的数学期望和方差外,还需要知道这两个分量之量的数学期望和方差外,还需要知道这两个分量之间的相互关系,这种关系无法从各个分量的期望和间的相互关系,这种关系无法从各个分量的期望和方差来说明,这就需要引进描述这两个分量之间相方差来说明,这就需要引进描述这两个分量之间相互关系的数字特征互关系的数字特征协方差及相关系数,但如何协方差及相关系数,但如何来刻画这种关系呢?来刻画这种关系呢? 由由(4-17)知知,若若 相互独立相互
2、独立,则则 ;若若 ,则表示则表示X与与Y不独立不独立,X与与Y之间之间存在着一定的关系存在着一定的关系.据此据此,我们引入下列定义我们引入下列定义 定义定义4.6 设设 是二维随机变量,是二维随机变量, 则称则称 为为X与与Y的的协方差协方差(Covariance),记为),记为 或或 , 即即 (420)若若 且且 ,则称,则称 (421)为为X与与Y的的相关系数相关系数(Correlation Coefficient) 是是有量纲的量,而有量纲的量,而 则是无量纲的量则是无量纲的量 协方差常用下列公式计算协方差常用下列公式计算 事实上,事实上, 定理定理4.1 (柯西柯西许瓦兹(许瓦兹(
3、CauchySchwarz)不等式)不等式)(X,Y)为二维随机变量,若)为二维随机变量,若 和和 存在,则存在,则 (428) 证明证明 因为因为 , 所以所以 存在存在. 另一方面另一方面,对对任意任意 ,二次三项式,二次三项式 , (429) 可见上述关于可见上述关于的二次三项式不可能有两个不同的实根的二次三项式不可能有两个不同的实根,因而判别式因而判别式即有即有 定理定理4.2 设(设(X,Y)是二维随机变量,若)是二维随机变量,若X与与Y的相关系的相关系数数 存在,则存在,则(1) (430)(2) 的充要条件是存在常数的充要条件是存在常数 使使 证明证明 (1) 由定理由定理4.1
4、知知 ,因此因此 , 即即 ,所以,所以 (2)我们略去结论()我们略去结论(2)的充分性证明,这里只给出必要)的充分性证明,这里只给出必要性的证明:性的证明: 将二次三项式(将二次三项式(429)中的)中的X和和Y分别换为分别换为 和和 则对任意则对任意 ,有,有 ,即即 .特别地,当特别地,当 等于二次三项式的最小值点等于二次三项式的最小值点 时,上时,上式变为式变为 由于由于 ,故,故 . 根据方差性质根据方差性质4,有有 即即 于是于是, 存在常数存在常数 和和 使使 显然,利用(显然,利用(431)亦可证()亦可证(430)的结论成立)的结论成立. 不过不过,给出(给出(431)的主
5、要目的还在于证明结论()的主要目的还在于证明结论(2)的必要性)的必要性. 定理定理4.2表明:表明:X与与Y的相关系数是衡量的相关系数是衡量X与与Y之间线性相关之间线性相关程度的量当程度的量当 时,时,X与与Y依概率依概率1线性相关;特别当线性相关;特别当 时时,Y随随X的增大而线性增大的增大而线性增大,此时称此时称X与与Y线性正相关线性正相关(Positive Correlation);当当 时时,Y随随X的增大而线性地减的增大而线性地减小,此时称小,此时称X与与Y线性负相关线性负相关(Negative Correlation);当当 变变小小时时,X与与Y的线性相关程度就变弱的线性相关程
6、度就变弱;如果如果 =0,X与与Y之间就不存之间就不存在线性关系,此时称在线性关系,此时称X与与Y不相关不相关(Uncorrelated) 需要指出的是需要指出的是:这里的不相关这里的不相关,指的是从线性关系上看没有指的是从线性关系上看没有关联关联,并非并非X与与Y之间没有任何关系之间没有任何关系,也许此时还存在别的关系也许此时还存在别的关系 独立与不相关都是随机变量之间相互联系程度的一种反映独立与不相关都是随机变量之间相互联系程度的一种反映,独立指的是独立指的是X与与Y没有任何关系,不相关指的没有任何关系,不相关指的X与与Y之间没有线之间没有线性相关关系性相关关系 事实上,若事实上,若X与与
7、Y独立,则独立,则X与与Y一定不相关(这可以利用一定不相关(这可以利用(410)和()和(419)进行证明);但反过来,若)进行证明);但反过来,若X与与Y不相不相关,则关,则X与与Y却未必独立却未必独立 然而,对于二维正态随机变量然而,对于二维正态随机变量 而言,而言,X与与Y的独立性的独立性与不相关性却是等价的,我们有如下结果:与不相关性却是等价的,我们有如下结果: 定理定理4.3 设设 则则 (432) 证明证明 显然,我们有显然,我们有 ,而,而 推论设推论设 ,则,则X与与Y相互独立的相互独立的充要条件是充要条件是X与与Y不相关不相关 证明证明 由定理由定理3.3知知, 若若 ,则,
8、则X与与Y相互独立的充要条件是相互独立的充要条件是 ,由定理,由定理4.3知知, ,因,因此,此,X与与Y相互独立的充要条件是相互独立的充要条件是X与与Y不相关不相关 根据上面的讨论,二维正态随机变量根据上面的讨论,二维正态随机变量 的概率密度中的概率密度中的参数的参数 就是就是X和和Y的相关系数,因而二维正态随机变量的相关系数,因而二维正态随机变量 的分布就完全可由的分布就完全可由X和和Y的数学期望、方差以及它们的相关系的数学期望、方差以及它们的相关系数所确定数所确定 随机变量除了前面介绍的数学期望、方差、协方差以及它随机变量除了前面介绍的数学期望、方差、协方差以及它们的相关系数等数字特征外
9、,还存在许多其它的数字特征们的相关系数等数字特征外,还存在许多其它的数字特征,下下面介绍另外几种常见的数字特征面介绍另外几种常见的数字特征 三、矩的概念三、矩的概念 1. k阶原点矩阶原点矩 定义定义4.7 设设X是随机变量,若是随机变量,若 ( )存在)存在,则称它为则称它为X的的 阶原点矩阶原点矩,简称,简称 阶矩,记为阶矩,记为 ,即,即 (433)显然,显然,X的数学期望是的数学期望是X的一阶原点矩,即的一阶原点矩,即 2. 阶中心矩阶中心矩 定义定义4.8 设设X是随机变量,若是随机变量,若 ( , )存存在,在, 则称它为则称它为X的的k阶中心矩阶中心矩,记为,即,记为,即 , (
10、434)显然,显然,X的方差是的方差是X的二阶中心矩,即的二阶中心矩,即 3. 阶原点混合矩阶原点混合矩定义定义4.9 设设 是二维随机变量,若是二维随机变量,若 ( ,)存在,则称它为存在,则称它为X 与与Y的的 阶阶混合原点矩混合原点矩,简称,简称 阶混阶混合矩,记为合矩,记为 ,即,即 (435)由由 可知,协方差可用可知,协方差可用( )的的1+1阶混阶混合原点矩合原点矩X与与Y和的一阶原点矩表示和的一阶原点矩表示4. 阶中心混合矩阶中心混合矩定义定义4.10 设设 是二维随机变量,若是二维随机变量,若 ( )存在,则称它为存在,则称它为X与与Y的的 阶阶混合中心矩混合中心矩 记为记为 ,即,即 (436)显然,显然,X与与Y的协方差是的协方差是X与与Y的的1+1阶混合中心矩,即阶混合中心矩,即由上可以看到,前面介绍的一些数字特征(如数学期望、方差、由上可以看到,前面介绍的一些数字特征(如数学期望、方差、协方差等)均可用矩来表示,可见矩是最广泛的一种数字特协方差等)均可用矩来表示,可见矩是最广泛的一种数字特征,在概率论和数理统计的研究中应用广泛征,在概率论和数理统计的研究中应用广泛