线性计算方法

上传人:鲁** 文档编号:456779226 上传时间:2023-05-15 格式:DOC 页数:18 大小:1.24MB
返回 下载 相关 举报
线性计算方法_第1页
第1页 / 共18页
线性计算方法_第2页
第2页 / 共18页
线性计算方法_第3页
第3页 / 共18页
线性计算方法_第4页
第4页 / 共18页
线性计算方法_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《线性计算方法》由会员分享,可在线阅读,更多相关《线性计算方法(18页珍藏版)》请在金锄头文库上搜索。

1、第八章 线 性 相 关前面着重于描述某一变量的统计特征或比较该变量的组间差别两个随机变量之间的关系:如体重与肺活量、年龄与血压是否存在线性联系?正向还是负向?联系的程度?线性相关(linear correlation):线性联系?方向?程度?8.1 线 性 相 关 概 念1 独立随机的双变量正态分布样本 讨论两个变量X和Y的相关性。样本:独立的、成对的观察值 (x1,y1),(x2,y2),(xn,yn)例8.1 为讨论父子身高间的线性相关程度,南方某地在应届中学毕业生花名册中随机抽取20名男生,分别测量他们和他们的父亲的身高(cm),得样本资料如表8.1所示。表8.1 20对父子的身高(cm

2、)数据编号1 2 3 4 5 6 7 8 9 10父高X150 153 155 158 161 164 165 167 168 169子高Y159 157 163 166 169 170 169 167 169 170编号11 12 13 14 15 16 17 18 19 20父高X170 171 172 174 175 177 178 181 183 185子高Y173 170 170 176 178 174 173 178 176 180问如何保证这是一份可供讨论线性相关的合格样本?解 (1)随机抽取;(2)互相独立? 2 散点图 (scatter plot) 座标轴:分别表示两个变量;

3、 n个点:构成一幅散点图(图8.1) 图8.2 典型散点图图(a)和(c),正相关(positive correlation) 图(b)和(d),负相关(negative correlation)图(e) 、(f) 、(g),Y和X无关联图 (h),可能存在曲线型联系。通常所说的相关就是线性相关,(e)到(h)均属不相关对于不相关的情形,宜进一步澄清是否为曲线关系8.2 相 关 系 数Pearson积矩相关系数(product-moment correlation coefficient) 对双变量正态分布变量X和Y (8.1)总体相关系数,记为rr0,X和Y无线性相关或零相关(null co

4、rrelaton)r 0, 正相关r 20,也可将rs直接代替式(8.4)和(8.5)中的r作t检验或查r界值表。例8.5 肝癌病因研究,调查了10个乡肝癌死亡率(1/10万)与某种食物中黄曲霉毒素相对含量(以最高含量为10), 试作等级相关分析。解 表8.2 等级相关系数计算表 编号(1) 黄曲霉毒素 肺癌死亡率X(相对含量)(2)秩次p(3)Y (1/10万) (4) 秩次q (5)d(6)=(3)-(5)d 2(7)=(6)2 1 2 3 4 5 6 7 8 9 10 0.7 1.0 1.7 3.7 4.0 5.1 5.5 5.7 5.910.0 1 2 3 4 5 6 7 8 910

5、21.5 18.9 14.4 46.5 27.3 64.6 46.3 34.2 77.6 55.1 3 2 1 7 4 9 6 5 10 8 -2 0 2 -3 1 -3 1 3 -1 2 4 0 4 9 1 9 1 9 1 4合计42第、栏,若有观察值相同,则取平均秩次。第、栏, 求每对秩次的差值d、d2和d2按式(8.8)计算统计量rs本例n10,查rs界值表,得0.02P0.01,按0.05水准拒绝Ho,可以认为黄曲霉毒素与肝癌死亡率间存在正相关。2. 相同秩次较多时rs的计算当和中存在相同秩次时,(8.8)式不再适用,应利用秩次和直接计算积矩相关系数。当中不存在相同秩次以及中也不存在相

6、同秩次时,这样算得的和利用(8.8)式计算的结果完全一致。3. r与rs的区别与联系 区别: 积矩相关要求数据服从双变量正态分布,属于参数统计量;等级相关并不要求正态分布,属于非参数统计量。8.5 线性相关分析的注意事项1. 散点图的重要性 并非任何有联系的两个变量都属线性联系。如果从散点图可初步看出变量分布非正态,则应考虑作等级相关而不宜作积矩相关。当散点图中出现异常点(outlier)时要慎重处理。必要时可通过等级相关来减小异常点的不良影响2. 变量取值非随机时莫作相关 例如,为研究药物的剂量-反应关系,人们选定n种剂量,观察每种剂量下动物的反应;又如,摸索化学反应的适宜条件,人们选定几种温度,观察各温度下生成物的数量。此时得到的数据就不是随机样本,即使按样本相关系数的公式计算,所得结果并不接近总体相关系数,而可能因人为选定变量值的范围不同而不同。3. 对相关的解释一定要结合专业背景,切不可把任意两个变量拉在一起盲目下结论。例如,某人喜得贵子,庭前种一小树,每月测子高与树高,计算发现子高与树高间的相关有统计意义,难道两者真有内在联系?统计学上的关联性,不一定是因果联系。样本足够大时绝对值较小的样本相关系数也易于得到较小的P值,有统计学意义并不一定反映相关就很密切.4. 慎重合并分层资料 图8.3 慎用相关的情形 (a)异常值 (b)、(c)、(d)分层资料

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题 > 初中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号