线性回归与相关性分析要点

上传人:大米 文档编号:460866042 上传时间:2023-02-14 格式:DOCX 页数:16 大小:545.34KB
返回 下载 相关 举报
线性回归与相关性分析要点_第1页
第1页 / 共16页
线性回归与相关性分析要点_第2页
第2页 / 共16页
线性回归与相关性分析要点_第3页
第3页 / 共16页
线性回归与相关性分析要点_第4页
第4页 / 共16页
线性回归与相关性分析要点_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《线性回归与相关性分析要点》由会员分享,可在线阅读,更多相关《线性回归与相关性分析要点(16页珍藏版)》请在金锄头文库上搜索。

1、YUNNAN NORMAL U NIVERSITY本科学生实验报告学号: #姓名: 学院:生命科学学院专业、班级:11级应用生物教育A班实验课程名称:生物统计学实验教 师:孟丽华(教授)开课学期: 2012 至 2013 学年 下 学期填 报 时 间: 2013年5月 22日云南师范大学教务处编印实验设计方案实验序号及名称:实验十:线性回归与相关性分析实验时间2013-05-17实验室睿智楼3幅S 326(一)、实验目的:1、能够熟练的使用SPSS软件对实验数据进行线性回归分析和相关性分析;2、掌握线性回归与相关性分析的基本思想和具体操作,能够读懂分析结果,并写出回归方程,对回归方程进行各种统

2、计检验;3、进一步熟悉SPSS软件的应用。(二)、实验设备及材料:微机、SPSS for Windows V 18.0统计软件包及相应的要统计的数据(三)、实验原理:1、统计学上采用相关分析(correlation analysis)研究呈平行关系的相关变量之间的关系。2、对两个变量间的直线关系进行相关分析称为简单相关分析(也叫直线 相关分析);对多个变量进行相关分析时,研究一个变量与多个变量间的线性 相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关 称为偏相关分析;3、相关性分析是考察两个变量之间线性关系的一种统计分析方法。更 精确地说,当一个变量发生变化时,另一个变量如

3、何变化,此时就需要通过计 算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相 关而言的。一般假设检验的显著性水平为 0.05,你只需要拿p值和0.05进行比 较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他 们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系, 至于相关的程度则要看相关系数 R值,r越大,说明越相关。越小,则相关程度 越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量 的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分 析相似;4、对于两个相关变量,一个变量用 x表示,另

4、一个变量用y表示,如 果通过试验或调查获得两个变量的 n对观测值:(x1, y1), (x2, y2), , (xn, yn);为了直观地看出x和y间的变化趋势,可将每一对 观测 值在平 面直 角坐标系描点,作出散点图;5、从散点图可以看出:两个变量间有关或无关;若有关,两个变量间关 系类型,是直线型还是曲线型;两个变量间直线关系的性质(是正相关还是 负相关)和程度(是相关密切还是不密切);散点图直观地、定性地表示了两个 变量之间的关系。为了探讨它们之间的规律性,还必须根据观测值将其内在关 系定量地表达出来;6、利用直线回归方程进行预测或控制时,一般只适用于原来研究的范 围,不能随意把范围扩大

5、,因为在研究的范围内两变量是直线关系,这并不能 保证在这研究范围之外仍然是直线关系。若需要扩大预测和控制范围,则要有 充分的理论依据或进一步的实验依据。利用直线回归方程进行预测或控制,一般只能内插,不要轻易外延;7、进行直线相关分析的基本任务在于根据 x、y的实际观测值,计算表 示两个相关变量x、y 线性相关程度和性质的统计量一一相关系数 r并进行显 著性检验;8、根据实际观测值计算得来的相关系数 r是样本相关系数,它是双变 量正态总体中的总体相关系数p的估计值。样本相关系数r是否来自p *0的总 体,还须对样本相关系数r进行显著性检验。此时无效假设、备择假设为: HO: p=0,HA: p

6、W0。与直线回归关系显著性检验一样,可采用 t检验法与F检验 法对相关系数r的显著性进行检验;9、直线回归分析将二个相关变量区分为自变量和依变量,侧重于寻求它们之间的联系形式一直线回归方程;直线相关分析不区分自变量和依变量, 侧重于揭示它们之间的联系程度和性质一一计算出相关系数。两种分析所进行的显著性检验都是解决y与x问是否存在直线关系。因而二者的检验是等价的。即相关系数显著,回归系数亦显著;相关系数不显著,回归系数也必然不显著;10、应用直线回归与相关的注意事项:直线回归分析与相关分析在生物科学研究领域中已得到了广泛的应用,但在实际工作中却很容易被误用或作出 错误的解释。为了正确地应用直线回

7、归分析和相关分析这一工具,必须注意以下几点:1)、变量间是否存在相关;2)、其余变量尽量保持一致;3)、观测值要尽可能的多;4)、外推要谨慎;5)、正确理解回归或相关显著与否的含义;6)、一个显著的回归方程并不一定具有实践上的预测意义;(四)、实验内容:内容:生物统计学(第四版)138页第七章习题7.4和习题7.6实验方法步骤(一)、习题 7.41、启动 spss软件:开始一所有程序一 SPSStspss for windowsspss 18.0 for windows,直接进入SPSS数据编辑窗口进行相关操作;2、定义变量,输入数据。点击“变量视图”定义变量工作表,用“ namS 命令定义变

8、量“ X” (小数点零位),标签:“ 4月下旬平均气温/C” ;变量 7 (小数点零位),标签:“5月上旬50株棉财虫数/头”,点击“变量视图工作表”, 一一对应将不同“ X”气温与“Y棉财虫数的数据依次输入到单元格中;3、设置分析变量。数据输入完后,点菜单栏:”分析()” 一 “回归(f)” 一 “线性(!)”,将“5月上旬50株棉财虫数(Y)”移到因变量列表(D)中, 将“4月下旬平均气温(X)”移入自变量列表(I)中进行分析;1)、点“统计量(S)”,回归系数:在“估计(E)”、“置信区间 水平() 95” 前打钩,“模型拟合性(M)”、“描述性”前打钩,残差:个案诊断(C)前打钩, 点

9、“所有个案”,点“继续”;2)、点”绘制(T)”,将 DEPENDNP” 移入 “Y (Y)” 歹U表中,将 “ ZPRED” 移入“X2 (X)”中,标准化残差图:在“直方图(H)”、“正太概率图(R)”前打 钩,点“继续”;3)、点“保存(S)”,所有的默认,点“继续”;4)、点“选项(O)”,所有的都默认,点“继续”,然后点击“确定”便出结果;统计量(S)绘制(T)选项(O)(默认)步进方法标准使用F的概率进入但):|段 |删除如:叵。使用F值的y在等式中包含常量。缺失值但按列表排除个案ty0按对排除个案 o使用均值替换-J取消:球助保存(S)(默认)(二)、习题 7.61、启动 sps

10、s软件:开始一所有程序一 SPSStspss for windowsspss 18.0 forwindows,直接进入SPSS数据编辑窗口进行相关操作;2、定义变量,输入数据。点击“变量视图”定义变量工作表,用“namS命令定义变量“维生素C的含量”(小数点两位);变量“受冻情况”(小数点零 位),“未受冻”赋值为“ 1”,“受冻”赋值为“ 2”,点击“变量视图工作表”, 一一对应将不同“未受冻”与“受冻”的维生素C的含量数据依次输入到单元格中;3、设置分析变量。数据输入完后,点菜单栏:”分析(A)” 一 “相关(C)” 一 “双变量(巨)”,将“维生素C含量”、“受冻情况”变量(V)列表中,

11、相关 系数:“Pearsod前打钩,显著性检验:双侧检验(T)前打钩,”标记显著性相关 (F)前打钩”,点“选项(O)”,统计量:在“均值和标准差(M)”前打钩, 缺失值:在“按对排除个案(P)”前打钩,点“继续”,然后点击“确定”便出结 果。选项(Q“图形(G)” 一 “旧对话框(L)” 一 “散点/点状(S)散点图/点图1统计量7恂值和标准差:_叉枳偏差和忧方差缺失值按时排除个案0O模列表排除个案回续J 取消 帮助简单散点图4、表格绘制出来后,进行检查修改,将其复制到实验报告中,将虚框隐藏5、将所求的描述性统计指标数据表格保存,对其所求得的结果进行分析, 书写实验报告。(五)、实验结果:回

12、归表1描述性统同均值标准偏差N5月上旬棉甥虫数4月下旬平均气温56.6418.85557.1132.68191111表2相关性5月上旬棉甥虫数4月下旬平均气温Pearson相关性5月上旬棉甥虫数4月下旬平均气温1.000.858.8581.000Sig.(单侧)5月上旬棉甥虫数4月下旬平均气温.000.000. 1N5月上旬棉甥虫数4月下旬平均气温11111111输入/移去的变量模型输入的变量移去的变量方法14月下旬平均气温.输入a.已输入所有请求的变量。b.因变量:5月上旬棉甥虫数模型汇总b模型RR方调整R方标准估计的误 差1.858 a.737.70730.903b.因变量:5月上旬棉甥虫

13、数a.预测变量:(常量),4月下旬平均气温。bAnova模型平方和df均方FSig.1回归24023.684124023.68425.156.001 a残差8594.8629954.985总计32618.54510a.预测变量:(常量),4月下旬平均气温。b.因变量:5月上旬棉甥虫数系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)-287.94369.331-4.153.002-444.780-131.1064月下旬平均气温18.2763.644.8585.016.00110.03326.518a.因变量:5月上旬棉甥虫数残差统计量a极小值极大值

14、均值标准偏差N预测值20.92198.1956.6449.01411残差-49.12252.705.00029.31711标准预测值-.7292.888.0001.00011标准残差-1.5901.706.000.94911a.因变量:5月上旬棉甥虫数案例诊断案例数目标准残差5月上旬棉甥虫 数预测值残差1.6878664.7821.2232-.038197198.19-1.1903-1.128842.85-34.8474-.0342930.05-1.0545-.1262831.88-3.8816.0672320.922.0847-1.5901261.12-49.1228-.8151439.19-25.19191.0396431.88

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题 > 初中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号