生物统计上机操作 相关分析与回归分析

上传人:206****923 文档编号:37640566 上传时间:2018-04-20 格式:DOC 页数:9 大小:204.50KB
返回 下载 相关 举报
生物统计上机操作 相关分析与回归分析_第1页
第1页 / 共9页
生物统计上机操作 相关分析与回归分析_第2页
第2页 / 共9页
生物统计上机操作 相关分析与回归分析_第3页
第3页 / 共9页
生物统计上机操作 相关分析与回归分析_第4页
第4页 / 共9页
生物统计上机操作 相关分析与回归分析_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《生物统计上机操作 相关分析与回归分析》由会员分享,可在线阅读,更多相关《生物统计上机操作 相关分析与回归分析(9页珍藏版)》请在金锄头文库上搜索。

1、研究生研究生生物统计学生物统计学课程课程 第六讲第六讲 相关分析与回归分析相关分析与回归分析主要内容:、 线性相关分析1、 两变量相关分析2、 多变量相关分析、 回归分析1、 一元线性回归分析2、 多元线性回归分析3、 曲线回归分析一、线性相关分析一、线性相关分析:用于研究变量之间密切程度的统计方法:用于研究变量之间密切程度的统计方法 使用使用 SPSS 中中 Correlate模块模块相关系数是以数值的方式精确地反映两个变量之间线性关系的强弱程度,利用相关系数进行变量间线性关系的分析,即相关分析。包括两个步骤:计算样本的相关系数r;对两样本来自的总体是否存在显著的线性关系进行推断。Pears

2、on 简单相关系数:计算连续变量或等间距测度的变量之间的相关系数(系统默认);Kendall 相关系数:等级相关系数,只能在两变量均属于有序分类时使用;Spearman 等级相关系数:度量定序型变量间的线性相关关系,非参数相关分析。(一)两变量相关分析1、案例分析:有人研究黏虫孵化历期平均温度(x, )与历期天数(y, d)之间的关系,求出平均温度与历期天数的线性相关系数x,平均温度()11.814.715.616.817.118.819.520.4y, 历期天数(d)30.117.316.713.611.910.78.36.7(1) 建立数据文件,在 Variable Vew 中定义变量“平

3、均温度” 、 “历期天数” ,小数位数均为 1,输入数据;(2) 相关分析:Analyze=Correlate=Bivariate(两变量相关分析),打开Bivariate Correlation主对话,将“平均温度” 、 “历期天数”引进Variables(变量)框; (3) 在Correlation Coefficients复选框中选择“Pearson” (系统默认) ,选中Flag significant correlations,将对显著的相关系数加“*”标志(若为 1 个星号*,表示 PRegression(回归分析)=Linear(线性回归),打开Linear Regression

4、主对话,将“历期天数”引进Dependent(因变量),将“平均温度”引进Independent(自变量); (3) 点击Statistics,打开描述统计对话框,选择“Descriptive” 、 “Estimates” (可输出回归系数 b 及其标准误差) 、 “Model fit” ,Continue返回;(4) 单击Options进入“选项”对话框,选择系统默认,Continue返回; (5) 单击OK,运行线性回归分析。SPSS 分析结果回归关系的方差分析(结果表明 pRegression(回归分析)=Linear(线性回归),打开Linear Regression主对话,将“销售额

5、 Y”引进Dependent(因变量),将“购买力 X1” 、 “流入量 X2”引进Independent(自变量),Method列表中选择“Enter”; (3) 单击OK,运行线性回归分析。SPSS 分析结果C Co oe ef ff fi ic ci ie en nt ts sa a37.085746.031.050.962 5.075.862.9445.888.002 .143.722.032.198.851(Constant) x1 x2Model 1BStd. ErrorUnstandardized Coefficients BetaStandardized Coefficient

6、s tSig.Dependent Variable: ya. 由上表可见, “流通量 x2”进行 t 检验,其 p=0.8510.05,说明其系数不显著,可采用逐步回归的方法得到最佳的回归方差,如下:Analyze=Regression(回归分析)=Linear(线性回归),打开Linear Regression主对话,将“销售额 Y”引进Dependent(因变量),将“购买力 X1” 、 “流入量X2”引进Independent(自变量),Method列表中选择“Stepwise”;OK分析结果:C Co oe ef ff fi ic ci ie en nt ts sa a158.8813

7、84.817.413.694 5.036.768.9376.554.001(Constant) x1Model 1BStd. ErrorUnstandardized Coefficients BetaStandardized Coefficients tSig.Dependent Variable: ya. “流入量 X2”未被选入方程,逐步回归方程为:Y=158.881+5.036x12、练习:、练习:一家百货公司在 10 个地区设有经销分公司。公司认为商品销售额与该地区的人口数和年人均收入有关,并希望建立它们之间的数量关系式,以预测销售额。有关数据如下表。试确定销售额对人口数和年人均收入的

8、线性回归方程。地区编号销售额(万元)y人口数(万人) x1年人均收入(元)x21234567891033.335.527.630.431.953.135.629.035.134.532.429.126.331.229.240.729.823.028.226.912501650145013101310158014901520162015703、练习:某研究机构为研究儿童的智力状况,调查了 16 所小学的平均语言测试得分(y)与家庭社会经济状况综合指标(x1) 、教师语言测试得分(x2)及母亲教育水平(x3)的数据,如下表所示,试进行多元回归。平均语言测试得分 y家庭综合指数 x1教师语言测验分

9、x2母亲教育水平 x337.01 7.20 26.60 6.19 26.51 -11.70 24.40 5.17 36.51 12.32 25.70 7.04 40.70 14.28 25.70 7.10 37.10 6.31 25.40 6.15 41.80 12.70 24.90 6.85 33.40 -0.17 25.10 5.78 44.01 9.85 26.60 6.51 23.30 -12.86 23.51 5.62 34.90 4.77 24.51 5.80 33.10 -0.96 25.80 6.19 22.70 16.04 25.20 5.62 39.70 10.62 25.

10、10 6.94 31.80 2.60 25.01 6.33 31.70 -10.99 24.80 6.01 43.10 15.03 25.51 7.51 (三)曲线回归法分析:(三)曲线回归法分析:变量间并非线性关系,而是各种曲线关系变量间并非线性关系,而是各种曲线关系Analyze=Regression(回归分析)=Curve Estimation(曲线估计)SPSS 列出 11 种曲线类型:Linear 线性模型Logarithmic 对数曲线模型Inverse 倒数曲线模型Quadratic 二次曲线模型Cubic 三次曲线模型Power 幂函数模型Compound 复合曲线模型S S

11、形曲线模型Logistic Logistic 曲线模型1、案例分析:测定了 8 尾雌性鲟鱼的体长(cm)和体重(kg) ,结果如下表,试对鲟鱼的体重与体长进行回归分析。序号12345678体长 x70.70 98.25 112.57 122.48 138.46 148.00 152.00 162.00 体重 y1.00 4.85 6.59 9.01 12.34 15.50 21.25 22.11 SPSS 操作:(1) 建立数据文件,在 Variable Vew 中定义变量“x” 、 “y” 、在 label 中分别定义为“体长”和“体重” ,输入数据;(2) 绘制散点图:选择Graphs =

12、 Scatter/Dot,打开Scatter/Dot对话框,选择“Simple”图例后单击“Define”按钮,打开“Simple Scatterplot”(简单散点图)对话框,将变量 y 移动到“Y Axis”框,变量 x 移动到“X Axis”框,OK。(3) 曲线回归分析:Analyze=Regression(回归分析)=Curve Estimation(曲线估计),打开Curve Estimation主对话,将“y”引进Dependent(因变量),将“x”引进Independent(自变量)的“Variable”框中,在Models中选择所需的曲线方程。因无法确知体重 y 与体长 x

13、 的曲线拟合适用哪一种曲线方程,故选中除 Logistic 曲线外的 10 种曲线方程。选中“Display ANOVA Table”(显示方差分析表)选项。(4) 单击OK,运行线性回归分析。SPSS 分析结果1、散点图:2、模型描述:Model DescriptionModel NameMOD_1Dependent Variable11Linear2Logarithmic3Inverse4Quadratic5Cubic6Compound(a)7Power(a)8S(a)9Growth(a)Equation10Exponential(a)Independent VariableConstan

14、tIncludedVariable Whose Values Label Observations in Plots UnspecifiedTolerance for Entering Terms in Equations.0001a The model requires all non-missing values to be positive.3、拟合曲线的参数Model Summary and Parameter EstimatesDependent Variable: EquationModel SummaryParameter EstimatesR SquareFdf1df2Sig.

15、Constantb1b2b3Linear.91463.38516.000-18.226.237 Logarithmic.84633.08016.001-110.80725.486 Inverse.75918.85816.00533.068-2524.090 Quadratic.96978.29325.0009.439-.266.002 Cubic.97081.70325.000.224.000.0007.10E-006Compound.950114.17616.000.1491.033 Power.984366.79316.0002.07E-0073.649 S.989545.74416.0005.392-382.793 Growth.950114.17616.000-1.904.032 Exponential.950114.17616.000.149.032 The independent variable is .经过检验,所有曲线拟合的p均小于0.01,均达到极显著水平,但10条曲线的相关指数 R2是S形曲线(S)的最大,为0.989,故S形曲线方程是描述鲟鱼体重与体长关系的最 优方程。练习:1、测定细砂土中毛管水的上升高度(y,mm)和经历时数(x,h)的关系,其结果如下表所示,试做回归分析。x12 24 48 96 144 192 240 y21 3

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号