方差分析与一元回归分析

上传人:876****10 文档编号:359555016 上传时间:2023-09-01 格式:PPT 页数:221 大小:9.13MB
返回 下载 相关 举报
方差分析与一元回归分析_第1页
第1页 / 共221页
方差分析与一元回归分析_第2页
第2页 / 共221页
方差分析与一元回归分析_第3页
第3页 / 共221页
方差分析与一元回归分析_第4页
第4页 / 共221页
方差分析与一元回归分析_第5页
第5页 / 共221页
点击查看更多>>
资源描述

《方差分析与一元回归分析》由会员分享,可在线阅读,更多相关《方差分析与一元回归分析(221页珍藏版)》请在金锄头文库上搜索。

1、教学要求教学要求1.1.掌握单因素试验的方差分析掌握单因素试验的方差分析2.2.掌握一元线性回归分析掌握一元线性回归分析学时学时 4-6第一节、方差分析第一节、方差分析一、方差分析的基本原理一、方差分析的基本原理三、单因素方差分析的步骤三、单因素方差分析的步骤二、单因素方差分析的方法二、单因素方差分析的方法四、双因素方差分析的方法四、双因素方差分析的方法在试验时,待考察的而受人为控制的在试验时,待考察的而受人为控制的“条件条件”称为因素称为因素.单因素试验单因素试验因素因素 在一次试验中,如果只有一个因素在改变,其他在一次试验中,如果只有一个因素在改变,其他因素保持不变,则称为单因素试验因素保

2、持不变,则称为单因素试验.水平水平因素变化所分的等级或组别,称为因素变化所分的等级或组别,称为“水平水平”或或“处理处理”.方差分析方差分析 方差分析就是鉴别各因素效应方差分析就是鉴别各因素效应(因素变化对试验指因素变化对试验指标的影响标的影响)是否显著的一种统计方法是否显著的一种统计方法.一、方差分析的基本原理一、方差分析的基本原理 系统系统(条件条件)误差误差:在方差分析中在方差分析中,凡是由于试验因素的变异而引起的凡是由于试验因素的变异而引起的试验结果的差异试验结果的差异,称为称为“系统误差系统误差”或或“条件误差条件误差”.”.随机随机(试验试验)误差误差:在试验中在试验中,当我们把所

3、有能控制的试验条件都控当我们把所有能控制的试验条件都控制在固定的状态下制在固定的状态下,进行多次重复试验进行多次重复试验,所得的的试所得的的试验结果也不会完全一致验结果也不会完全一致,仍存在一定程度的差异仍存在一定程度的差异.我们以下例来说明方差分析的基本原理和方法我们以下例来说明方差分析的基本原理和方法.例例 把一批用同种纱线织成的袜子放在不同温度的把一批用同种纱线织成的袜子放在不同温度的水中洗涤水中洗涤,进行缩水率试验进行缩水率试验,六种不同温度各洗涤六种不同温度各洗涤4 4只只,并在同一温室内凉干并在同一温室内凉干,测得缩水率的百分数如测得缩水率的百分数如下下:袜号袜号温度温度行和行和问

4、六种温度对袜子的缩水率有无影响问六种温度对袜子的缩水率有无影响?从表上的数据可以直观地看到从表上的数据可以直观地看到:1.1.表中数据不全相同表中数据不全相同,说明在不同的试验中存在着差异说明在不同的试验中存在着差异;2.2.不同温度不同温度(水平水平)下缩水率的平均数不同下缩水率的平均数不同,表明温度对表明温度对缩水率有一定影响缩水率有一定影响,即有系统误差存在即有系统误差存在;3.3.同温度同温度(水平水平)下的下的4 4只袜子只袜子,缩水率也有差异缩水率也有差异,显然显然这个差异不是由温度引起的这个差异不是由温度引起的,而是由随机因素引起的而是由随机因素引起的随机误差随机误差;4.4.由

5、于有条件误差与随机误差的存在由于有条件误差与随机误差的存在,那么不同温度那么不同温度下的平均缩水率之间的差异主要是随机因素造成的呢下的平均缩水率之间的差异主要是随机因素造成的呢?还是不同温度的影响还是不同温度的影响?和通常的统计推断问题一样和通常的统计推断问题一样,方差分析的任务方差分析的任务是要寻求适当的统计量是要寻求适当的统计量,对参数作假设检验对参数作假设检验.需要需要检验六个正态总体的均值是否相等检验六个正态总体的均值是否相等,即即:如果温度对试验结果并无显著影响如果温度对试验结果并无显著影响,表中的表中的2424个个数据应当来自同一正态总体数据应当来自同一正态总体,即可接受即可接受H

6、 H0 0.如果温度对如果温度对试验结果有显著影响试验结果有显著影响,那么只有每一行的结果来自同一那么只有每一行的结果来自同一正态总体正态总体,不同的行并不来自同一总体不同的行并不来自同一总体,当然只能否定当然只能否定H H0 0(条件不同所引起的系统误差主要表现在条件不同所引起的系统误差主要表现在i i上上;随机随机因素引起的误差主要表现在因素引起的误差主要表现在i i上上.).)由于随机误差和系统误差常常交织在一起由于随机误差和系统误差常常交织在一起,方方差分析的基本想法就是要设法对总离差平方和差分析的基本想法就是要设法对总离差平方和S S进进行分解行分解,因有两种可能因有两种可能:(I)

7、(I)若若H H0 0为真为真,则则S S为随机因素引起的误差为随机因素引起的误差;(II)(II)若若H H0 0不真不真,则则S S除了随机误差外除了随机误差外,还包含了各还包含了各种条件造成的系统误差种条件造成的系统误差.所以只要对所以只要对S S中的随机误差和包含不同条件造成中的随机误差和包含不同条件造成的那部分系统误差分开的那部分系统误差分开,然后相互比较然后相互比较,问题就解问题就解决了决了.二、单因素方差分析的方法二、单因素方差分析的方法1.假定条件假定条件2.研究的基本问题研究的基本问题重复号重复号 因素因素3.3.方差分析的数据结构方差分析的数据结构(见教材见教材P171P1

8、71的表的表9-1)9-1)组内平均值组内平均值总平均值总平均值4.方差分析的数学模型方差分析的数学模型5.5.总离差平方和的分解总离差平方和的分解样本总离差平方和样本总离差平方和组内离差平方和组内离差平方和组间离差平方和组间离差平方和证明证明:其中其中6.6.构造检验统计量构造检验统计量不显著,接受H0较显著显著极显著拒绝H0(*)*7.7.关于计算关于计算三、单因素方差分析的步骤三、单因素方差分析的步骤1.1.确定假设检验确定假设检验2.2.列出方差分析计算表列出方差分析计算表(见教材见教材P P173173表表9-2).9-2).3.3.计算检验统计量计算检验统计量4.4.给出给出 的值

9、的值,查分位数查分位数 5.5.由以上结果列出方差分析表由以上结果列出方差分析表.计算时计算时,可用以下公式可用以下公式方差来源方差来源 离差平方和离差平方和 自由度自由度 F值值F临界值临界值显著性显著性 组间组间 组内组内总和总和方差分析表方差分析表处理方法(水平数)苗高xij(cm)例例9.1 9.1 在下表中列出了某种树苗的高度的观测值在下表中列出了某种树苗的高度的观测值,按所施的肥料按所施的肥料的不同分成的不同分成5 5组组,每组每组6 6个观测值个观测值.设苗高服从方差相等的正态分布设苗高服从方差相等的正态分布,问问:在显著水平在显著水平0.010.01下检验下检验5 5组树苗的平

10、均高度有无显著影响组树苗的平均高度有无显著影响.解解:为减少计算量为减少计算量,将上表中的所有数据减去将上表中的所有数据减去20,20,再列出方差计算表再列出方差计算表:故知在故知在=0.01=0.01的水平上拒绝的水平上拒绝H H0 0.方差分析表如下方差分析表如下来源组间组内总和离差平方和自由度F值F临界值显著性497.88711.424254.374极显著极显著四、双因素方差分析四、双因素方差分析1.双因素无重复试验、无交互作用的方差分析双因素无重复试验、无交互作用的方差分析1 1)数学模型)数学模型 设因素设因素A A有有a a个水平个水平A A1 1,A A2 2,AAa a,因素,

11、因素B B有有b b个个水平水平B B1 1,B B2 2,BBb b,对每种水平搭配(,对每种水平搭配(A Ai i,B Bj j)只)只进行一次独立试验(称为进行一次独立试验(称为A Ai iB Bj j处理)处理).指标(观察指标(观察值)记为值)记为x xijij,设,设观察值ABA1A2.AaB1 B2 .Bb x11x21.xa1x12x22.xa2x1bx2b.xabXij可用如下数学模型表示:可用如下数学模型表示:方差分析数据表为:方差分析数据表为:令:令:总体总均值,理论值总体总均值,理论值A的第的第i个水平个水平的总体均值的总体均值B的第的第j个水平个水平的总体均值的总体均

12、值称为称为Ai的效应的效应称为称为Bj的效应的效应效应分解式:效应分解式:2 2)方差分析)方差分析检验假设检验假设令:令:(样本总均值)(样本总均值)(因素(因素A第第i个水平样本均值)个水平样本均值)(因素(因素B B第第j j个水平样本均值)个水平样本均值)可以证明:可以证明:检验统计量检验统计量方差分析表方差分析表方差来源方差来源平方和平方和自由度自由度均方和均方和ABEa-1b-1(a-1)(b-1)SA/(a-1)SB/(b-1)Se/(a-1)(b-1)总和总和ab-1则简化计算法为则简化计算法为:第二节第二节 一元线性回归分析一元线性回归分析一、问题的提出一、问题的提出二、一元

13、线性回归方程的求法二、一元线性回归方程的求法三、估计量的性质三、估计量的性质四、回归方程的显著性检验四、回归方程的显著性检验五、预报与控制五、预报与控制第二节、一元线性回归分析第二节、一元线性回归分析一、问题的提出一、问题的提出变量间的关系分为:变量间的关系分为:(1)(1)确定性关系确定性关系(2)(2)相关关系相关关系(即变量间有统计规律即变量间有统计规律,但关系是不确定的但关系是不确定的)回归分析方法就是寻找变量间相关关系的数学回归分析方法就是寻找变量间相关关系的数学关系式并进行统计推断的一种方法关系式并进行统计推断的一种方法.回归分析回归分析(按变量个数按变量个数)一元回归分析一元回归

14、分析多元回归分析多元回归分析回归分析解决以下两个问题回归分析解决以下两个问题:1.1.判断变量间是否存在相关关系判断变量间是否存在相关关系.2.2.找出变量间相关关系最适合找出变量间相关关系最适合(近似的近似的)定量表达式定量表达式,同时利用表达式作预测或控制同时利用表达式作预测或控制,并估计出这种预测并估计出这种预测或控制可以达到什么样的精度或控制可以达到什么样的精度.1.散点图散点图二、一元线性回归方程的求法二、一元线性回归方程的求法二、一元线性回归方程的求法二、一元线性回归方程的求法2.2.一元线性回归的数学模型一元线性回归的数学模型 上式所描述的上式所描述的x,yx,y之间的线性关系的

15、模型之间的线性关系的模型,我们我们称为一元线性回归模型称为一元线性回归模型.称为称为y对对x的线性回归方程的线性回归方程回归截距回归截距回归系数回归系数3.3.回归方程回归方程4.4.4.4.一元线性回归方程的求法一元线性回归方程的求法一元线性回归方程的求法一元线性回归方程的求法(参数的最小二乘估计参数的最小二乘估计参数的最小二乘估计参数的最小二乘估计)记记则则回归方程为回归方程为:例9.2某种大豆的脂肪含量x(%)与蛋白质含量y(%)的测定结果如下表:序号脂肪蛋白质12345678916.543.517.542.618.542.619.540.620.540.321.538.722.537.

16、223.53624.534求回归方程.序号序号脂肪脂肪蛋白质蛋白质12345678916.543.517.542.618.542.619.540.620.540.321.538.722.537.223.53624.534列出回归计算表列出回归计算表272.31892717.8306.31815745.5342.31815788.1380.31648791.7420.31624826.2462.31498832.1506.31384837552.31296846600.31156833184.5355.53842141287217三、估计量的性质三、估计量的性质三、估计量的性质三、估计量的性质(证明略证明略证明略证明略)四、回归效果的检验四、回归效果的检验要检验要检验y y与与x x之间是否有线性关系之间是否有线性关系,就是要检验就是要检验b b是否为零是否为零.若接受若接受H H0 0,表明线性关系不显著,表明线性关系不显著若拒绝若拒绝H H0 0,表明线性关系显著,表明线性关系显著1.1.平方和分解平方和分解总平方和总平方和反映了原始数据反映了原始数据 的全部差异性的全部差异性回归平

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号