昆虫生态及预测预报第八章数理统计预测法ppt课件

上传人:工**** 文档编号:567501345 上传时间:2024-07-20 格式:PPT 页数:27 大小:174.50KB
返回 下载 相关 举报
昆虫生态及预测预报第八章数理统计预测法ppt课件_第1页
第1页 / 共27页
昆虫生态及预测预报第八章数理统计预测法ppt课件_第2页
第2页 / 共27页
昆虫生态及预测预报第八章数理统计预测法ppt课件_第3页
第3页 / 共27页
昆虫生态及预测预报第八章数理统计预测法ppt课件_第4页
第4页 / 共27页
昆虫生态及预测预报第八章数理统计预测法ppt课件_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《昆虫生态及预测预报第八章数理统计预测法ppt课件》由会员分享,可在线阅读,更多相关《昆虫生态及预测预报第八章数理统计预测法ppt课件(27页珍藏版)》请在金锄头文库上搜索。

1、第八章第八章数理数理统计预测法法数理统计预测法,是利用统计学原理,从害虫发生的历史资料中,概括出环境因子与虫害发生之间的内在联络,建立数学模型,然后根据目前环境因子的情况,来预告未来害虫发生的情况。数理统计预测预告必需求有多年的田间系统调查资料,将这些资料选择其中有关部分,进展统计分析,得出有关预测预告适用的数学模型,才干加以运用。数理统计预测法的优点数理统计预测法的优点以前各类预测预告方法,可以称为实验生态、生物学方法,以前各类预测预告方法,可以称为实验生态、生物学方法,优点优点: : 生态学、生物学、生理学意义较明确生态学、生物学、生理学意义较明确. .缺陷:必需进缺陷:必需进展田间的系统

2、调查和室内豢养察看,任务量比较大、另外展田间的系统调查和室内豢养察看,任务量比较大、另外实验法普通只能作中、短期预告,时间较短。实验法普通只能作中、短期预告,时间较短。统计预告法,是利用多年的历史资料进展统计分析,尔后统计预告法,是利用多年的历史资料进展统计分析,尔后得出数学模型,就可以不用田间系统调查和室内豢养察看,得出数学模型,就可以不用田间系统调查和室内豢养察看,因此可以大大减少任务量,同时,可作较长时期的预告,因此可以大大减少任务量,同时,可作较长时期的预告,并能进一步利用电子计算机作害虫的预告。近二十年来,并能进一步利用电子计算机作害虫的预告。近二十年来,特别是近十年来,数学方法大量

3、渗入害虫预测预告中,而特别是近十年来,数学方法大量渗入害虫预测预告中,而气候预测预告中的手段也大量引入害虫预测预告中,致使气候预测预告中的手段也大量引入害虫预测预告中,致使害虫预测预告从方法上,使害虫预告任务向前迈进了一步,害虫预测预告从方法上,使害虫预告任务向前迈进了一步,为进入电子计算机时代打下了根底。现将预测预告中常用为进入电子计算机时代打下了根底。现将预测预告中常用数理统计方法引见如下。数理统计方法引见如下。第一第一节预告因子的告因子的选取取一、预告因子的选取一、预告因子的选取预告因子的选取,是进展数理测报任务的前提,预告因子的选取,是进展数理测报任务的前提,在预备建立预测方式前,首先

4、要从多年积累的在预备建立预测方式前,首先要从多年积累的资料中,挑选同预告量有关的因子。资料中,挑选同预告量有关的因子。预告量预告量 是指预告害虫发生的主要特征,是指预告害虫发生的主要特征,即在不同的情况下预告害虫的发生期、发生即在不同的情况下预告害虫的发生期、发生量、发生范围以及危害程度等。量、发生范围以及危害程度等。预告因子预告因子 简称为因子,影响害虫发生的要简称为因子,影响害虫发生的要素都是预告因子但不一定都能入选预告因素都是预告因子但不一定都能入选预告因子有生物的如天敌;非生物的如气温、降雨量、子有生物的如天敌;非生物的如气温、降雨量、相对温度、光照等。相对温度、光照等。预告因子和预告

5、量通称为预告的要素。预告因子和预告量通称为预告的要素。二二 、选取预告因子的原那么、选取预告因子的原那么1 1样本数要足够多。样本数量太少,容易碰到由于样本的样本数要足够多。样本数量太少,容易碰到由于样本的随机动摇而呵斥较高的符合率的假象。普通有随机动摇而呵斥较高的符合率的假象。普通有10-2010-20个就可以了。个就可以了。2)2)选择因子的数目要恰当。由于选择因子太少,那么提供信选择因子的数目要恰当。由于选择因子太少,那么提供信息缺乏,预告才干差,选择因子过多息缺乏,预告才干差,选择因子过多, ,计算费事且当样本数较少计算费事且当样本数较少更易引起误差。普通以为选择因子的数目最好不超越样

6、本的更易引起误差。普通以为选择因子的数目最好不超越样本的1/5-1/10,1/5-1/10,如如1010个样本选个样本选1-21-2个因子。个因子。3)3)选择准主导因子,并要选好能相互配合,相互弥补的次要选择准主导因子,并要选好能相互配合,相互弥补的次要因子,与主导因子相互搭配,但留意不要把一些虽然与预告量因子,与主导因子相互搭配,但留意不要把一些虽然与预告量相关性好,但它们的作用是反复的因子。这样的因子,只是单相关性好,但它们的作用是反复的因子。这样的因子,只是单独对预告量发生作用,并不是同主导因子配合共同起作用,也独对预告量发生作用,并不是同主导因子配合共同起作用,也不能起到弥补的作用,

7、这样的因子不宜作为辅助因子。如某个不能起到弥补的作用,这样的因子不宜作为辅助因子。如某个月的平均气温暖平均最高气温以及积温,不宜同时采用。月的平均气温暖平均最高气温以及积温,不宜同时采用。4 4尽可保管因子中关于预告对象的原始信息。选择因子尽可保管因子中关于预告对象的原始信息。选择因子最好用原始数据建立预测式,假设将预告因子分级调查时最好用原始数据建立预测式,假设将预告因子分级调查时没有量,只需重、中、轻、编号或转换为没有量,只需重、中、轻、编号或转换为0 0,1 1资料,资料,就会损失信息,但分级、编号、转换、可简化计算,因此,就会损失信息,但分级、编号、转换、可简化计算,因此,要权衡得失,

8、恰当处置。要权衡得失,恰当处置。5 5选择相关性好而且相关性稳定的因子。用多因子作预选择相关性好而且相关性稳定的因子。用多因子作预告,至少要有一个预告因子与预告量相关性好且相关性稳定。告,至少要有一个预告因子与预告量相关性好且相关性稳定。这可以经过相关性检验和多年阅历求出。这可以经过相关性检验和多年阅历求出。三、三、 3 3个留意个留意 应应有科学的根据有科学的根据 自然界的事物都是有自然界的事物都是有联络联络的,的,如害虫的如害虫的发发生生规规律性和客律性和客观环观环境之境之间间是有是有联络联络的,不能把没有的,不能把没有科学根据的科学根据的资资料硬往一料硬往一块块凑,例如凑,例如预测预测粘

9、虫幼虫的粘虫幼虫的发发生量,生量,应应从温度、湿度、作物种从温度、湿度、作物种类类,以及天,以及天敌敌等等经经前人研前人研讨讨曾曾经认经认可的可的有关因子出有关因子出发发思索,而不能把蚜虫的天思索,而不能把蚜虫的天敌敌蚜蚜茧茧蜂作蜂作为预为预告粘虫告粘虫发发生的因子,至少是不能作生的因子,至少是不能作为为主主导导因子。因子。 应应有推理的根据有推理的根据 所所选选因子要因子要经经得起琢磨,如不得起琢磨,如不少人以少人以为为蚜虫的基数与其蚜虫的基数与其发发生量关系生量关系较亲较亲密,但仔密,但仔细细分析,蚜分析,蚜虫世代短,繁衍快,天虫世代短,繁衍快,天敌敌控制复控制复杂杂,到,到7-87-8月

10、月间间受气温影响很受气温影响很大,而基数那么是无关大,而基数那么是无关紧紧要的。要的。 应应有有实验实验的根据的根据 所所选选因子最好在因子最好在实验实验根底上,根底上,确确认该认该因子与因子与预预告量有关,告量有关,尔尔后再作分析。后再作分析。第二第二节线性相关与一元回性相关与一元回归式的式的建立及运用建立及运用一、一、选取取预告因子告因子一一 资料分布料分布图方法方法 将将预告量告量Y Y作作Y Y轴,将,将预告因子告因子X X作作X X轴,将,将历年的年的Y Y、X X数数值,描点在坐,描点在坐标上。上。点子密集在一条狭点子密集在一条狭长的的带内,而接近一条直内,而接近一条直线或一条曲或

11、一条曲线,阐明二者相关性比明二者相关性比较亲密,可以密,可以选作作预告因子;假告因子;假设点子分散,不在一条狭点子分散,不在一条狭长的的带内,表示相关性不内,表示相关性不强,不宜不宜选作作预告因子;假告因子;假设点子排成点子排成圆形,或排成平行于形,或排成平行于轴的矩形,那么表示无的矩形,那么表示无线性相关性;点子性相关性;点子陈列接近一条列接近一条直直线者,称者,称为有有“线性相关;点子性相关;点子陈列接近一条曲列接近一条曲线者,者,称称为有有“非非线性相关,或称有曲性相关,或称有曲线相关。相关。二二 相关系数法相关系数法 衡量两衡量两变量相关的最好方法是求量相关的最好方法是求相关系数,然后

12、相关系数,然后查相关系数相关系数检验表,表,检验相关能否到达相关能否到达一定一定显著程度。假著程度。假设到达,那么可到达,那么可选作作预告因子。告因子。二、相关系数的计算二、相关系数的计算三、一元线性回归式的建立和运用三、一元线性回归式的建立和运用回回归一一词RegressionRegression原原来来含含义较狭狭窄窄,英英国国高高尔登登氏氏F.GaltonF.Galton在在18891889年年,在在遗传学学论文文中中首首先先运运用用此此词。他他发现儿儿子子的的平平均均生生长高高度度,介介于于父父亲高高度度和和普普通通种种族族平平均均高高度度之之间,父父亲矮矮的的其其儿儿子子的的平平均均

13、高高度度较父父亲高高,比比普普通通低低,父父亲高高的的其其儿儿子子的的平平均均高高度度,较父父亲低低,但但比比普普通通平平均均高高度度又又高高,这就就是是说后后代代的的高高度度有有前前往往于于种种族族平平均均高高度度的的趋势,亦亦即即回回归普普通通平平均均高高度度,这就就是是最最初初在在遗传学学上上“回回归的的意意义。如如今今统计上上,多多表表示示察察看看点点回回归于于某某一一数数学学模模型型,比比如如直直线、曲、曲线等。等。一一 直直线回回归 直线回归的普通表达式:直线回归的普通表达式:Y=a+bx Y=a+bx 统计上读作统计上读作Y Y依依X X的直线回归的直线回归X X为自变量,为自变

14、量,Y Y是和是和X X的值相对应的依变数的值相对应的依变数Y Y的点估计值,实际值。的点估计值,实际值。A A是截距,是当是截距,是当X=0X=0时的时的Y Y值值B B是斜率,也叫回归系数,即是斜率,也叫回归系数,即X X每添加一个单位数时每添加一个单位数时Y Y平均地添加平均地添加b0b0或减少或减少b0b0的单位数。的单位数。回归式回归式 a a、b b值的图解求法:值的图解求法:b=tga=b=tga=对对/ /邻邻=BC/AC=(Y-a)/X=BC/AC=(Y-a)/Xbx=Y-abx=Y-aY=a+bxY=a+bx当当X=1X=1时,时,BC=b Y=a+b BC=b Y=a+b

15、 正好是添加的单位数正好是添加的单位数图解求图解求a a、b baCy=a+bxYAB1 1 、最小二乘法求、最小二乘法求a a、b b对于具有线性相关关系的两个变量,可以用回归直线表对于具有线性相关关系的两个变量,可以用回归直线表示它们之间的定量关系,但当将察看值描点于座标图上时,示它们之间的定量关系,但当将察看值描点于座标图上时,在不知道实际值的情况下,在这些分布点中可以描出无数在不知道实际值的情况下,在这些分布点中可以描出无数条近似直线,但现实上只需经过计算求得的实际表达式,条近似直线,但现实上只需经过计算求得的实际表达式,才最能代表这些分布点,从实际上讲,这些分布点都是由才最能代表这些

16、分布点,从实际上讲,这些分布点都是由x x、y y两个座标决议,这每一个点两个座标决议,这每一个点x x所对应的所对应的y y值与上述所求值与上述所求得的实际直线间隔为最小。得的实际直线间隔为最小。即即 y- y- 2 2为最少,由于是最少,由于是2 2次平方故称次平方故称为最小二乘法,最小二乘法,统计上普通用上普通用Q Q来表示:来表示:Q=Q=y- y- 2=(Y-a-bx)22=(Y-a-bx)2为最小。最小。为了使了使Q Q最小,采用最小,采用导数求极数求极值方法,先分方法,先分别对a,ba,b求偏求偏导,然后,然后令其等于零,便可求得令其等于零,便可求得联列方程列方程组,进而解出极小

17、而解出极小值。1.1.对a a求偏求偏导 dQ/da=2(y-a-bx)(-1)=0 dQ/da=2(y-a-bx)(-1)=02.2.对b b求偏求偏导 dQ/Db=2(y-a-bx)(-x)=0 dQ/Db=2(y-a-bx)(-x)=0整理得:整理得: y=na+bx (1) y=na+bx (1) xy=ax+bx2 (2) xy=ax+bx2 (2)解此解此联列方程代入法:列方程代入法:b=xy-1/nxy/x2-1/n(x)2=Lxy/Lxxb=xy-1/nxy/x2-1/n(x)2=Lxy/Lxx代入代入1 1式得:式得:a=y/n-bx/n= -ba=y/n-bx/n= -b1

18、 1、最小二乘法求、最小二乘法求a a、b b表表5 5 忻州地域忻州地域76-8076-80年年5 5月份的月均温与粘虫卵月份的月均温与粘虫卵量划分等级表量划分等级表年份年份月均温月均温X卵量卵量YXYY2X2764416161677339997821214780000080122411010293030( (二计算二计算N=5 =10/5=2 =10/5=2先求出根本数据:Lxy=xy-xy/n=29-10*10/5=9 Lxx=x2-(x)2/n=30-102/5=10 Lyy=y2-(y)2/n=30-102/5=10根据上表及所求根本数据求解回归斜率b和截距ab=Lxy/Lxx=9/

19、10=0.9 a= -b =2-0.9*2=0.2那么回归式为: =0.2+0.9x相关系数为:r=Lxy/SqrLxx.Lyy=9/Sqr10*10=9/10=0.9查相关系数为:df=3时,r表5=0.878,r表1=0.959结果阐明此回归式在5程度上显著但不达极显著程度。( (三三) ) 回归线的精度回归线的精度知道了知道了x x值,不能准确地知道,不能准确地知道实测值y,y,但由回但由回归线可以知道可以知道y y的估的估计值 ,那么,那么实践的践的y y值高高 能能够有多有多远呢?也就是用回呢?也就是用回归预告的精度如何?由于每一个告的精度如何?由于每一个x x的的实测值的的y y值

20、按一定的分布在按一定的分布在动摇动摇规律在普通情况下都以律在普通情况下都以为是正是正态分布,假分布,假设求出求出动摇的的规范差,那么回范差,那么回归线的精度就可以估的精度就可以估计出来。出来。这种种规范范差称差称为“剩余剩余规范差。范差。S S剩剩=SQR1/(n-2)(yi- )2=SQR1/(n-2)(yi- )2用上式用上式计算不方便,在算不方便,在实践践计算中常用下式算中常用下式S S剩剩=SQR(Lyy-bLxy)/(n-2)=SQR=SQR(Lyy-bLxy)/(n-2)=SQR1-r21-r2Lyy/(n-2)Lyy/(n-2)将上例有关将上例有关值代入上式求代入上式求S SS

21、S剩剩=SQR(10-0.9*9)/(5-2)=SQR(10-0.9*9)/(5-2) =SQR(1.9/3)=SQR(0.633)=0.7956 =SQR(1.9/3)=SQR(0.633)=0.7956( (四四) )计算符合率计算符合率计算出回归后,还要检验它的符合率。符合率有两种,计算出回归后,还要检验它的符合率。符合率有两种,一种是历史符合率,一种是实践符合率。重要的是后一种,一种是历史符合率,一种是实践符合率。重要的是后一种,但后一种由于回归式算出后,在实践运用中的次数不会在但后一种由于回归式算出后,在实践运用中的次数不会在短时间内到达很多次,因此历史符合率也有很重要的参考短时间内

22、到达很多次,因此历史符合率也有很重要的参考价值。两种符合率可用下面公式计算:价值。两种符合率可用下面公式计算:表表6 6 根据上述资料计算历史符合率根据上述资料计算历史符合率年份年份月月均均温温X卵量卵量Y预测值预测值符合情况符合情况76443.8+77332.9+78212-79000.2+80121.1-76-80历史符合率=3/5100=6076-79实践符合率=3/4100=75昆虫生态调查方法昆虫生态调查方法n一、一、总体与体与样本本n1、总体:一群性体:一群性质一一样的事物的的事物的总和,和,在在统计学上称学上称为“总体。在害虫体。在害虫调查中中经常将一种常将一种类型田里型田里发生

23、的某种害虫,生的某种害虫,当作当作总体。体。n2、样本:根据某种害虫在某种作物田里本:根据某种害虫在某种作物田里的分布型,按照一定的抽的分布型,按照一定的抽样方法,在方法,在调查对象的象的总体中,抽取一定数量的个体,体中,抽取一定数量的个体,我我们把把这个有限个体称做个有限个体称做“样本。本。n根据根据样本所本所查得的得的结果即能果即能较准确准确地估地估计出出这种害虫种害虫总体的田体的田间种群密度、种群密度、发育育进度或危害程度。度或危害程度。但是,在但是,在实践中践中我我们用用样本的平均数、方差、本的平均数、方差、变异系数异系数等来表示等来表示总体的平均数、方差、体的平均数、方差、变异系异系

24、数,它数,它们之之间的的误差称差称为“抽抽样误差差田间调查步骤田间调查步骤1、确定田间调查目的2、根据目确实定实验田块3、确定抽样调查方法随机取样4、昆虫取样方法五点、Z形取样5、每点取样单位株数6、每株昆虫观测方法直接法、吸附法7、确定取样的次数次数8、制定好表格并记载。二、抽样误差的来源二、抽样误差的来源1 1、抽样方式的不同、抽样方式的不同 取样方式的选择与昆虫在田间的分布型有关,取样方式的选择与昆虫在田间的分布型有关,不同的分布型选用不同的抽样方法不同的分布型选用不同的抽样方法2 2、抽样数目的多少、抽样数目的多少 根据调查要求的准确程度,适中选取一定的样根据调查要求的准确程度,适中选

25、取一定的样本数目本数目3 3、调查者的程度、态度,是呵斥人为误差的来源。、调查者的程度、态度,是呵斥人为误差的来源。三、常用的取样方法三、常用的取样方法1、五点抽、五点抽样样适宜于密集的或成行的植物、害适宜于密集的或成行的植物、害虫分布虫分布为为随机分布的情况,可按一定的面随机分布的情况,可按一定的面积积、长长度或植株数量度或植株数量选选取取样样点点2、对对角角线线抽抽样样有有单对单对角角线线和双和双对对角角线线3、棋、棋盘盘式抽式抽样样4、分行抽、分行抽样样 平行平行线线抽抽样样 5、“Z字形抽字形抽样样适宜于害虫分布适宜于害虫分布负负二二项项分布分布的情况的情况6、等距抽、等距抽样样四、常

26、用的取样单位四、常用的取样单位1、长度单位 常用生长密集的条播作物2、面积单位 常用于调查地面或地下害虫3、体积或容积单位 调查木材或贮粮害虫4、分量单位 调查粮食和种子中害虫5、时间单位 活动性大的害虫,察看单位时间内经 过、起飞或捕获的虫数6、以植株、部分植株或植株的某一器官为单位7、诱集物单位 8、网捕单位 五、抽样方式的分类五、抽样方式的分类1、随机抽样 又称为概率抽样,总体内一切个体均有同等的时机被抽取,即每个抽样单位都具有相等的被抽取的概率。2、顺序抽样 又称机械抽样,按某种既定的顺序抽取一定数量的抽样单位构成样本。分行抽样、等距抽样属此类。3、分层抽样 把研讨或调查的总体,按一定

27、的规范分成比较均匀同质的假设干部分,即分层,然后,独立地从每一层内随机抽取所确定的抽样数目。六、实验数据的准确度六、实验数据的准确度1、准确度 是指实验中实验数据之间的相近程度。2、准确度 是指实验数据同总体真值的接近程度,无法估计。 准确度即我们所说的精度,它普通包括两个方面的内容: 其一、要求在实验实施过程中,仔细仔细尽量减少外界干扰,使实验结果更符合其田间情况 其二、是在统计分析时,前面数据保管的位数一定等于或大于后边保管的位数。七、调查和实验数据的统计代换七、调查和实验数据的统计代换 在实验中得到的数据往往不能符合统计上的根本假定,特别是在方差分析中,其分析必需在线性模型的根底上,即:

28、 1、实验效应和环境效应是可加的。 2、实验的误差应该是随机彼此独立的,而且作正态分布,具有平均数为零。 3、一切实验处置必需具共同的误差方法。即误差同质性。 凡不符合以上条件的数据,假设不进展统计处置,往往准确性较差,甚至会得出错误的结论,因此,需求进展统计代换。八、常用的统计代换方法八、常用的统计代换方法n1、对数代换、对数代换适用于负二项分布和奈曼分适用于负二项分布和奈曼分布及一切非随机性分布的资料布及一切非随机性分布的资料n2、百分率代换、百分率代换就是把每次或每天的调查就是把每次或每天的调查数据换算成这些数据占总数的百分比数据换算成这些数据占总数的百分比n3、百分率的反正弦代换、百分率的反正弦代换适用于负二项或适用于负二项或潘松分布,其特点是方差与均数不独立,潘松分布,其特点是方差与均数不独立,方差随均数的变化而变化方差随均数的变化而变化n4、平方根代换、平方根代换适用于潘松分布总体适用于潘松分布总体

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号