数学数据的统计分析最终ppt课件

上传人:cl****1 文档编号:567639174 上传时间:2024-07-21 格式:PPT 页数:71 大小:1.43MB
返回 下载 相关 举报
数学数据的统计分析最终ppt课件_第1页
第1页 / 共71页
数学数据的统计分析最终ppt课件_第2页
第2页 / 共71页
数学数据的统计分析最终ppt课件_第3页
第3页 / 共71页
数学数据的统计分析最终ppt课件_第4页
第4页 / 共71页
数学数据的统计分析最终ppt课件_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《数学数据的统计分析最终ppt课件》由会员分享,可在线阅读,更多相关《数学数据的统计分析最终ppt课件(71页珍藏版)》请在金锄头文库上搜索。

1、第八章随机模拟和统计分析MATLAB预备知识 概率和统计MATLAB3概率分布概率分布离散型随机变量离散型随机变量:离散均匀分布离散均匀分布二项分布二项分布泊松分布泊松分布几何分布几何分布超几何分布超几何分布负二项分布负二项分布延延续型随机型随机变量量:延延续均匀分布均匀分布指数分布指数分布正正态分布分布对数正数正态分布分布2分布分布非中心非中心2分布分布t分布分布非中心非中心t分布分布F分布分布非中心非中心F分布分布分布分布分布分布Rayleigh分布分布Weibull分布分布常见的概率分布常见的概率分布二项式分布Binomialbino卡方分布Chisquarechi2指数分布Expone

2、ntialexpF分布Ff几何分布Geometricgeo正态分布Normalnorm泊松分布PoissonpoissT分布Tt均匀分布Uniformunif离散均匀分布Discrete Uniformunid n个点上的均匀分布个点上的均匀分布q 假设随机变量假设随机变量 X 的分布列为:的分布列为:那么称这种分布为离散均匀分布。记做:那么称这种分布为离散均匀分布。记做:n=20;x=1:n;y=unidpdf(x,n);plot(x,y,o-)例:例: n=20 时的离散均匀分布密度函数图时的离散均匀分布密度函数图离散分布离散分布: 几何分布几何分布q 几何分布是一种常见的离散分布几何分布

3、是一种常见的离散分布l 在贝努里实验中,每次实验胜利的概率为在贝努里实验中,每次实验胜利的概率为 p,设实验进展,设实验进展到第到第 次才出现胜利,那么次才出现胜利,那么 的分布满足:的分布满足:其右端项是几何级数其右端项是几何级数 的普通项,于是人们称它为的普通项,于是人们称它为几何分布。几何分布。x=0:30; y=geopdf(x,0.5); plot(x,y,o-)例:例: p=0.5 时的几何分布密度函数图时的几何分布密度函数图离散分布离散分布: 0-1分布分布q 0-1分布分布 (Bernoulli分布分布)l 假设随机变量假设随机变量 X 的分布列为:的分布列为:那么称这种分布为

4、服从参数为那么称这种分布为服从参数为p的的0-1分布。分布。离散分布离散分布: 二二项分布分布q 二项分布属于离散分布二项分布属于离散分布l 假设随机变量假设随机变量 X 的分布列为:的分布列为:那么称这种分布为二项分布。记做:那么称这种分布为二项分布。记做:x=0:50;y=binopdf(x,500,0.05);plot(x,y,o-)例:例: n=500,p=0.05 时的二项分布密度函数图时的二项分布密度函数图离散分布离散分布:n=1,服从参数为服从参数为p的的0-1分布分布 Poisson 分布分布q 泊松分布也属于离散分布,是泊松分布也属于离散分布,是1837年由发个数年由发个数学

5、家学家 Poisson 初次提出,其概率分布列为:初次提出,其概率分布列为:记做:记做:l 泊松分布是一种常用的离散分布,它与单位时间或单位泊松分布是一种常用的离散分布,它与单位时间或单位面积、单位产品等上的计数过程相联络。如:单位时间内,面积、单位产品等上的计数过程相联络。如:单位时间内,总机接到用户呼唤次数;总机接到用户呼唤次数;1 平方米内,玻璃上的气泡数等。平方米内,玻璃上的气泡数等。离散分布离散分布:Poisson 分布举例分布举例x=0:50;y=poisspdf(x,25);plot(x,y, o-)例:例: =25 时的泊松分布密度函数图时的泊松分布密度函数图 均匀分布均匀分布

6、q 均匀分布延续分布均匀分布延续分布l 假设随机变量假设随机变量 X 的密度函数为:的密度函数为:那么称那么称 X 服从均匀分布。记做:服从均匀分布。记做:l 均匀分布在实践中经常运用,譬如一个半径为均匀分布在实践中经常运用,譬如一个半径为 r 的汽车轮的汽车轮胎,由于轮胎上的任一点接触地面的能够性是一样的,所以胎,由于轮胎上的任一点接触地面的能够性是一样的,所以轮胎圆周接触地面的位置轮胎圆周接触地面的位置 X 是服从是服从 0,2 r 上的均匀分布。上的均匀分布。延续分布延续分布:均匀分布举例均匀分布举例x=-10:0.01:10;r=1;y=unifpdf(x,0,2*pi*r);plot

7、(x,y,o-) 正态分布正态分布q 正态分布延续分布正态分布延续分布l 假设随机变量假设随机变量 X 的密度函数为:的密度函数为:那么称那么称 X 服从正态分布。记做:服从正态分布。记做:l 规范正态分布:规范正态分布:N (0, 1)l 正态分布也称高斯分布,是概率论中最重要的一个分布。正态分布也称高斯分布,是概率论中最重要的一个分布。l 假设一个变量是大量微小、独立的随机要素的叠加,那么假设一个变量是大量微小、独立的随机要素的叠加,那么它一定满足正态分布。如丈量误差、产质量量、月降雨量等它一定满足正态分布。如丈量误差、产质量量、月降雨量等延续分布延续分布:正态分布举例正态分布举例x=-8

8、:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(x,y,x,y1,:)例:规范正态分布和非规范正态分布密度函数图形例:规范正态分布和非规范正态分布密度函数图形 指数分布指数分布q 指数分布延续分布指数分布延续分布l 假设随机变量假设随机变量 X 的密度函数为:的密度函数为:那么称那么称 X 服从参数为服从参数为 的指数分布。记做:的指数分布。记做:l 在实践运用问题中,等待某特定事物发生所需求的时间往在实践运用问题中,等待某特定事物发生所需求的时间往往服从指数分布。如某些元件的寿命;随机效力系统中的效往服从指数分布。如某些元件的寿命;随机效力系统中

9、的效力时间;动物的寿命等都经常假定服从指数分布。力时间;动物的寿命等都经常假定服从指数分布。l 指数分布具有无记忆性:指数分布具有无记忆性:延续分布延续分布:指数分布举例指数分布举例x=0:0.1:30;y=exppdf(x,4);plot(x,y)例:例: =4 时的指数分布密度函数图时的指数分布密度函数图 2分布分布q 设随机随机变量量 X1, X2, , Xn 相互独立,且同服从正相互独立,且同服从正态分布分布 N(0,1),那么称随机,那么称随机变量量 n2= X12+X22+ +Xn2服从自在度服从自在度为 n 的的 2 分布,分布,记作作 ,亦称随机,亦称随机变量量 n2 为 2

10、变量。量。x=0:0.1:20; y=chi2pdf(x,4); plot(x,y)例:例: n=4 和和 n=10 时的时的 2 分布密度函数图分布密度函数图x=0:0.1:20; y=chi2pdf(x,10); plot(x,y)抽样分布抽样分布: F 分布分布q 设随机变量设随机变量 ,且,且 X 与与 Y 相相互独立,那么称随机变量互独立,那么称随机变量x=0.01:0.1:8.01;y=fpdf(x,4,10);plot(x,y)例:例: F(4,10) 的分布密度函数图的分布密度函数图为服从自在度为服从自在度 (m, n) 的的 F 分布。记做:分布。记做:抽样分布抽样分布: t

11、 分布分布q 设随机变量设随机变量 ,且,且 X 与与 Y 相相互独立,那么称随机变量互独立,那么称随机变量x=-6:0.01:6;y=tpdf(x,4);plot(x,y)例:例: t (4) 的分布密度函数图的分布密度函数图为服从自在度为服从自在度 n 的的 t 分布。记做:分布。记做:抽样分布抽样分布分布函数和逆分布函数分布函数和逆分布函数q q 统计量统计量 n样本均值样本均值n样本方差样本方差n样本协方差样本相关系数样本协方差样本相关系数n样本百分位数样本百分位数nq%上分位数上分位数=(100-q)%下分位数下分位数第八章随机模拟和统计分析MATLAB第八章随机模拟和统计分析n第一

12、部分 描画性统计分析n第二部分 统计图n第三部分 随机数的生成n第四部分 概率函数n第五部分 参数估计n第六部分 假设检验第一部分描画性统计分析MATLABmean(X)lX向量,前往向量的均值;向量,前往向量的均值;lX矩阵,前往矩阵每列元素均值构成的行向量矩阵,前往矩阵每列元素均值构成的行向量均均值等等描画性统计分析描画性统计分析min/max/median/std/var/sum/prod/cumsum/cumprod/ geomean几何平均数几何平均数 / harmmean调和平均值调和平均值 l同同mean 对随机变量对随机变量x,计算其根本统计量的命令:,计算其根本统计量的命令:

13、mean(x)std(x)skewness(x)median(x)var(x)kurtosis(x)均均值规范差范差偏度偏度中位数中位数方差方差峰度峰度数据比较数据比较Y,I=sort(X)l X向量向量(Y:X升序陈列升序陈列;I:Y中元素旧址中元素旧址) lX矩阵矩阵,对各列排序对各列排序Y,I=sortrows (X)lX矩阵矩阵,对各行排序对各行排序(Y:X升序陈列升序陈列;I:Y中元素旧址中元素旧址) range (X)lX的极差的极差描画性统计分析描画性统计分析cov(X,Y)lX,Y为向量为向量,各代表一个样本各代表一个样本,求得样本协方差求得样本协方差cov(X)lX矩阵矩阵,

14、各列为一个样本各列为一个样本,求得样本协方差矩阵求得样本协方差矩阵.对角线对角线元素是元素是X各列的方差各列的方差corcoef(X)l给出给出X列向量的相关系数矩阵列向量的相关系数矩阵协方差和相关系数协方差和相关系数corcoef(X,Y)l同同cov,给出给出X,Y向量的相关系数向量的相关系数描画性统计分析描画性统计分析 %求求A的第的第2列与第列与第3列列向量的相关系数矩列列向量的相关系数矩阵 协方差和相关系数例子协方差和相关系数例子Y=prctile(X,p)lX向量向量(X的的p%上分位数上分位数) lX矩阵矩阵(分别求各列的上分位数分别求各列的上分位数)trimmean(X,p)n

15、剔除上下各剔除上下各(p/2)%数据以后的均值数据以后的均值上分位数上分位数描画性统计分析描画性统计分析第二部分统计图MATLABhist(X,k)l将向量将向量X中数据等距分为中数据等距分为k组组,并作频数直方图,并作频数直方图,k=10bar(X,Y)l作向量作向量Y相对与相对与X的条形图的条形图bar(Y) l作向量作向量Y的条形图的条形图N,X=hist(Y,k)l不作图不作图,N前往数据频数前往数据频数,X前往各组的中心位置前往各组的中心位置boxplot(Y)l作向量作向量Y的箱型图的箱型图箱中包含了从箱中包含了从75%上分位数到上分位数到25%下分位数的数据,中间线是中位数下分位

16、数的数据,中间线是中位数2. 统计图统计图绘制直方图绘制直方图hist(X,K) % 二维条形直方图,显示数据的分二维条形直方图,显示数据的分布情形布情形l 将向量将向量 X 中的元素根据它们的数值范围进展分组,每一组中的元素根据它们的数值范围进展分组,每一组作为一个条形进展显示。条形直方图中的作为一个条形进展显示。条形直方图中的 x-轴反映了向量轴反映了向量 X 中元素数值的范围,直方图的中元素数值的范围,直方图的 y-轴轴 显示出向量显示出向量 X 中的元素落中的元素落入该组的数目。入该组的数目。K用来控制条形的个数,缺省为用来控制条形的个数,缺省为 10。x=1 2 9 3 5 8 0

17、2 3 5 2 10;hist(x); hist(x,5); hist(x,2);例:例:x=randn(1000,1);hist(x,100);histfit(X,NBINS) % 附有正附有正态态密度曲密度曲线线的直方的直方图图l NBINS 指定条形的个数,缺省指定条形的个数,缺省为为 X 中数据个数的平方根。中数据个数的平方根。 vata=randn(1,100); histfit(vata)第三部分随机数的生成MATLAB注:注:rand(n)=rand(n,n)randperm(N)l 生成一个由生成一个由 1:N组成的随机陈列组成的随机陈列randn(m,n)l 生成规范正态分布

18、生成规范正态分布N(0,1)的的 m n 随机矩阵随机矩阵rand(m,n) l 生成一个满足均匀分布的生成一个满足均匀分布的 m n 随机矩阵,矩阵的每随机矩阵,矩阵的每个元素都在个元素都在 (0,1) 之间。之间。perms(1:n)l 生成由生成由 1:n 组成的全陈列,共组成的全陈列,共 n! 个个3. 随机数的生成随机数的生成l name 的取的取值值可以是可以是normal Uniformpoisson betaexponentialgammageometricdiscrete Uniform. .random(name,A1,A2,A3,m,n)通用函数求指定分布的随机数通用函数

19、求指定分布的随机数 3. 随机数的生成随机数的生成binornd(k,p,m,n)l 生成参数为生成参数为k, p的的m n二项分布随机数矩阵二项分布随机数矩阵unidrnd(N,m,n)l 生成生成1,2,N的等概率的等概率m n 随机矩随机矩阵unifrnd(a,b,m,n)l 生成生成a,b区间上的延续型均匀分布区间上的延续型均匀分布m n随机数矩阵随机数矩阵3. 随机数的生成随机数的生成常用分布的随机数常用分布的随机数 R=mvnrnd(mu,sigma,m)l 生成生成n维正态分布数据,维正态分布数据,mu是是n维均值向量,维均值向量,sigma为为n阶协方差矩阵阶协方差矩阵(必需是

20、正定的必需是正定的),R是是 m n 矩阵,每矩阵,每行代表一个随机数行代表一个随机数normrnd(mu,sigma,m,n) l 生成均值为生成均值为mu,均方差为,均方差为sigma的的 m n 正态分布随正态分布随机数矩阵机数矩阵3. 随机数的生成随机数的生成第四部分概率函数MATLABcdf(name,x,p1,p2,m,n)l生成以生成以p1,p2,为参数的参数的m n 分布函数在分布函数在x处的的值. name表示分布表示分布类型的字符串型的字符串pdf(name,x,p1,p2,m,n) l 生成以生成以p1,p2,为参数的参数的m n 密度函数在密度函数在x处的的值. nam

21、e表示分布表示分布类型的字符串型的字符串4. 概率函数概率函数icdf(name,x,p1,p2,m,n) l生成以生成以p1,p2,为参数的参数的m n 逆分布函数逆分布函数(下分位下分位数数)在在x处的的值. name表示分布表示分布类型的字符串型的字符串(同同random)通用函数通用函数 4. 概率函数概率函数normpdf(x,mu,sigma,) l 前往参数为前往参数为 mu和和sigma的正态分布密度函数在的正态分布密度函数在x处的处的值值normcdf(x,mu,sigma) l正态分布函数值正态分布函数值norminv(p,mu,sigma) lnormcdf的逆函数,即的

22、逆函数,即p下分位数下分位数公用函数公用函数 例:例:x=-8:0.1:8;y=pdf(norm,x,0,1);y1=pdf(norm,x,1,2);plot(x,y,x,y1,:)n 注:注: y=pdf(norm,x,0,1) y=normpdf(x,0,1)相类似地,相类似地, y=pdf(beta,x,A,B) y=betapdf(x,A,B) y=pdf(bino,x,N,p) y=binopdf(x,N,p) 4. 概率函数概率函数分布概率函数分布概率函数(密度函数密度函数)例子例子累计概率函数累计概率函数(分布函数分布函数)例子例子逆分布函数逆分布函数(下分位数下分位数)例子例子

23、第五部分统计推断之参数估计MATLAB5. 参数估计参数估计q 知知总体的分布体的分布类型,型,总体参数未知,需求根据体参数未知,需求根据样本本对未知参数作出估未知参数作出估计。q 由于正由于正态分布情况分布情况发生的比生的比较多,故我多,故我们主要思主要思索正索正态分布的情形。分布的情形。q 对于未知参数的估于未知参数的估计,可分两种情况:,可分两种情况:l 点估点估计l 区区间估估计正态总体的参数估计正态总体的参数估计 设总体服从正态分布,那么其点估计和区间估计可同时由以下命令获得:muhat,sigmahat,muci,sigmaci =normfit(X,alpha)正态总体的参数估计

24、举例正态总体的参数估计举例其它分布的参数估计其它分布的参数估计1muhat, muci = expfit(X,alpha) 在在显著性程度著性程度alpha下,求指数分布的数据下,求指数分布的数据X的均的均值的点的点估估 计及其区及其区间估估计.2lambdahat, lambdaci = poissfit(X,alpha) 在在显著性程度著性程度alpha下,求泊松分布的数据下,求泊松分布的数据X 的参数的的参数的点点 估估计及其区及其区间估估计.3phat, pci = weibfit(X,alpha) 在在显著性程度著性程度alpha下,求下,求Weibull分布的数据分布的数据X 的参

25、的参数数 的点估的点估计及其区及其区间估估计.第六部分统计推断之假设检验MATLAB6. 假设检验假设检验q 对总体的分布律或分布参数作某种假体的分布律或分布参数作某种假设,根据抽取,根据抽取的的样本察看本察看值,运用数理,运用数理统计的分析方法,的分析方法,检验这种种假假设能否正确,从而决能否正确,从而决议接受假接受假设或回或回绝假假设,这就就是假是假设检验问题。 正态总体均值和方差的假设检验是最常用且相对简单的假设检验。 在总体服从正态分布的情况下,可用以下命令进展假设检验. h,sig = ztest(x,m,sigma,alpha,tail)检验数据数据 x 的关于均的关于均值的某一假

26、的某一假设能否成立,其中能否成立,其中sigma 为知方差,知方差, alpha 为显著性程度。著性程度。tail的缺省值为 0, alpha的缺省值为 0.05,sig 为假设成立的概率。h,sig = ttest(x,m,alpha,tail)检验数据数据 x 的关于均的关于均值的某一假的某一假设能否成立,其中能否成立,其中sigma 为知方差,知方差, alpha 为显著性程度。著性程度。tail的缺省值为 0, alpha的缺省值为 0.05,sig 为假设成立的概率。 p,h = ranksum(x,y )非参数假设检验非参数假设检验67非参数假设检验非参数假设检验例例 某商店某商店

27、为了确定向公司了确定向公司A或公司或公司B 购买某种某种产品,将品,将A,B公司公司以往各次以往各次进货的次品率的次品率进展比展比较,数据如下所示,数据如下所示,设两两样本独本独立。立。问两公司的商品的两公司的商品的质量有无量有无显著差著差别。设两公司的商品的两公司的商品的次品的密度最多只差一个平移,取次品的密度最多只差一个平移,取 = 0.05。A:7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5B :5.7 3.2 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3解解 分分别以以A、B记公司公司A、B 的商品次品

28、率的商品次品率总体的均体的均值。所需。所需检验的假的假设是是H0: A=B,H1:AB .Matlab实现如下:如下:a=7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5;b=5.7 3.2 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3;p,h=ranksum(a,b)求得求得p=0.8041,h=0,阐明两明两样本本总体均体均值相等的概率相等的概率为0.8041,并不很接近于零,并不很接近于零,且且h=0阐明可以接受原假明可以接受原假设,即以,即以为两个公司的商品的两个公司的商品的质量无明量无明显差差别。非参数

29、假设检验:总体分布的检验非参数假设检验:总体分布的检验normplot(x)l 统计绘图函数,进展正态分布检验。研讨阐明:假设数据统计绘图函数,进展正态分布检验。研讨阐明:假设数据是来自一个正态分布,那么该线为不断线形状;假设它是来是来自一个正态分布,那么该线为不断线形状;假设它是来自其他分布,那么为曲线形状。自其他分布,那么为曲线形状。例 一道工序用自动化车床延续加工某种零件,由于刀具损坏等会出现缺点.缺点是完全随机的,并假定消费任一零件时出现缺点时机均一样.任务人员是经过检查零件来确定工序能否出现缺点的.现积累有100次缺点纪录,缺点出现时该刀具完成的零件数如下: 459 362 624

30、542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539

31、790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851试察看该刀具出现缺点时完成的零件数属于哪种分布.假设检验举例假设检验举例解解 1、数据、数据输入入2、作频数直方图 hist(x,10) 3、分布的正态性检验 normplot(x)看起来刀具寿命服从正态分布刀具寿命近似服从正态分布结果果显示:示:这 100 个离散点非常接近个离散点非常接近倾斜直斜直线段,即段,即图形形为线性性的,因此可得的,因此可得结论:该批刀具的运用寿命近似服从正批刀具的运用寿命近似服从正态分布。分布

32、。4、参数估、参数估计计: muhat,sigmahat,muci,sigmaci = normfit(x)估计出该刀具的均值为594,方差204,均值的0.95置信区间为 553.4962,634.5038,方差的0.95置信区间为 179.2276,237.1329. 知刀具的寿命服从正态分布,如今方差未知的情况下,检验其均值 m 能否等于594.结果:h = 0,sig = 1.h=ttest(x,597,0.05)利用函数利用函数 ttest 进展展显著性程度著性程度为 alpha 的的 t 假假设检验检验结果:果:h=0。表示不回。表示不回绝零假零假设,阐明所提出的假明所提出的假设 “寿命均寿命均值为 597 是合理的。是合理的。5、假设检验、假设检验

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号