数据的统计分析【最终】

上传人:宝路 文档编号:46826632 上传时间:2018-06-28 格式:PPT 页数:71 大小:1.52MB
返回 下载 相关 举报
数据的统计分析【最终】_第1页
第1页 / 共71页
数据的统计分析【最终】_第2页
第2页 / 共71页
数据的统计分析【最终】_第3页
第3页 / 共71页
数据的统计分析【最终】_第4页
第4页 / 共71页
数据的统计分析【最终】_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《数据的统计分析【最终】》由会员分享,可在线阅读,更多相关《数据的统计分析【最终】(71页珍藏版)》请在金锄头文库上搜索。

1、第八章随机模拟和统计分析MATLAB预备知识概率和统计MATLAB3概率分布离散型随机变量: 离散均匀分布 二项分布 泊松分布 几何分布 超几何分布 负二项分布连续型随机变量: 连续均匀分布 指数分布 正态分布 对数正态分布 2分布 非中心2分布 t分布 非中心t分布 F分布 非中心F分布分布 分布 Rayleigh分布 Weibull分布常见的概率分布二项式分布Binomialbino 卡方分布Chisquarechi2 指数分布Exponentialexp F分布Ff 几何分布Geometricgeo 正态分布Normalnorm 泊松分布Poissonpoiss T分布Tt 均匀分布Un

2、iformunif 离散均匀分布Discrete Uniformunidn个点上的均匀分布q 如果随机变量 X 的分布列为:则称这种分布为离散均匀分布。记做:n=20; x=1:n; y=unidpdf(x,n); plot(x,y,o-)例: n=20 时的离散均匀分布密度函数图离散分布:几何分布q 几何分布是一种常见的离散分布l 在贝努里实验中,每次试验成功的概率为 p,设试验进行到第 次才出现成功,则 的分布满足:其右端项是几何级数 的一般项,于是人们称它为几何分布。x=0:30; y=geopdf(x,0.5); plot(x,y,o-)例: p=0.5 时的几何分布密度函数图离散分布

3、:0-1分布q 0-1分布 (Bernoulli分布)l 如果随机变量 X 的分布列为:则称这种分布为服从参数为p的0-1分布。离散分布:二项分布q 二项分布属于离散分布l 如果随机变量 X 的分布列为:则称这种分布为二项分布。记做:x=0:50; y=binopdf(x,500,0.05); plot(x,y,o-)例: n=500,p=0.05 时的二项分布密度函数图离散分布:n=1,服从参数为p的0-1分布Poisson 分布q 泊松分布也属于离散分布,是1837年由发个数 学家 Poisson 首次提出,其概率分布列为:记做:l 泊松分布是一种常用的离散分布,它与单位时间(或单位面积、

4、单位产品等)上的计数过程相联系。如:单位时间内 ,电话总机接到用户呼唤次数;1 平方米内,玻璃上的气泡数等。离散分布:Poisson 分布举例x=0:50; y=poisspdf(x,25); plot(x,y, o-)例: =25 时的泊松分布密度函数图均匀分布q 均匀分布(连续分布)l 如果随机变量 X 的密度函数为:则称 X 服从均匀分布。记做:l 均匀分布在实际中经常使用,譬如一个半径为 r 的汽车轮胎,因为轮胎上的任一点接触地面的可能性是相同的,所以轮胎圆周接触地面的位置 X 是服从 0,2r 上的均匀分布。连续分布:均匀分布举例x=-10:0.01:10; r=1; y=unifp

5、df(x,0,2*pi*r); plot(x,y,o-)正态分布q 正态分布(连续分布)l 如果随机变量 X 的密度函数为:则称 X 服从正态分布。记做:l 标准正态分布:N (0, 1)l 正态分布也称高斯分布,是概率论中最重要的一个分布。l 如果一个变量是大量微小、独立的随机因素的叠加,那么 它一定满足正态分布。如测量误差、产品质量、月降雨量等连续分布:正态分布举例x=-8:0.1:8; y=normpdf(x,0,1); y1=normpdf(x,1,2); plot(x,y,x,y1,:)例:标准正态分布和非标准正态分布密度函数图形指数分布q 指数分布(连续分布)l 如果随机变量 X

6、的密度函数为:则称 X 服从参数为 的指数分布。记做:l 在实际应用问题中,等待某特定事物发生所需要的时间往往服从指数分布。如某些元件的寿命;随机服务系统中的服 务时间;动物的寿命等都常常假定服从指数分布。l 指数分布具有无记忆性:连续分布:指数分布举例x=0:0.1:30; y=exppdf(x,4); plot(x,y)例: =4 时的指数分布密度函数图2分布q 设随机变量 X1, X2, , Xn 相互独立,且同服从正态 分布 N(0,1),则称随机变量 n2= X12+X22+ +Xn2服从 自由度为 n 的 2 分布,记作 ,亦称随 机变量 n2 为 2 变量。x=0:0.1:20;

7、 y=chi2pdf(x,4); plot(x,y)例: n=4 和 n=10 时的 2 分布密度函数图x=0:0.1:20; y=chi2pdf(x,10); plot(x,y)抽样分布:F 分布q 设随机变量 ,且 X 与 Y 相互独立,则称随机变量x=0.01:0.1:8.01; y=fpdf(x,4,10); plot(x,y)例: F(4,10) 的分布密度函数图为服从自由度 (m, n) 的 F 分布。记做:抽样分布:t 分布q 设随机变量 ,且 X 与 Y 相互独立,则称随机变量x=-6:0.01:6; y=tpdf(x,4); plot(x,y)例: t (4) 的分布密度函数

8、图为服从自由度 n 的 t 分布。记做:抽样分布分布函数和逆分布函数q q 统计量 n样本均值n样本方差n样本协方差样本相关系数n样本百分位数 q%上分位数=(100-q)%下分位数第八章随机模拟和统计分析MATLAB第八章随机模拟和统计分析n第一部分 描述性统计分析n第二部分 统计图n第三部分 随机数的生成n第四部分 概率函数n第五部分 参数估计n第六部分 假设检验第一部分描述性统计分析MATLABmean(X)lX向量,返回向量的均值; lX矩阵,返回矩阵每列元素均值构成的行向量均值等描述性统计分析min/max/median/std/var/sum/prod/ cumsum/cumpro

9、d/ geomean几何平均数 / harmmean调和平均值 l同mean对随机变量x,计算其基本统计量的命令:mean(x) std(x) skewness(x) median(x) var(x) kurtosis(x)均值 标准差 偏度 中位数 方差 峰度数据比较Y,I=sort(X)l X向量(Y:X升序排列;I:Y中元素原址) lX矩阵,对各列排序Y,I=sortrows (X)lX矩阵,对各行排序(Y:X升序排列;I:Y中元素原址) range (X)lX的极差描述性统计分析cov(X,Y)lX,Y为向量,各代表一个样本,求得样本协方差cov(X)lX矩阵,各列为一个样本,求得样本

10、协方差矩阵.对角线 元素是X各列的方差corcoef(X)l给出X列向量的相关系数矩阵协方差和相关系数corcoef(X,Y)l同cov,给出X,Y向量的相关系数描述性统计分析%求A的第2列与第3列列向量的相关系数矩阵 协方差和相关系数例子Y=prctile(X,p)lX向量(X的p%上分位数) lX矩阵(分别求各列的上分位数)trimmean(X,p)n剔除上下各(p/2)%数据以后的均值上分位数描述性统计分析第二部分统计图MATLABhist(X,k)l将向量X中数据等距分为k组,并作频数直方图,k=10bar(X,Y)l作向量Y相对与X的条形图bar(Y) l作向量Y的条形图N,X=hi

11、st(Y,k)l不作图,N返回数据频数,X返回各组的中心位置 boxplot(Y)l作向量Y的箱型图箱中包含了从75%上分位数到 25%下分位数的数据,中间线是中位数2. 统计图绘制直方图hist(X,K) % 二维条形直方图,显示数据的分布情形l 将向量 X 中的元素根据它们的数值范围进行分组,每一组 作为一个条形进行显示。条形直方图中的 x-轴反映了向量 X 中元素数值的范围,直方图的 y-轴 显示出向量 X 中的元素落 入该组的数目。K用来控制条形的个数,缺省为 10。x=1 2 9 3 5 8 0 2 3 5 2 10; hist(x); hist(x,5); hist(x,2);例:

12、x=randn(1000,1); hist(x,100);histfit(X,NBINS) % 附有正态密度曲线的直方图l NBINS 指定条形的个数,缺省为 X 中数据个数的平方根。 vata=randn(1,100); histfit(vata)第三部分随机数的生成MATLAB注:rand(n)=rand(n,n)randperm(N)l 生成一个由 1:N组成的随机排列randn(m,n)l 生成标准正态分布N(0,1)的 m n 随机矩阵rand(m,n) l 生成一个满足均匀分布的 m n 随机矩阵,矩阵的每个元素都在 (0,1) 之间。perms(1:n)l 生成由 1:n 组成的

13、全排列,共 n! 个3. 随机数的生成l name 的取值可以是normal Uniform poisson beta exponential gamma geometric discrete Uniform. .random(name,A1,A2,A3,m,n)通用函数求指定分布的随机数 3. 随机数的生成binornd(k,p,m,n)l 生成参数为k, p的m n二项分布随机数矩阵unidrnd(N,m,n)l 生成1,2,N的等概率m n 随机矩阵unifrnd(a,b,m,n)l 生成a,b区间上的连续型均匀分布m n随机数矩阵3. 随机数的生成常用分布的随机数 R=mvnrnd(m

14、u,sigma,m)l 生成n维正态分布数据,mu是n维均值向量,sigma 为n阶协方差矩阵(必须是正定的),R是 m n 矩阵,每 行代表一个随机数normrnd(mu,sigma,m,n) l 生成均值为mu,均方差为sigma的 m n 正态分布随机数矩阵3. 随机数的生成第四部分概率函数MATLABcdf(name,x,p1,p2,m,n)l生成以p1,p2,为参数的m n 分布函数在x处的值. name表示分布类型的字符串pdf(name,x,p1,p2,m,n) l 生成以p1,p2,为参数的m n 密度函数在x处的值. name表示分布类型的字符串4. 概率函数icdf(nam

15、e,x,p1,p2,m,n) l生成以p1,p2,为参数的m n 逆分布函数(下分位 数)在x处的值. name表示分布类型的字符串(同 random)通用函数 4. 概率函数normpdf(x,mu,sigma,) l 返回参数为 mu和sigma的正态分布密度函数在x处 的值normcdf(x,mu,sigma) l正态分布函数值norminv(p,mu,sigma) lnormcdf的逆函数,即p下分位数专用函数 例:x=-8:0.1:8; y=pdf(norm,x,0,1); y1=pdf(norm,x,1,2); plot(x,y,x,y1,:)n 注:y=pdf(norm,x,0,1) y=normpdf(x,0,1)相类似地,y=pdf(beta,x,A,B) y=betapdf(x,A,B)y=pdf(bino,x,N,p) y=binopdf(x,N,p) 4. 概率函数分布概率函数(密度函数)例子累计概率函数(分布函数)例子逆分布函数(下分位数)例子第五部分统计推断之参数估计MATLAB5. 参数估计q 已知总体的分布类型,总体参数未知,需要根据样本对未知参数作出估计。q 由于正态分布情况发生的比较多,故我

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号