本科生必修课概率论与数理统计

上传人:ldj****22 文档编号:48786037 上传时间:2018-07-20 格式:PPT 页数:37 大小:511.50KB
返回 下载 相关 举报
本科生必修课概率论与数理统计_第1页
第1页 / 共37页
本科生必修课概率论与数理统计_第2页
第2页 / 共37页
本科生必修课概率论与数理统计_第3页
第3页 / 共37页
本科生必修课概率论与数理统计_第4页
第4页 / 共37页
本科生必修课概率论与数理统计_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《本科生必修课概率论与数理统计》由会员分享,可在线阅读,更多相关《本科生必修课概率论与数理统计(37页珍藏版)》请在金锄头文库上搜索。

1、本科生必修课:概率论与数理统计基于MATLAB的概率统计数值实验 三、数理统计主讲教师:董庆宽 研究方向:密码学与信息安全 Email : 个人主页:http:/ 1内容介绍三、数理统计1. Matlab统计工具箱中常见的统计命令2. 直方图和箱线图实验3. 抽样分布实验4. 参数估计和假设检验实验2Matlab统计工具箱中常见的统计命令1、基本统计量对于随机变量x,计算其基本统计量的命令如下:l均值:mean(x) 标准差:std(x)l中位数:median(x) 方差:var(x)l偏度:skewness(x) 峰度:kurtosis(x)2、频数直方图的描绘lA、给出数组data的频数表

2、的命令为: N,X=hist(data,k)l 此命令将区间min(data),max(data)分为k个小区间(缺省为10),返回数组 data落在每一个小区间的频数N和每一个小区间的中点X。lB、描绘数组data的频数直方图的命令为: hist(data,k)33、参数估计lA、对于正态总体,点估计和区间估计可同时由以下命令获得:lmuhat,sigmahat,muci,sigmaci=normfit(x,alpha)l此命令在显著性水平alpha下估计x的参数(alpha缺省值为5%),返回值 muhat是均值的点估计值,sigmahat是标准差的点估计值,muci是均值的区 间估计,s

3、igmaci是标准差的区间估计。lB、对其他分布总体,两种处理办法:一是取容量充分大的样本,按中 心极限定理,它近似服从正态分布,仍可用上面估计公式计算;二是使 用特定分布总体的估计命令,常用的命令如:lmuhat,muci=expfit(x,alpha)llambdahat, lambdaci=poissfit(x,alpha)lphat, pci=weibfit(x,alpha)Matlab统计工具箱中常见的统计命令44、正态总体假设检验lA、单总体均值的z检验:l h,sig,ci=ztest(x,m,sigma,alpha,tail)l检验数据x关于总体均值的某一假设是否成立,其中si

4、gma为已知方差, alpha为显著性水平,究竟检验什么假设取决于tail的取值:ltail=0,检验假设“x的均值等于m”ltail=1,检验假设“x的均值大于m”ltail=-1,检验假设“x的均值小于m”ltail的缺省值为0, alpha的缺省值为5%。l返回值h为一个布尔值,h=1表示可拒绝原假设, h=0表示不可拒绝原假 设,sig为假设成立的概率,ci为均值的1- alpha置信区间。Matlab统计工具箱中常见的统计命令5lB、单总体均值的t检验:l h,sig,ci=ttest(x,m,alpha,tail)lC、双总体均值的t检验:l h,sig,ci=ttest2(x,y

5、,alpha,tail)Matlab统计工具箱中常见的统计命令65、非参数检验:总体分布的检验lMatlab统计工具箱提供了两个对总体分布进行检验的命令 :lA、 h=normplot(x)l此命令显示数据矩阵x的正态概率图,如果数据来自于正态 分布,则图形显示出直线形态,而其他概率分布函数显示 出曲线形态。lB、h=weibplot(x)l此命令显示数据矩阵x的Weibull概率图,如果数据来自于 Weibull分布,则图形显示出直线形态,而其他概率分布函 数显示出曲线形态。Matlab统计工具箱中常见的统计命令7例1 在同一坐标轴上画box图,并对两个班的成绩进行初步 的分析比较。 两个教

6、学班各30名同学,在数学课程上,A班用新教学方法 组织教学,B班用传统方法组织教学,现得期末考试成绩如 下。A:82,92,77,62,70,36,80,100,74,64,63,56,72,78, 68,65,7270,58,92,79,92,65,56,85,73,61,71,42,89B:57,67,64,54,77,65,71,58,59,69,67,84,63,95,81 ,46,49, 60, 64,66,74,55,58,63,65,68,76,72,48,72解 clear x=82,92,77,62,70,36,80,100,74,64,63,56,72,78,68,65,7

7、2,70,58,92,79,92,6 5,56,85,73,61,71,42,89;57,67,64,54,77,65,71,58,59,69,67,84,63,95,81,46, 49,60,64,66,74,55,58,63,65,68,76,72,48,72;boxplot(x)2. 直方图和箱线图实验89从图中直观地看出,两个班成绩的分布是正态(对称 )的,A班成绩较为分散(方差大),B班成绩则较集中(方差 小)。A班成绩明显高于B班(均值比较并且A班25低分 段上限接近B班中值线,A班中值线接近B班25高分段下 限)。A班的平均成绩约为70分(中值),B班约为65分(中值) 。A班有

8、一名同学的成绩过低(离群),而B班成绩优秀的只 有一人(离群)。需要注意的是,从图中我们不能得出新教学方法一定优 于传统教学方法的结论,因为我们并不知道两个班级原有的 数学基础是怎样的。10例2 用模拟试验的方法直观地验证教材6.3抽样分布定理一的结论。假定变量 ,用随机数生成的方法模拟对 的500次简单随机抽样,每个样本的容量为16。利用这50016个样本数据直观地验证样本均值 的抽样分布为均值等于60、方差等于2516的正态分布,即11解 %1、用随机数生成的方法模拟简单随机抽样x=;%生成一个存放样本数据的空表(维数可变的动态矩阵)for byk=1:500 %循环控制,循环执行下面的指

9、令500次,本例中相当于 500次抽样 xx=normrnd(60,5,16,1);%生成一个来自N(60,25)的容量为16 的样本( 列向量) x=x,xx; %将样本数据逐列存入数表x,可从matlab的变量浏览器( workspace)中观察这个数表end %2、计算每个样本的样本均值(1500)xmean=mean(x);%可从变量浏览器中观察这500个数据%3、绘制500个样本均值数据的直方图k=ceil(1.87*(length(x)-1)(2/5);% 确定分组数h=histfit(xmean,k);%绘制附正态参考曲线的数据直方图set(h(1),FaceColor,c,Ed

10、geColor,w)%修饰,设置直方图线条颜色与 填充色%4、用这500个样本均值数据验证样本均值的均值和方差M=mean(xmean) %求(1500)样本的样本均值的均值V=var(xmean)%求(1500)样本的样本均值的方差1213M = 59.9879V = 1.4129M = 60.0117V = 1.3900M = 59.9749V = 1.5158M = 59.9929V = 1.5757M = 59.8809V = 1.685514例3 观察:用binornd模拟5000次投球过程,观察小 球堆积的情况。 clear;clf, n=5;p=0.5;m=5000;x=0:1:

11、nrand(seed,3)R=binornd(n,p,1,m);%模拟服从二项分布的随机数,相当于模拟 投球m 次for I=1:n+1 %开始计数 k= ; k=find(R=(I-1);%find是一个有用的指令,本语句的作用是找出R中等 于(I-1)元素下标,并赋予向量k中 h(I)=length(k)/m;%计算落于编号(I-1)的格子中的小球频率endbar(x,h),axis(-1 6 0 1)%画频率图title(fontsize18fontname华文新魏5000次投球小球堆积的频率图) 15 f=binopdf(x,n,p), bar(x,f), axis(-1 6 0 1)

12、 title(fontsize18fontname华文新魏B(5,0.5)理论分布图) 16三、MATLAB也为常用的三大统计分布提供了相应的pdf 、cdf、inv、stat、rnd类函数,具体分布类型函数名称如 下:分布类型 MATLAB名称 2 2分布 chi2 t分布 t F分布 f 非中心 2 2分布 ncx2 非中心t分布 nct 非中心F分布 ncf3. 抽样分布17例4 2 2分布的密度函数曲线解: %绘制不同自由度的卡方分布概率密度曲线clear,clfX=linspace(0,20,100);Y1=chi2pdf(X,1);%自由度等于1Y2=chi2pdf(X,3);%自

13、由度等于3Y3=chi2pdf(X,6);%自由度等于6plot(X,Y1,-g,X,Y2,-b,X,Y3,-k)title(fontsize18fontname华文新魏不同自由度的chi2分布概 率密度曲线的比较)text(0.6,0.6,fontsize12df:n=1)text(2.6,0.2,fontsize12df:n=3)text(8.6,0.09,fontsize12df:n=6)legend(df:n=1,df:n=3,df:n=6)1819解: %绘制t分布概率密度曲线clear,clfX=linspace(-4,4,100);Y0=normpdf(X,0,1);%标准正态分

14、布Y1=tpdf(X,45);%自由度为45Y2=tpdf(X,4);%自由度为4Y3=tpdf(X,2);%自由度为2YY0=normpdf(0,0,1);plot(X,Y0,.b,X,Y1,-c,X,Y2,-m,X,Y3,- k,0,0,0,YY0,:r)title(fontsize18fontname华文新魏不同自由度的t分 布概率密度曲线)legend(N(0,1),df:n=45,df:n=4,df:n=2)例5 t分布的密度函数曲线。2021解: %绘制F分布概率密度曲线clear,clfX=linspace(0,6,100);Y=fpdf(X,10,5);%自由度为10,5plot(X,Y)text(1.5,0.55,fontsize14df:n1=10,n2=5)例6 F分布的密度函数曲线。2223解:clear,clfX=linspace(0,6,100);Y11=fpdf(X,100,10);%自由度为100,10Y12=fpdf(X,5,10);%自由度为5,10Y21=fpdf(X,10,100);%自由度为10,100Y22=fpdf(X,10,5);%自由度为10,5subplot(2,1,1)plot(X,Y11,X,Y12)legend(df:n1=100,n2=10,df:n1=5,n2=10)title(fontsize18

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号