MATLAB-第10讲数据统计分析课件

上传人:des****85 文档编号:321545696 上传时间:2022-07-03 格式:PPT 页数:48 大小:642.50KB
返回 下载 相关 举报
MATLAB-第10讲数据统计分析课件_第1页
第1页 / 共48页
MATLAB-第10讲数据统计分析课件_第2页
第2页 / 共48页
MATLAB-第10讲数据统计分析课件_第3页
第3页 / 共48页
MATLAB-第10讲数据统计分析课件_第4页
第4页 / 共48页
MATLAB-第10讲数据统计分析课件_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《MATLAB-第10讲数据统计分析课件》由会员分享,可在线阅读,更多相关《MATLAB-第10讲数据统计分析课件(48页珍藏版)》请在金锄头文库上搜索。

1、数学建模与数学实验数学建模与数学实验经济数学系数学建模研究室数据的统计描述和分析数据的统计描述和分析7/3/20221实验目的实验目的实验内容实验内容2、掌握用数学软件包求解统计问题。、掌握用数学软件包求解统计问题。1、直观了解统计基本内容。、直观了解统计基本内容。1 1、统计的基本理论。、统计的基本理论。3 3、实验作业。、实验作业。2、用数学软件包求解统计问题。、用数学软件包求解统计问题。7/3/20222统计的基本概念统计的基本概念参数估计参数估计假设检验假设检验数数据据的的统统计计描描述述和和分分析析7/3/20223一、统计量一、统计量7/3/202247/3/20225二、分布函数

2、的近似求法二、分布函数的近似求法7/3/20226三、几个在统计中常用的概率分布三、几个在统计中常用的概率分布-4-2024600.050.10.150.20.250.30.350.41正态分布正态分布),(2smN密度函数:222)(21)(smsp-=xexp分布函数:dyexFyx222)(21)(smsp-=其中m为均值,2s为方差,+-x.标准正态分布:N(0,1)密度函数2221)(xex-=pjdyexyx2221)(-=Fp, 分布函数7/3/202277/3/202287/3/20229返回返回F分布F(10,50)的密度函数曲线7/3/2022107/3/202211一、点

3、估计的求法一、点估计的求法(一)矩估计法7/3/202212(二)极大似然估计法7/3/202213二、区间估计的求法二、区间估计的求法7/3/2022141、已知、已知DX,求,求EX的置信区间的置信区间2 未知方差未知方差DX,求,求EX的置信区间的置信区间(一一)数学期望的置信区间数学期望的置信区间(二)方差的区间估计(二)方差的区间估计返回返回7/3/2022151.参数检验参数检验:如果观测的分布函数类型已知,这时构造出的 统计量依赖于总体的分布函数,这种检验称为参数检验. 参数检验的目的往往是对总体的参数及其有关性质作出明 确的判断. 对总体X的分布律或分布参数作某种假设,根据抽取

4、的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设.2.非参数检验非参数检验:如果所检验的假设并非是对某个参数作出明 确的判断,因而必须要求构造出的检验统计量的分布函数 不依赖于观测值的分布函数类型,这种检验叫非参数检验. 如要求判断总体分布类型的检验就是非参数检验.7/3/202216假设检验的一般步骤是假设检验的一般步骤是:7/3/202217(一)单个正态总体均值检验(一)单个正态总体均值检验一、参数检验一、参数检验7/3/2022187/3/202219(二)单个正态总体方差检验(二)单个正态总体方差检验7/3/202220(三)两个正态总体均值检验

5、(三)两个正态总体均值检验7/3/202221(四)两个正态总体方差检验(四)两个正态总体方差检验7/3/202222二、非参数检验二、非参数检验(二)概率纸检验法(二)概率纸检验法 概率纸是一种判断总体分布的简便工具.使用它们,可以很快地判断总体分布的类型.概率纸的种类很多.返回返回7/3/202223统计工具箱中的基本统计命令统计工具箱中的基本统计命令1.数据的录入、保存和调用数据的录入、保存和调用2.基本统计量基本统计量3.常见概率分布的函数常见概率分布的函数4.4.频频 数数 直直 方方 图图 的的 描描 绘绘5.参数估计参数估计6.假设检验假设检验7.综合实例综合实例返回返回7/3/

6、202224一、数据的录入、保存和调用一、数据的录入、保存和调用 例例1 上海市区社会商品零售总额和全民所有制职工工资总额的数据如下统计工具箱中的基本统计命令统计工具箱中的基本统计命令7/3/2022251、年份数据以1为增量,用产生向量的方法输入。 命令格式: x=a:h:bx=a:h:b t=78:872、分别以x和y代表变量职工工资总额和商品零售总额。 x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.03、将变量t、x、y的数据

7、保存在文件data中。 save data t x y 4、进行统计分析时,调用数据文件data中的数据。 load dataTo MATLAB(txy)7/3/2022261、输入矩阵:data=78,79,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.02、将矩阵data的数据保存在文件data1中:save data1 data3 3、进行统计分析时,先用命令: load da

8、ta1load data1 调用数据文件data1中的数据,再用以下命令分别将矩阵data的第一、二、三行的数据赋给变量t、x、y: t=data(1,:) x=data(2,:) y=data(3,:)若要调用矩阵data的第j列的数据,可用命令: data(:,j)To MATLAB(data)返回返回7/3/202227二、基本统计量二、基本统计量对随机变量x,计算其基本统计量的命令如下:均值:mean(x)mean(x)中位数:median(x)median(x)标准差:std(x)std(x) 方差:var(x)var(x)偏度:skewness(x) 峰度:kurtosis(x)例

9、例 对例1中的职工工资总额x,可计算上述基本统计量。To MATLAB(tjl)返回返回7/3/202228三三、常见概率分布的函数常见概率分布的函数Matlab工具箱对每一种分布都提供五类函数,其命令字符为:概率密度:pdf pdf 概率分布:cdfcdf逆概率分布:inv inv 均值与方差:statstat随机数生成:rnd (当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.)7/3/202229在Matlab中输入以下命令:x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2)

10、;plot(x,y,x,z)1、密度函数、密度函数:p=normpdf(x,mu,sigma) (当mu=0,sigma=1时可缺省)To MATLAB(liti2)如对均值为mu、标准差为sigma的正态分布,举例如下:7/3/202230To MATLAB(liti3)3、逆概率分布、逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得PX50),按中心极限定理,它近似地 服从正态分布;二.使用Matlab工具箱中具有特定分布总体的估计命令.(1)muhat, muci = expfit(X,alpha)- 在显著性水平alpha下,求指数分布的数据X的均值的点估计及

11、其区间估计.(2)lambdahat, lambdaci = poissfit(X,alpha)- 在显著性水平alpha下,求泊松分布的数据X 的参数的点估计及其区间估计.(3)phat, pci = weibfit(X,alpha)- 在显著性水平alpha下,求Weibull分布的数据X 的参数的点估计及其区间估计.返回返回7/3/202235六、假设检验六、假设检验 在总体服从正态分布的情况下,可用以下命令进行假设检验.1、总体方差总体方差sigma2已知时,总体均值的检验使用已知时,总体均值的检验使用 z-检验检验 h,sig,ci = ztest(x,m,sigma,alpha,t

12、ail)检验数据 x 的关于均值的某一假设是否成立,其中sigma 为已知方差, alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 m ”tail = 1,检验假设“x 的均值大于 m ”tail =-1,检验假设“x 的均值小于 m ”tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.7/3/202236 例例7 Matlab统计工具箱中的数据文件gas.mat.中提供了美国

13、1993年一月份和二月份的汽油平均价格(price1,price2分别是一,二月份的油价,单位为美分),它是容量为20的双样本.假设一月份油价的标准偏差是一加仑四分币(=4),试检验一月份油价的均值是否等于115.解解 作假设:m = 115.首先取出数据,用以下命令: load gas然后用以下命令检验 h,sig,ci = ztest(price1,115,4)返回:h = 0,sig = 0.8668,ci = 113.3970 116.9030.检验结果: 1. 布尔变量h=0, 表示不拒绝零假设. 说明提出的假设均值115 是合理的. 2. sig-值为0.8668, 远超过0.5,

14、 不能拒绝零假设 3. 95%的置信区间为113.4, 116.9, 它完全包括115, 且精度很 高. To MATLAB(liti7)7/3/2022372、总体方差总体方差sigma2未知时,总体均值的检验使用未知时,总体均值的检验使用t-检验检验 h,sig,ci = ttest(x,m,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 m ”tail = 1,检验假设“x 的均值大于 m ”tail =-1,检验假设“x 的均值小于 m ”tail的缺省

15、值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.7/3/202238返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.检验结果: 1. 布尔变量h=1, 表示拒绝零假设. 说明提出的假 设油价均值115是不合理的. 2. 95%的置信区间为116.8 120.2, 它不包括 115, 故不能接受假设. 3. sig-值为4.9517e-004, 远小于0.5, 不能接受零 假设. To MATLAB(liti8)例

16、例8 试检验例8中二月份油价 Price2的均值是否等于115.解解 作假设:m = 115,price2为二月份的油价,不知其方差,故用以下命令检验h,sig,ci = ttest( price2 ,115)7/3/2022393、两总体均值的假设检验两总体均值的假设检验使用使用 t-检验检验 h,sig,ci = ttest2(x,y,alpha,tail)检验数据 x ,y 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 y 的均值 ”tail = 1,检验假设“x 的均值大于 y 的均值 ”tail =-1,检验假设“x 的均值小于 y 的均值 ”tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为与x与y均值差的的 1-alpha 置信区间.7/3/202240返回:h = 1,sig = 0.0083,ci =-5.8,-0.9.检验结果:1. 布尔变量h=

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号