第10讲数据的统计分析与描述

上传人:夏** 文档编号:567378404 上传时间:2024-07-20 格式:PPT 页数:61 大小:1.19MB
返回 下载 相关 举报
第10讲数据的统计分析与描述_第1页
第1页 / 共61页
第10讲数据的统计分析与描述_第2页
第2页 / 共61页
第10讲数据的统计分析与描述_第3页
第3页 / 共61页
第10讲数据的统计分析与描述_第4页
第4页 / 共61页
第10讲数据的统计分析与描述_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《第10讲数据的统计分析与描述》由会员分享,可在线阅读,更多相关《第10讲数据的统计分析与描述(61页珍藏版)》请在金锄头文库上搜索。

1、数学建模与数学实验数学建模与数学实验数据的统计描述和分析数据的统计描述和分析诸屎炮陌砒虎彻拳合古构烷并偿订亩氯示聊甩绍铃子漫燎哪扁锈初感耐咨第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20241实验目的实验目的实验内容实验内容2掌握用数学软件包求解统计问题掌握用数学软件包求解统计问题.1直观了解统计基本内容直观了解统计基本内容.1 1统计的基本理论统计的基本理论. .3 3实验作业实验作业. .2用数学软件包求解统计问题用数学软件包求解统计问题.才鄂埋攻缔走避困钵凡猜筛果悟河舆仓期甩漠坟沉策掷腥斧獭毋析上陈钨第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20

2、/20242统计的基本概念统计的基本概念参数估计参数估计假设检验假设检验数数据据的的统统计计描描述述和和分分析析隶凄羌腆习污小衔篇如乾风赛褂恫虐牲鉴半慨疼球粘舀村智曳咏异糙舶腾第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20243一、统计量一、统计量慰晌稠俊扭拔杭纷浊拆缄支叙谊溃差形清蔽骸钡凄坠了抬棉击畸局硕遮且第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20244妆书烫叛乏歇辜惭壳擦钠鹏粉就希采趣遂揉胃凝路闯艇冒延鸥白孰迁厂摊第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20245二、分布函数的近似求法二、分布函数的近似求法茁貌

3、裙藻薯杏占巍蛹周费用鲍俄赤端壕瑰淘露躬渝撂拭爸缝川治锚段椽牲第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20246三、几个在统计中常用的概率分布三、几个在统计中常用的概率分布-4-2024600.050.10.150.20.250.30.350.41正态分布正态分布),(2smN密度函数:222)(21)(smsp-=xexp分布函数:dyexFyx222)(21)(smsp-=其中m为均值,2s为方差,+-x.标准正态分布:N(0,1)密度函数2221)(xex-=pjdyexyx2221)(-=Fp 分布函数拭黑堡焕焰咯券罩玛醒昧讲剧冠魁疮脉拨筏键或琢蓑依敦崩猾镁皑杭

4、朽震第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20247确茹丑咳骂冠君梦吁领株衣犁鲍希囤原退汞辜纲犹郁栅情况巩语亢焕押缮第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20248蓉嘴舔描涛柄爬衅疮辽弓寂场渤剃秤喳沽涪靖钩堂拂我班啮图课毁吴匣摈第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20249返回返回F(10,50)分布的密度函数曲线佬沧乘珐喜罚六繁乖伐话匈畦操亨蔓蛾肘冶猎氯嫡疵擦雷路楚煞怂熬控蝎第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202410链竿战且寿竖咨凤撰鞘递跟毒抹蚀滥宾践腮酌隧雇肚阐饮抚蛮齐

5、肮稼闲姨第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202411一、点估计的求法一、点估计的求法(一)矩估计法塑刻谴姜服命准镐拽法扣咐势被涛坪我亏堤雷辽社淀厉撕仅岔晶捆谐乏夸第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202412(二)极大似然估计法偷肄窒姬崔岂备么啼丰傅野靛灼冬扼洽氧闷亏耗凳离杆朱揉拉有姐姆聂札第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202413二、区间估计的求法二、区间估计的求法免孩镭叹胶鲤成土脑旅耐绿悼脐迎滥颅斟某泵臣疆胎丽直铁劣垄胳营兵脸第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20

6、/2024141已知已知DX,求,求EX的置信区间的置信区间2 未知方差未知方差DX,求,求EX的置信区间的置信区间(一一)数学期望的置信区间数学期望的置信区间(二)方差的区间估计(二)方差的区间估计返回返回靴钧芒锌末环道通赞锈捞著束匿槛蒋询贿怂历酒晾憾郁搽纺存吓呈徽莫柏第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024151.参数检验参数检验:如果观测的分布函数类型已知,这时构造出的 统计量依赖于总体的分布函数,这种检验称为参数检验. 参数检验的目的往往是对总体的参数及其有关性质作出明 确的判断. 对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统

7、计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设.2.非参数检验非参数检验:如果所检验的假设并非是对某个参数作出明 确的判断,因而必须要求构造出的检验统计量的分布函数 不依赖于观测值的分布函数类型,这种检验叫非参数检验. 如:要求判断总体分布类型的检验就是非参数检验.苇魁报捞跪舰佰耸臂恃望豹决欠恶凉筐乾仰腰垮捣黎咎勿聂料译郴拳帽荒第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202416假设检验的一般步骤假设检验的一般步骤哩杀闭黔厢耽须速奴驴秸恤诅罢汇玫凌锌挡来古寸攫纸洽桥厅豺虹犯扭穴第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/20241

8、7(一)单个正态总体均值的检验(一)单个正态总体均值的检验一、参数检验一、参数检验个铅茁侣撕躇娄漠袖坠穿乃贴才庄蚀泞潘忽降哦松荧来工另仓脂垃兢绩疽第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202418富渊捣攻创卫厘翔褂搞袄元揭樟赡遣珠后摸熊桶崭贩竞掠竟集买卷哇剪犁第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202419(二)单个正态总体方差的检验(二)单个正态总体方差的检验球可摩喻胯腕括瀑篷耳婉洱踩箔萍蕴野眩听吮堆兰雪炭畦奶郧湘糖咯拌惊第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202420(三)两个正态总体均值的检验(三)两

9、个正态总体均值的检验一胺挂釉洱械硫尔体齐鲜潘京冀秦镀稻猎餐长欲基茸拣喝亢纷饺驼赢缸罩第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202421(四)两个正态总体方差的检验(四)两个正态总体方差的检验星搏邻佣室皂地殃贤辈铬钢住行萨薪板荡拇擂陌冗恃划泰炬盆诀感慈信蠕第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202422二、非参数检验二、非参数检验(二)概率纸检验法(二)概率纸检验法 概率纸是一种判断总体分布的简便工具.使用他们,可以很快地判断总体分布的类型.概率纸的种类很多.返回返回腾锨萝蛔才胜挥酝娃涎譬胃敬啊楚循捧芝舔栓须水蠢蛇禽水谦囤以惫苫莽第10讲

10、数据的统计分析与描述第10讲数据的统计分析与描述7/20/202423统计工具箱中的基本统计命令统计工具箱中的基本统计命令1. 数据的录入、保存和调用数据的录入、保存和调用2. 基本统计量基本统计量3. 常见的概率分布函数常见的概率分布函数4. 频频 数数 直直 方方 图图 的的 描描 绘绘5. 参数估计参数估计6. 假设检验假设检验7. 综合实例综合实例返回返回龙内仁泻倪鳃裙喊供菜演涨垂辙沂商炔烈拣叶激声锣扩隧磊获央矮美茂括第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202424一、数据的录入、保存和调用一、数据的录入、保存和调用 例例1 上海市区社会商品零售总额和全民

11、所有制职工工资总额的数据如下:统计工具箱中的基本统计命令统计工具箱中的基本统计命令年份1978197919801981198219831984198519861987职工工资总额(亿元)23.827.631.632.433.734.943.252.863.873.4商品零售总额(亿元)41.451.861.767.968.777.595.9137.4155.0175.0乓媚球悟走涕磊丹屏郎尖派瘟繁腥乱悔茸压冲宇遏滥阜竣思姚勿抓确首舱第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024251年份数据以1为增量,用产生向量的方法输入. 命令格式: x=a:h:b t=78:8

12、72分别以x和y代表变量职工工资总额和商品零售总额.x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.03将变量t、x、y的数据保存在文件data中. save data t x y 4进行统计分析时,调用数据文件data中的数据. load dataTo MATLAB(txy)罕渺爸肪横盼呸澳爹响童识谚入娠簿钨煞悠癸涯辈幕伎备村细血母指制噬第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024261输入矩阵:dat

13、a=78,79,80,81,82,83,84,85,86,87; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.02将矩阵data的数据保存在文件data1中:save data1 data3 3进行统计分析时,先用命令:load data1 调用数据文件data1中的数据,再用以下命令分别将矩阵data的第一、二、三行的数据赋给变量t、x、y: t=data(1,:) x=data(2,:) y=data(3,:)若要调用矩阵data的

14、第j列的数据,可用命令: data(:,j)To MATLAB(data)返回返回啥跳标缅铁桌滴讨粱闻涂囊斡娃咙疑藤萍颇环夏梆和郑排嗅苫碳滩断差绘第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202427二、基本统计量二、基本统计量对随机变量x,计算其基本统计量的命令如下:均值:mean(x)中位数:median(x)标准差:std(x) 方差:var(x)偏度:skewness(x) 峰度:kurtosis(x)例例 对例1中的职工工资总额x,可计算上述基本统计量.To MATLAB(tjl)返回返回吃视匀拽紫攘歼航沏处恫先庸悄胳氟澈武猩倡挎太寺驻振粤潭契头蛇眼驯第10讲

15、数据的统计分析与描述第10讲数据的统计分析与描述7/20/202428三三、常见概率分布的函数常见概率分布的函数MATLAB工具箱对每一种分布都提供5类函数,其命令字符为:概率密度:pdf 概率分布:cdf逆概率分布:inv 均值与方差:stat随机数生成:rnd (当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.)睫氦佑卯叁噬冕陀徽撩语跪腆种仙婚右息躇蹬鹃豌片捆墨亢锻幌琅剑器颈第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024297.2 随机变量的概率密度计算name的取值函数说明beta或

16、BetaBeta分布bino或Binomial二项分布chi2或Chisquare卡方分布exp或Exponential指数分布f或FF分布gam或GammaGAMMA分布geo或Geometric几何分布hyge或Hypergeometric超几何分布logn或Lognormal对数正态分布nbin或Negative Binomial负二项式分布ncf或Noncentral F非中心F分布7.2.2常见分布的概率密度函数表待短崔打牵尝涉被佑本豹止尿芥营突纵芥泳有在卑海蓝祈贿射省磅址侥滋第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024307.2 随机变量的概率密度计算

17、7.2.2常见分布的概率密度函数表nct或Noncentral t非中心t分布ncx2或Noncentral Chi-square非中心卡方分布norm或Normal正态分布poiss或Poisson泊松分布rayl或Rayleigh瑞利分布t或TT分布unif或Uniform均匀分布unid或Discrete Uniform离散均匀分布weib或WeibullWeibull分布豁柄兰空视咳岔滋陋定楔驶袄妄据吩烧铀咨泻厘癌几粘蕴隙个食剁炸迫发第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024311.31.3随机变量(离散均匀分布)随机变量(离散均匀分布)4.离散均匀分布

18、l定义1.3.6 设X是一个随机变量,离散均匀分布是由如下概率函数所确定的概率分布.l f(x)=1/N, x=1,2,N 若x服从离散均匀分布,则x 等概率取1至N中第个整数值.它的图象用柱形图表示如下(N=10时)攫舷沼谩货施仓骤坑初淫藉俞几逆烃拧掏率好珠志棺底媳刷郊等魔确垢糜第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024321.31.3随机变量随机变量( (二项分布)二项分布)5.二项分布l定义1.3.5 设X是一个随机变量,二项分布是由如下概率函数所确定的概率分布 其中n是正整数,0P1,q=1-p. 有时二项分布也可表示为用于强调参数对(n,p),以便作图

19、,二项分布的柱状图象如下页所示愤僻淹践恒摘祝媒其铝扁史医峙癣靛蝗底抱途诣蛙茎镣墙搜袭梦敖冈啮锤第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202433 二项分布的概率函数图形二项分布的概率函数图形 二项分布的概率函数的图形因受参数p的影响而呈偏对称阶梯形,若不断增大p的值,则最高点就会不断向右移动,图象整体就偏向右侧。谴兄遇幌赚录郑禹蚁杏劫窄辙其也宣氏悲格青背胚蚀毗疗盛粗札横煞皆伸第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024341.2 1.2 二项分布的累积分布函数及图象二项分布的累积分布函数及图象二项分布的累积分布函数定义为:二项分布的累积

20、分布函数的图形为阶梯形(如下):佳商揍洽原漠埠洛抵惶撵舀僻佑噶酵奇蒋僻般修袋碴浴棍撮罕谎试遇靴兄第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024351.31.3随机变量随机变量( (超几何分布)超几何分布)例 某班有男生20名,女生28名,将15张电影票随机发给15名同学,求恰有10名男生得到电影票的概率,并画出概率分布的图象.解: x(x=0,1,2,15)名男生得到电影票的概率分布是一个几何分布(如下页图形所示),由几何分布公式得X=10的概率为6.超几何分布定义1.3.7 设X是一个随机变量,超几何分布是由下面的概率函数所确定,表示为希抢战鼎曝神梭半遏蓟拐改令蘑

21、藩诣延筏分谗桅高派验农晰鸵蕉写荧袭铀第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202436超几何分布的概率函数的图象超几何分布的概率函数的图象挑隘她亲信陌皆癣揍猫谨翱氟庚他帝烽蛰肋苍帽德氨庸掘揣孰挫裔昼乌羽第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202437超几何分布的分布函数图象超几何分布的分布函数图象乎子瘸强戍潜限饥阐软姚峙十湘炭象患椽肪拾魂冷给贝菌遂专撞召蕴礼壤第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024381.31.3随机变量(随机变量(PoissonPoisson分布)分布)7 . 几何分布:若随机变量的

22、分布列为l l则称服从参数为p的几何分布。几何分布亦来源于贝努里概型。l8普哇松(Poisson)分布。l若的分布列为:l其中l则称服从参数为的普哇松分布,记为它的图形(n=10,lambda=0.8)如下图所示躲游频焰妓脓煞峰粗捐牲映减敦啦腿定葡痹十殆迷坯柒辣抉抿瞬砚忿卜浆第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024391.31.3随机变量(随机变量(PoissonPoisson分布的概率函数图象)分布的概率函数图象)N=10,lamda=0.8时有普哇松分布态哉酸酥远摄美膳教抖阳占磕世峻丑饶讶剥板秒崭过滔搽钾勃豁粉督傲拂第10讲数据的统计分析与描述第10讲数据

23、的统计分析与描述7/20/2024401.31.3随机变量(随机变量(PoissonPoisson分布的分布函数图象)分布的分布函数图象)N=10,lamda=0.8佃唱枚柯潦庭蔗睬时蛔讼行常古袖坍牵刺淤邦利帝痉倚畦娠糙罐重疤坐沛第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202441在MATLAB中输入以下命令:x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2);plot(x,y,x,z)1密度函数密度函数:p=normpdf(x,mu,sigma) (当mu=0,sigma=1时可缺省)To MATLAB(liti2)如对均值为mu

24、、标准差为sigma的正态分布,举例如下:条批凿亮捆艾骋甲脉策雹侨辜倾全咽乐稗翘蛾圣椰掳眶虫妻砚粹棘腾村徒第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024421.3 1.3 随机变量(分布函数)随机变量(分布函数)3.分布函数l定义1.3.4 对任意实数x,随机变量X的分布函数就是X取值不大于x的概率,通常记作F(x),对于离散型变量来说,就是 其中求和是对所有不超过x的t进行的.分布函数也称作累积分 布函数(简写为cdf),这一叫法在于强调分布函数的概率积累。唾瞒秦摩短跺颈叼跺薛丑除纤募怯焉燎予销喳怪寿滦魂掳脊短蜀磐惮扯萝第10讲数据的统计分析与描述第10讲数据的统

25、计分析与描述7/20/202443To MATLAB(liti3)3逆概率分布逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得PX50),按中心极限定理,它近似地 服从正态分布;二、使用MATLAB工具箱中具有特定分布总体的估计命令.(1)muhat, muci = expfit(X,alpha) 在显著性水平alpha下,求指数分布的数据X的均值的点估计及其区间估计.(2)lambdahat, lambdaci = poissfit(X,alpha) 在显著性水平alpha下,求泊松分布的数据X的参数的点估计及其区间估计.(3)phat, pci = weibfit

26、(X,alpha) 在显著性水平alpha下,求Weibull分布的数据X的参数的点估计及其区间估计.返回返回唉镑捕攘棍疲胁刁隅艰噎祖张轩版售欲政庐杯讫看蜀润昆亢毡扼卜诌肋窖第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202448六、假设检验六、假设检验 在总体服从正态分布的情况下,可用以下命令进行假设检验.1总体方差总体方差 已知时,总体均值的检验使用已知时,总体均值的检验使用 z检验检验 h,sig,ci = ztest(x,m,sigma,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其中sigma 为已知方差, alpha 为显著性水平,究竟检

27、验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 m ”tail = 1,检验假设“x 的均值大于 m ”tail =-1,检验假设“x 的均值小于 m ”tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.售朔攻规莎锹耘乱小泞晒筷滚昌姻满炙泄枫杏呸酣埔轧祥棚哇锨滚捉赘渔第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202449 例例7 MATLAB统计工具箱中的数据文件gas.mat.中提

28、供了美国1993年1月份和2月份的汽油平均价格(price1,price2分别是1、2月份的油价,单位为美分),它是容量为20的双样本.假设1月份油价的标准偏差是每加仑4分币(=4),试检验1月份油价的均值是否等于115.解解 作假设:m = 115.首先取出数据,用以下命令: load gas然后用以下命令检验 h,sig,ci = ztest(price1,115,4)返回:h = 0,sig = 0.8668,ci = 113.3970 116.9030.检验结果: 1. 布尔变量h=0, 表示不拒绝零假设. 说明提出的假设均值115 是合理的. 2. sig值为0.8668, 远超过0

29、.5, 不能拒绝零假设 3. 95%的置信区间为113.4, 116.9, 它完全包括115, 且精度很 高. To MATLAB(liti7)郭雕弓梨瘫夫完川硒狞酒虽效缘赌条鼠宙丸苫绍畦缀祷掉晕堵娥骨脖赋瓶第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024502总体方差总体方差 未知时,总体均值的检验使用未知时,总体均值的检验使用t 检验检验 h,sig,ci = ttest(x,m,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 m

30、”tail = 1,检验假设“x 的均值大于 m ”tail =-1,检验假设“x 的均值小于 m ”tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.戎枯脉焊讨纂哭元哆要袄屿寂尼撼硷纬哨义兄韩佩粉勉榆螺熬突俗建控紫第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202451返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.检验结果: 1. 布尔变量h=1, 表示拒绝零假设. 说明提出

31、的假 设油价均值115是不合理的. 2. 95%的置信区间为116.8 120.2, 它不包括 115, 故不能接受假设. 3. sig值为4.9517e-004, 远小于0.5, 不能接受零 假设. To MATLAB(liti8)例例8 试检验例8中2月份油价price2的均值是否等于115.解解 作假设:m = 115,price2为2月份的油价,不知其方差,故用以下命令检验h,sig,ci = ttest( price2 ,115)粱蛤衙尽欢藉养鸵哲郴梅谓太镁烫采哺尖彻麻捧拂吧熬艘怪椿汛碰典婴活第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024523两总体均值的

32、假设检验两总体均值的假设检验使用使用 t 检验检验 h,sig,ci = ttest2(x,y,alpha,tail)检验数据 x ,y 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 y 的均值 ”tail = 1,检验假设“x 的均值大于 y 的均值 ”tail =-1,检验假设“x 的均值小于 y 的均值 ”tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为与x与y均值

33、差的的 1-alpha 置信区间.恩守嗓拎肪巫憋患潮刹剐茧廓侗存酉悄为先溯痴快殴垛绅肉阔沁锐芬液剖第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202453返回:h = 1,sig = 0.0083,ci =-5.8,-0.9.检验结果:1. 布尔变量h=1, 表示拒绝零假设. 说明提出的 假设“油价均值相同”是不合理的. 2. 95%的置信区间为-5.8,-0.9,说明一月份油 价比二月份油价约低1至6分. 3. sig-值为0.0083, 远小于0.5, 不能接受“油价均 相同”假设. To MATLAB(liti9)例例9 试检验例8中1月份油价price1与2月份的

34、油价price2均值是否相同.解解 用以下命令检验h,sig,ci = ttest2(price1,price2)凉总巢泥摸尺囱寒胀藕床澄溪明汞享苞竞盒仁贱钙镑篇扦绕秃挤断育速亮第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024544非参数检验:总体分布的检验非参数检验:总体分布的检验MATLAB工具箱提供了两个对总体分布进行检验的命令:(1)h = normplot(x)(2)h = weibplot(x) 此命令显示数据矩阵x的正态概率图.如果数据来自于正态分布,则图形显示出直线性形态.而其它概率分布函数显示出曲线形态. 此命令显示数据矩阵x的Weibull概率图.

35、如果数据来自于Weibull分布,则图形将显示出直线性形态.而其它概率分布函数将显示出曲线形态.返回返回讣石叠胰血职邹买牌汲颇虫森撮容弯鸟峰浩仲侗袍集何雹两环巷各泞营写第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202455例例10 一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下: 459 362 624 542 509 584 433 748 815 505 612 452 434 982

36、640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544

37、645 764 558 378 765 666 763 217 715 310 851试观察该刀具出现故障时完成的零件数属于哪种分布.巩吵凹谷医恤席肉造羡歪兴谅蘸厘夺储盲呕速骏毋民靡州敦心现架娃军爱第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202456解解 1数据输入To MATLAB(liti101)2作频数直方图 hist(x,10) 3分布的正态性检验 normplot(x)4参数估计: muhat,sigmahat,muci,sigmaci=normfit(x)(看起来刀具寿命服从正态分布)(刀具寿命近似服从正态分布)估计出该刀具的均值为594,方差204,均值

38、的0.95置信区间为 553.4962,634.5038,方差的0.95置信区间为 179.2276,237.1329.To MATLAB(liti104)To MATLAB(liti102)To MATLAB(liti103)痉尸逆券铃澳烟劳役挖甘梁擦睦淫抬坷憨铆缀阑艺溉扮摩祷静蚌吓舶购幌第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024575假设检验To MATLAB(liti105) 已知刀具的寿命服从正态分布,现在方差未知的情况下,检验其均值 m 是否等于594.结果:h = 0,sig = 1,ci =553.4962,634.5038.检验结果: 1. 布尔

39、变量h=0, 表示不拒绝零假设. 说 明提出的假设寿命均值594是合理的. 2. 95%的置信区间为553.5,634.5, 它 完全包括594, 且精度很高. 3. sig值为1, 远超过0.5, 不能拒绝零假 设. 返回返回苞淄房宙商各囚厕介鸯腥滩搅猾稠伯琢殴佬撇称甚专谨狡刑廖速轨娥彬暑第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024581某校60名学生的一次考试成绩如下:93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 8

40、5 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 551)计算均值、标准差、极差、偏度、峰度,画出直方图;2)检验分布的正态性;3)若检验符合正态分布,估计正态分布的参数并检验参数.淡侮俗钝床贯元仲移艰谱渔滚条扭骨败橇炽夷迷蜜氮实石宵使钦海砰腋厂第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/2024592据说某地汽油的价格是每加仑115美分,为了验证这种说法,一位学者开车随机选择了一些加油站,得到某年1月和2月的数据如下:1月:119 117 115 116 112

41、 121 115 122 116 118 109 112 119 112 117 113 114 109 109 1182月:118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 1251)分别用两个月的数据验证这种说法的可靠性;2)分别给出1月和2月汽油价格的置信区间;3)给出1月和2月汽油价格差的置信区间.捆缘倦癸篙糖项饭懊梧字搜锁壁姐刀晚螟东圃洱闺虾腥撒堰除鸯厩湃乌男第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202460奈它胶初械摹觉颓蹿吧油垫邹歧黔险面患丘忱续殷妙绿尸集颧龋靳宗搪监第10讲数据的统计分析与描述第10讲数据的统计分析与描述7/20/202461

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号