《new工程中的不确定性1》由会员分享,可在线阅读,更多相关《new工程中的不确定性1(46页珍藏版)》请在金锄头文库上搜索。
1、统计与概率1工程中的不确定性统计与概率统计与概率21.了解统计与概率的基本知识2.数据表达方法 3.离散和连续分布 4.正态分布及查表5.单独事件和多重事件的概率6.从散乱数据中获得其变化规律。 7.统计与概率在统计过程控制以及公差上的应用。学习目标:统计与概率3概述概述 不确定性是人类生产生活中的重要组成部分。在工程设计中,如果能够对不确定性进行量化分析并能预测不确定性的水平,将对设计和制造产生重大影响。统计与概率4工程设计中的不确定性可以分成两种:概率问题概率问题:当一个系统模型的参数是已知的,我们可以根据这些参数来推导出系统的行为。统计问题统计问题:当一个系统模型的参数是未知的,需要通过
2、对获取的数据进行分析来获得这些参数。统计与概率5假设某公司年产1000台发动机,其中5台为次品。次品可以通过100%的检测程序得到消除。如果更换一台发动机需要$10,000,而检测一台需要 $100,相应的费用为:检测: 1000 * $100 = $100,000 更换: 5 * $10,000 = $50,000显然,更换的费用低。如果次品数超过10,检测将会更经济。因此, 公司必须对加工工程有一个很好的统计数据,以便获得发生次品概率的大小,从而决定采用哪种方案(检测或更换)更加经济。在工程设计的整个过程中,都将应用统计与概率。在工程设计的整个过程中,都将应用统计与概率。 例统计与概率6统
3、计 统计数据表示统计数据表示 最简单的统计数据可以从一个量的重复最简单的统计数据可以从一个量的重复测量得到,如:人的身高、体重、气温测量得到,如:人的身高、体重、气温等。等。这样的统计数据通常是一列数字,而这这样的统计数据通常是一列数字,而这样的一列数字一般是很抽象的,需要通样的一列数字一般是很抽象的,需要通过可视化的方法加以形象表达。过可视化的方法加以形象表达。统计与概率7常用的可视化表达方法:常用的可视化表达方法:直方图直方图是用来表达数据最简单的方法。直方图是用来表达数据最简单的方法。直方图将数据按区间组合,并以图形形式显示出来。直方图将数据按区间组合,并以图形形式显示出来。 累积分布以
4、图形形式显示小于指定值的数据数量。以图形形式显示小于指定值的数据数量。统计数据表达方法统计数据表达方法统计与概率8一个班28个学生的成绩数据如下:70, 73, 74, 76, 76, 76, 76, 77, 77, 77, 78, 78, 79, 79,83, 83, 84, 85, 86, 87, 89, 89, 90, 90, 92, 92, 93, 97成绩数据已经按大小顺序排列。将它们分成6个区间,有:区间 学生数 累积数 70-74:3375-79:111480-84:31785-89:52290-94:52795-99:128例Distribution72 77 82 87 92
5、 971210 8 6 4 2 0累积72 77 82 87 92 973025201510 5 0统计与概率9图形化的表示使得我们对数据有更深入的理解。为了能够更简单地对数据进行比较分析,必须采用一些更加实用的参数。下面将定义一些常用的统计术语统计与概率101、均值:3、方差:标准偏差数的平方4、标准偏差 :对离散分布:2、众数: 一组中出现最频繁的数5、极差:xi 中最大值与最小值之间的差统计与概率11分母上的 N-1 往往会带来混淆。原因:当用有限采样来评估大的群体时,采用N-1能得到更好评估效果。方差统计与概率12对于前面的例子:70, 73, 74, 76, 76, 76, 76,
6、77, 77, 77, 78, 78, 79, 79,83, 83, 84, 85, 86, 87, 89, 89, 90, 90, 92, 92, 93, 97N = 28均值为 82.35方差为 51.20 标准偏差为 7.15 极差为: 97-70=2772 77 82 87 92 971210 8 6 4 2 0统计与概率13课堂练习(5 分钟)课堂练习 1统计与概率14给出如下数据:51,53,54,56,56,56,56,57,57,57,58,59,63,63,64,65,66,67,69,69,70,72,72,72,73,76(a) 用六个区间绘制直方图. (b) 绘制累积分
7、布图.课堂练习 1统计与概率15给出如下数据:51,53,54,56,56,56,56,57,57,57,58,59,63,63,64,65,66,67,69,69,70,72,72,72,73,76(a) 用六个区间绘制直方图. (b) 绘制累积分布图.52 57 62 67 72 771210 8 6 4 2 03025201510 5 052 57 62 67 72 7751-55 3 356-60 9 1261-65 4 1666-70 5 2171-75 4 2576-80 1 26区间区间 N CN课堂练习 1统计与概率16在一个数据分布中,数据 xi 出现的频数为 fi ,有:均
8、值:方差:离散分布:统计与概率17注意一个给定分布的均值与方差以及用有限采样评估该分布所得到的均值与方差之间的差别。均值:方差:整体有限采样统计与概率18增加测量数据和区间数量。绘制频数图。f=测量数据的频数fff连续分布连续分布:统计与概率19假设分布中的数据量足够大,我们可以将区间划分得任意小。在极限状态下,我们可以说概率密度函数是一个连续函数。这样处理能极大地方便计算。有时,即使数据量有限,我们也会采用连续分布来处理。统计与概率20当区间数量趋于无穷大时,将有限求和换成求积分,则可得到连续分布的均值和方差。首先,我们标准化这个分布,使得概率密度函数满足: 统计与概率21x1 和和 x2之
9、间的测量数据之间的测量数据所占的比例分数所占的比例分数连续分布:x1x2fx统计与概率22均值:方差:连续分布:则有:则有:统计与概率23几种常见的分布均匀分布 正态分布 统计与概率24定义:定义:均匀分布是指在分布中任何一个数据出现的概率是相同的。如图在区间上均匀分布是指在分布中任何一个数据出现的概率是相同的。如图在区间上的均匀分布的概率密度函数为:的均匀分布的概率密度函数为:abx均值方差变量代换均匀分布:统计与概率25正态分布正态分布正态分布是应用最广泛的一种分布,很正态分布是应用最广泛的一种分布,很多现象都可以用正态分布来描述,多现象都可以用正态分布来描述,如:工艺误差、测量误差、材料
10、特性、如:工艺误差、测量误差、材料特性、应力分布、学生成绩等都可以认为服从应力分布、学生成绩等都可以认为服从正态分布。正态分布。统计与概率26正态分布:正态分布记为:正态分布记为:N(,2,2)。 通常正态分布是对称的。通常正态分布是对称的。不断增大正态分布的概率密度函数可以用下式表示正态分布的概率密度函数可以用下式表示:正态分布也称高斯分布统计与概率27正态分布密度函数正态分布密度函数正态分布正态分布N(,2),称为位置参数,称为位置参数,称为形称为形状参数;状参数;当固定当固定,改变,改变的大小时,正态分布的密度曲的大小时,正态分布的密度曲线形状不变,只是沿着线形状不变,只是沿着X轴作平移
11、变化;轴作平移变化;当固定当固定 ,改变,改变 的大小时,正态分布的密度的大小时,正态分布的密度曲线的对称轴不变,而形状在改变。曲线的对称轴不变,而形状在改变。 越小,越小,图形越高越瘦;图形越高越瘦; 越大,图形越矮越胖。越大,图形越矮越胖。 f(x)统计与概率28累积分布为:F(X)X给出了位于x左面的面积分数为值小于(等于)x的概率。累积分布是均值和标准偏差的函数。正态分布:统计与概率29累积分布函数变成:当=0,=1时,称为标准正态分布,记为N(0,1)。正态分布通过变量变换,可以转化成标准正态分布 :其中: 均值为0 标准偏差为1正态分布:统计与概率30分布函数累积分布函数标准正态分
12、布:统计与概率31正态分布的累积分布函数可以通过下面的变换从标准正态分布中得到:标准正态分布:统计与概率32通过查表,可以获得累积正态分布的值x.xxx.xx标准正态分布:统计与概率33通常, F(z) 表中的 z0. 对于 z0 ,由于正态分布的对称性,有 F(-z)=1-F(z).标准正态分布:统计与概率34例-I例-I统计与概率35某值落在在均值的一个标准偏差范围内的概率是多某值落在在均值的一个标准偏差范围内的概率是多少?少?查表可得, F(1)= 0.8413. F(1)-F(-1)=0.8413-0.1587=0.6826约30%左右的值落在一个标准偏差范围之外。F(-1)=1-F(
13、1)=1-0.8413=0.1587-11F(-1)1-F(1)Example-I统计与概率36例-II例-II统计与概率37某值落在在均值的两个标准偏差范围内的概率是多某值落在在均值的两个标准偏差范围内的概率是多少?少?查表可得, F(2)= 0.9772.约5%左右的值落在两个标准偏差范围之外。F(2)-F(-2)=F(2)-(1-F(2)=2*F(2)-1=2*0.9772-1=0.9544-22F(-2)1-F(2)例-II统计与概率38例-III例-III统计与概率39例-III某公司入库 250个连杆, 抗张强度均值为45 ksi (kilopound square inch,千磅
14、/平方英寸 ), 标准偏差为5 kpsi. 假设抗张强度服从正态分布 。(a) 有多少连杆的抗张强度将低于 39.5 kpsi.4545+545-539.5统计与概率40例-III由于 z0, 我们用公式: F(-1.10)=1-F(1.10)=1-0.8643=0.1357, (查表). 于是, 250*0.1357=3434个连杆的抗张强度将低于 39.5 kpsi先进行标准化变换:统计与概率41例-III某公司入库 250个连杆, 抗张强度均值为45 ksi (kilopound square inch,千磅/平方英寸 ), 标准偏差为5 kpsi. 假设抗张强度服从正态分布 。(b)
15、有多少连杆的抗张强度位于39.5kpsi和59.5 kpsi之间?4545+545-539.559.5统计与概率42例-III由表, F(2.9)=0.9981, 所以抗张强度 大于的概率为 1-0.9981=0.0019. 抗张强度位于39.5kpsi和59.5 kpsi之间的概率为: 1-0.1357-0.0019=0.8624. 于是有 250*0.8624=216 个连杆的抗张强度位于39.5kpsi和59.5 kpsi之间。先进行标准化变换:统计与概率43课堂练习(5 分钟)课堂练习 2统计与概率44500根钢棒的长度服从正态分布。其均值为11cm,标准偏差为1 cm。试估计长度大于10 cm的钢棒的数量.课堂练习 2统计与概率45500根钢棒的长度为正态分布。其均值为11cm,标准偏差为1 cm。试估计长度小于10 cm的钢棒的数量.由于z0, 用以下公式 F(-1)=1-F(1)=1-0.8413=0.1587, (查表) 于是,有500*0.1587=79 根钢棒的长度小于10 cm课堂练习 2先进行标准化变换:统计与概率46本讲结束本讲结束 谢谢!谢谢!