试验检测数据处理张超

资源描述

《试验检测数据处理张超》由会员分享，可在线阅读，更多相关《试验检测数据处理张超（58页珍藏版）》请在金锄头文库上搜索。

1、试验检测数据处理,中铁十七局集团第六工程有限公司张超 ,第一节误差的基本概念,一、误差的含义测量结果减去真值之差（1）表示测量值与真值的量差。真值是个未知量，可以指理论真值、规定真值和相对真值，通常是一种由更准确的方法或仪器测定的数值。（2）表示一项试验估计值的不确定度，或者说描述了一项测量的准确度。如给出光速为（2.9979020.000009）1010cm/s时，0.000009就是以误差的形式描述了光速测量的准确程度。,第一节误差的基本概念,二、误差的表示按表示方法不同，可分为绝对误差和相对误差。 1.绝对误差实测值与被测量的真值之差，即 L=L-L0 L绝对误差 L实测

2、值 L0被测量的真值绝对误差与被测量的单位相同，可以表示数值偏大或偏小，但不能确切地表示测量的准确性。,第一节误差的基本概念,二、误差的表示 2.相对误差绝对误差与被测量真值的比值，即相对误差相对误差能真正反映出测量达到的准确度，无单位，常以百分数表示。,第一节误差的基本概念,三、误差的分类 1.系统误差在重复性条件下，对被测量进行多次测量，误差的数值和符号有明显的规律，由于这种误差多数由仪器和试验方法引起，故称系统误差。系统误差经过有效的识别，可以在测量结果中加以修正。 2.随机误差在重复性条件下，对被测量进行多次测量，误差的数值和符号没有明显的规律，它由许多微小的因素造成，

3、具有很强的偶然性，故称随机误差，也称偶然误差。随机（偶然）误差的分布规律：（1）在一定的实验条件下，偶然误差的绝对值不会超过一定限度；（2）绝对值小的误差比绝对值大的误差出现的机会多；（3）绝对值相等的正误差与负误差出现的概率几乎相等。 3.过失误差（粗大误差）主要由于实验人员的主观过失引起的错用、错读、错记、错算等，或环境条件、实验对象的异常变化引起的明显偏离试验结果的误差。该类误差不能参与统计计算，必须通过一定的法则加以判断和剔除。,第一节误差的基本概念,四、误差的来源 1.装置误差主要由设备装置的设计、制造、安装、调整、与运用引起的误差。 2.环境误差由于环境因素达不到

4、要求的标准状态所引起的误差。 3.人为误差测试者生理上的最小分辨能力和固有习惯引起的误差。 4.方法误差测试者未按规定的方法进行试验所引起的误差。,第二节数字修约和有效数字,一、有效数字在测量工作中，表示测量结果的数字位数和测量的准确度没有必然联系。在数据处理中，常常要根据试验要求和实际所能达到的准确度截取一定的数字位数，即有效数字。有效数字的概念由数字组成的一个数，除最末一位数字是不确切值或可疑值外，其他数字皆为可靠值或确切值，则从组成该数的第一个不是0的数字开始的所有数字（包括末位）称为有效数字，除有效数字外，其余数字为多余数字。当数字前或后均为“0”时，判断“0”是否为有效

5、数字的窍门：把“0”换成其他任意数字，看新数字是否能改变准确度，能，则是有效数字，不能则不是有效数字。,第二节数字修约和有效数字,二、数值修约规则定义：通过省略数值的最后若干位数字，调整所保留数值的末位数字，使最后得到的数值接近原数值的过程。经数值修约后的数值称为（原数值的）修约值。在质量数据处理时，首先要按照试验检测数据的准确度和一定的规则对测量或计算结果的位数进行取舍，保留一定的有效数字，这个过程称为数字修约，或叫近似数的截取。在数据处理中，当把一个近似数修约到需要的有效位数时，以数据中拟舍去部分最左边的第一个数字a考虑，规则如下：,第二节数值修约和有效数字,二、数值修约规则

6、（1）a5，则将其连同其后面的所有数字直接舍去，留下的数字不变；（2）a5，则将其连同其后面的所有数字舍去，留下的数字末位+1；（3）a=5且a后面的数字不全为零时，则将其连同其后面的所有数字舍去，留下的数字末位+1；（4）a=5且a后面的数字全为零或a后面没有数字时则观察a前面相邻的数字b： b为奇数时，“a后舍，b加1”； b为偶数时，“a后舍，b不变”。,第二节数值修约和有效数字,二、数值修约规则数值修约应一次到位，不得对一个数值连续修约，例如，将15.4546修约为整数时，应为15.454615，而不能按15.454615.455 15.46 15.5 16连续修约。舍入

7、误差表,第三节数据的统计特征与分布,一、总体与样本全数检验：对每一检查对象进行逐一检验抽样检验：按数理统计方法从全部产品中抽取一部分试样进行检验，进而推断全部产品是否合格。总体：又称母体，是统计分析中所要研究对象的全体；个体：组成总体的每个单元总体分为有限总体和无限总体样本：从总体中抽取的一部分个体，组成样本的每一个个体即为样品。样本容量：样本中所含样品的数量,第三节数据的统计特征与分布,二、数据的统计特征量描述数据的集中位置的特征量：平均值、中位数描述数据的离散程度的特征量：极差、标准差、变异系数,第三节数据的统计特征与分布,二、数据的统计特征量 1 算术平均值

8、即一组数据的平均数，也称均值，描述了全体数据的分布中心。总体的算术平均值用表示，样本的算数平均值用表示，如果n个样本数据为x1、x2、x3xn，那么样本的算术平均值为,第三节数据的统计特征与分布,二、数据的统计特征量 2 中位数在一组数据x1、x2、x3xn中，按大小顺序排列，排在正中间的称为中位数，或中值。N为奇数时，正中间的数只有一个；n为偶数时，正中间的数有两个，则取这两个数的平均值作为中位数。 n为奇数 n为偶数,第三节数据的统计特征与分布,二、数据的统计特征量 3.极差值极差值是指一组数据中最大值和最小值之差，用R表示,第三节数据的统计特征与分布,二、数据的统计特征量 4

9、.标准偏差（标准差、均方差）是衡量数据波动性的指标，在质量检验中，总体的标准偏差常用表示，但不易求得；样本的标准偏差常用S表示，也称样本偏差。,第三节数据的统计特征与分布,二、数据的统计特征量 5.变异系数标准偏差反映样本数据的绝对波动状况。当测量较大的量值时，绝对误差一般较大；测量较小的量值时，绝对误差一般较小。因此引入变异系数，来反映相对波动的大小，更能反映样本数据的波动性。变异系数用Cv表示，是标准偏差S与算术平均值的比值,第三节数据的统计特征与分布,三、数据的分布特征随机抽样的数据服从一定的统计规律，这种规律一般用概率分布来描述。在工程质量分析和评价中，常用正态分布和t分

10、布。 1.正态分布正态分布也称高斯（Gauss）分布，它是随机误差或者某一质量特性抽样检验数据通常服从的一种重要分布，是应用最多、最广泛的一种概率分布，而且是其他概率分布的基础。,第三节数据的统计特征与分布,三、数据的分布特征正态分布的概率密度函数为 x随机变量 x的理论均值，通常可用算术平均值替代总体的标准偏差，通常可用样本偏差S替代,第三节数据的统计特征与分布,三、数据的分布特征平均值是f（x）x曲线的位置参数，它决定曲线最高点的横坐标。标准偏差是f（x）x曲线的形状参数，它的大小反映了曲线的宽窄程度。,第三节数据的统计特征与分布,三、数据的分布特征正态分布的特点：（

11、1）曲线对称于x=，即以平均值为中心；（2）当x=时，曲线处于最高点，当x向左右偏离时，曲线逐渐降低，整个曲线呈现钟形；（3）曲线与横坐标轴围成的面积等于1，即,第三节数据的统计特征与分布,三、数据的分布特征一般地，随机变量x服从参数与正态分布，可记作xN（，）特别地，当=0， =1时的正态分布，称为标准正态分布，用N（0，1）表示，它的概率密度函数为：,第三节数据的统计特征与分布,三、数据的分布特征对于正态分布N（，），它的测量值落入区间（a，b）的概率P（a x b）是明确的，它等于x1=a，x2=b时横坐标与曲线所围成的面积，用下式表示：,第三节数据的统计特征与分布,

12、三、数据的分布特征利用式P（axb）可以求出双边置信区间的几个重要数据： P-x + =0.6826 P-2x +2 =0.9544 P-3x +3 =0.9973 P-1.96x +1.96 =0.9500 可以这样理解：随机数据的波动不超过的可能性有68.26% 随机数据的波动不超过2的可能性有95.44% 随机数据的波动不超过3的可能性有99.73%,第三节数据的统计特征与分布,三、数据的分布特征双侧检验的置信区间可统一写成： -u（1-2）/2x+u（1-2）/2 2显著水平； 1- 2置信水平（保证率）； u（1-2）/2双边置信区间的正态分布临界值，也叫置信系数或保证率系数

13、。在质量数据处理中，如果用算术平均值替代，用样本偏差S替代，用K替代u（1-2）/2，则双侧检验置信区间的置信界限可以写成 x= KS K和保证率或显著水平有关的系数，可由值查正态分布表,第三节数据的统计特征与分布,三、数据的分布特征对单侧检验，由于只考虑数据波动的上限或下限，不难得到单边置信区间的几个重要数据：,第三节数据的统计特征与分布,三、数据的分布特征显著水平在数理统计中一般用表示。但在工程中常用表示保证率（置信水平），所以为便于理解，用2表示双边置信区间的显著水平，保证率=1-2，用表示单侧检验时单边置信区间的显著水平，保证率 =1- 。保证率系数K通常也用Za表示。所谓

14、代表值，可以理解为一组数据中可以代表一定保证率要求的置信界限数值。,第三节数据的统计特征与分布,三、数据的分布特征 2. t分布设XN（0，1），YX2（n）并且X与Y互相独立，则称统计量所服从的分布为自由度n的T分布，记作Tt（n），t分布的概率密度函数为： n：样本容量，在数理统计学中称自由度。 X：随机变量,第三节数据的统计特征与分布,三、数据的分布特征,第三节数据的统计特征与分布,三、数据的分布特征当随机变量X服从自由度为n的t分布时，记作Xt（n），当n时，趋于正态分布，一般来说，当n30时，t分布与正态分布N（0，1）非常接近。但对于较小的n值，t分布与正态分布之间有较

15、大的差异，且： PTt0 P Xt0,第三节数据的统计特征与分布,三、数据的分布特征在工程质量评定时，通常在总体标准偏差未知时，利用样本标准偏差S代替总体标准偏差来估计平均值置信区间。设（x1，x2 ,xn）为正态分布总体，由抽样分布定理可知：,第三节数据的统计特征与分布,三、数据的分布特征因此，根据跟定的和自由度，由t分布概率系数表查得t（1- ）/2（n-1）之值，由此得平均值的双边置信区间：同理可得的单边置信区间：,第三节数据的统计特征与分布,三、数据的分布特征应用结论对单侧检测的指标，按下式计算：对双侧检验的指标，按下式计算：,第四节可疑数据的取舍方法,工程质量检

16、测中常常会出现一些明显偏离正常值的数据，它们可能是由于工程质量波动导致的，也可能是由于测量的过失误差导致的，这样的数据被称为“可疑数据”，有时也叫“异常值”，这些数据的存在会影响到统计结果的客观性。因此，在进行数据分析之前，应用数理统计的方法辨别其真伪，并决定取舍。,第四节可疑数据的取舍方法,一、拉依达法当试验次数较多时，可简单地利用3倍标准差（3S）作为可疑数据的取舍依据。当某一测量数据（xi）与其测量结果的算数平均值（）之差大于3倍标准偏差时，用公式表示：则应该将此数据舍去。,第四节可疑数据的取舍方法,一、拉依达法取3S作为偏差界限的理由是：根据随机变量的正态分布规律，在多次试验中测量值落在之间的概率为99.73%，出现在此范围之外的概率仅有0.27%，这种事件称为小概率事件，几乎是不可能出现的，因而在实际试验中，一旦出现，就认为这样的数据是不可靠的，应将其舍去。,

展开阅读全文

试验检测数据处理 张超

试验检测数据处理张超