实验大数据误差分析报告与大数据处理

资源描述

《实验大数据误差分析报告与大数据处理》由会员分享，可在线阅读，更多相关《实验大数据误差分析报告与大数据处理（8页珍藏版）》请在金锄头文库上搜索。

1、实用标准文档第一章实验数据误差分析与数据处理第一节实验数据误差分析一、概述由于实验方法和实验设备的不完善，周围环境的影响，以及人的观察力，测量程序等限制，实验测量值和真值之间，总是存在一定的差异，在数值上即表现为误差。为了提高实验的精度，缩小实验观测值和真值之间的差值，需要对实验数据误差进行分析和讨论。实验数据误差分析并不是即成事实的消极措施，而是给研究人员提供参与科学实验的积极武器，通过误差分析，可以认清误差的来源及影响，使我们有可能预先确定导致实验总误差的最大组成因素，并设法排除数据中所包含的无效成分，进一步改进实验方案。实验误差分析也提醒我们注意主要误差来源，精心操作，使研究的准

2、确度得以提高。二、实验误差的来源实验误差从总体上讲有实验装置（包括标准器具、仪器仪表等）、实验方法、实验环境、实验人员和被测量五个来源。1. 实验装置误差测量装置是标准器具、仪器仪表和辅助设备的总体。实验装置误差是指由测量装置产生的测量误差。它来源于：（ 1 ）标准器具误差标准器具是指用以复现量值的计量器具。由于加工的限制，标准器复现的量值单位是有误差的。例如，标准刻线米尺的 0 刻线和 1 000 mm 刻线之间的实际长度与 1 000 mm 单位是有差异的。又如，标称值为 1kg 的砝码的实际质量（真值）并不等于 1kg 等等。（ 2 ）仪器仪表误差凡是用于被测量和复现计量单位的标

3、准量进行比较的设备，称为仪器或仪表它们将被测量转换成可直接观察的指示值。例如，温度计、电流表、压力表、干涉仪、天平，等等。由于仪器仪表在加工、装配和调试中，不可避免地存在误差，以致仪器仪表的指示值不等于被测量的真值，造成测量误差。例如，天平的两臂不可能加工、调整到绝对相等，称量时，按天平工作原理，天平平衡被认为两边的质量相等。但是，由于天平的不等臂，虽然天平达到平衡，但两边的质量并不等，即造成测量误差。（ 3 ）附件误差为测量创造必要条件或使测量方便地进行而采用的各种辅助设备或附件，均属测量附件。如电测量中的转换开关及移动测点、电源、热源和连接导线等均为测量附件，且均产生测量误差。又如，热工计

4、量用的水槽，作为温度测量附件，提供测量水银温度计所需要的温场，由于水槽内各处温度的不均匀，便引起测量误差，等等。按装置误差具体形成原因，可分为结构性的装置误差、调整性的装置误差和变化性的装置误差。结构性的装置误差如：天平的不等臂，线纹尺刻线不均匀，量块工作面的不平行性，光学零件的光学性能缺陷，等等。这些误差大部分是由于制造工艺不完善和长期使用磨损引起的。调整性的装置误差如投影仪物镜放大倍数调整不准确，水平仪的零位调整不准确，千分尺的零位调整不准确，等等。这些误差是由于仪器仪表在使用时，未调整到理想状态引起的。变化性的装置误差如：激光波长的长期不稳定性，电阻等元器件的老化，晶体振荡器频率的长

5、期漂移，等等。这些误差是由于仪器仪表随时间的不稳定性和随空间位置变化的不均匀性造成的。2. 环境误差环境误差系指测量中由于各种环境因素造成的测量误差。被测量在不同的环境中测量，其结果是不同的。这一客观事实说明，环境对测量是有影响的，是测量的误差来源之一。环境造成测量误差的主要原因是测量装置包括标准器具、仪器仪表、测量附件同被测对象随着环境的变化而变化着。测量环境除了偏离标准环境产生测量误差以外，从而引起测量环境微观变化的测量误差。3. 方法误差方法误差系指由于测量方法（包括计算过程）不完善而引起的误差。事实上，不存在不产生测量误差的尽善尽美的测量方法。由测量方法引起的测量误差主要有下列两种情况

6、：第一种情况：由于测量人员的知识不足或研究不充分以致操作不合理，或对测量方法、测量程序进行错误的简化等引起的方法误差。第二种情况：分析处理数据时引起的方法误差。例如，轴的周长可以通过测量轴的直径d,然后由公式：L=Ttd计算得到。但是，在计算中只能取其近似值，因此，计算所得的L也只能是近似值，从而引起周长L 的误差。4. 人员误差人员误差系指测量人员由于生理机能的限制，固有习惯性偏差以及疏忽等原因造成的测量误差。由于测量人员在长时间的测量中，因疲劳或疏忽大意发生看错、读错、听错、记错等错误造成测量误差，这类误差往往相当大是测量所不容许的。为此，要求测量人员养成严格而谨慎的习惯，在测量中认真操

7、作并集中精力，从制度上规定，对某些准确性较高而又重要的测量，由另一名测量人员进行复核测量。5. 测量对象变化误差被测对象在整个测量过程中处在不断地变化中。由于测量对象自身的变化而引起的测量误差称为测量对象变化误差。例如，被测温度计的温度，被测线纹尺的长度，被测量块的尺寸等，在测量过程中均处于不停地变化中，由于它们的变化，使测量不准而带来误差。三、误差的分类误差是实验测量值（包括间接测量值）与真值（客观存在的准确值）之差别，误差可以分为下面三类：1. 系统误差由某些固定不变的因素引起的。在相同条件下进行多次测量，其误差的数值大小正负保持恒定，或误差随条件按一定规律变化。单纯增加实验次数是无法

8、减少系统误差的影响，因为它在反复测定的情况下常保持同一数值与同一符号，故也称为常差。系统误差有固定的偏向和确定的规律，可按原因采取相应的措施给予校正或用公式消除。2. 随机误差（偶然误差）由一些不易控制的因素引起，如测量值的波动，肉眼观察误差等等。随机误差与系统误差不同，其误差的数值和符号不确定，它不能从实验中消除，但它服从统计规律，其误差与测量次数有关。随着测量次数的增加，出现的正负误差可以相互抵消，故多次测量的算术平均值接近于真值。3. 过失误差由实验人员粗心大意，如读数错误，记录错误或操作失误引起。这类误差与正常值相差较大，应在整理数据时加以剔除。四、实验数据的真值与平均值1 .真值

9、真值是指某物理量客观存在的确定值，它通常是未知的。虽然真值是一个理想的概念，但对某一物理量经过无限多次的测量，出现的误差有正、有负，而正负误差出现的概率是相同的。因此，若不存在系统误差，它们的平均值相当接近于这一物理量的真值。故真值等于测量次数无限多时得到的算术平均值。由于实验工作中观测的次数是有限的，由此得出的平均值只能近似于真值，故称这个平均值为最佳值。2 . 平均值油气储运实验中常用的平均值有：（ 1 ）算术平均值设X1,X2,. , xn为各次测量值，n为测量次数，则算术平均值为：一 Ai +与 +口 + A +37A 二=算术平均值是最常用的一种平均值，因为测定值的误差分布一般服从正

10、态分布，可以证明算术平均值即为一组等精度测量的最佳值或最可信赖值。（2）均方根平均值（3）几何平均值五、误差的表示方法1 .绝对误差测量值与真值之差的绝对值称为测量值的误差，即绝对误差。在实际工作中常以最佳值代替真值，测量值与最佳值之差称为残余误差，习惯上也称为绝对误差。设测量值用x表示，真值用X表示，则绝对误差D为D=|X-x|如在实验中对物理量的测量只进行了一次，可根据测量仪器出厂鉴定书注明的误差，或取测量仪器最小刻度值的一半作为单次测量的误差。如某压力表精（确）度为 1.5级，即表明该仪表最大误差为相当档次最大量程的 1.5%,若最大量程为0.4MPa,该压力表的最大误差为：0.4 x

11、 1.5%=0.006MPa如实验中最常用的U形管压差计、转子流量计、秒表、量筒等仪表原则上均取其最小刻度值为最大误差，而取其最小刻度值的一半作为绝对误差计算值。2 .相对误差绝对误差D与真值的绝对值之比，称为相对误差：e%=D/|X|式中真值X 一般为未知，用平均值代替。3 .算术平均误差算术平均误差的定义为：2死 7 士 48 二1仃肘Xi测量值，i=1,2,3, ., n ;d测量值与算术平均值（x ）之差的绝对值，di= x x4.标准误差（均方误差）对有限测量次数，标准误差表示为：标准误差是目前最常用的一种表示精确度的方法，它不但与一系列测量值中的每个数据有关，而且对其中较大的误差

12、或较小的误差敏感性很强，能较好地反映实验数据的精确度，实验愈精确，其标准误差愈小。六、精密度、正确度和准确度1、精密度精密度是指对同一被测量作多次重复测量时，各次测量值之间彼此接近或分散的程度。它是对随机误差的描述，它反映随机误差对测量的影响程度。随机误差小，测量的精密度就高。如果实验的相对误差为 0.01%且误差由随机误差引起，则可以认为精密度为10-4 02、正确度正确度是指被测量的总体平均值与其真值接近或偏离的程度。它是对系统误差的描述,它反映系统误差对测量的影响程度。系统误差小，测量的正确度就高。如果实验的相对误差为0.01%且误差由系统误差引起，则可以认为正确度为10-4。3、准

13、确度准确度是指各测量值之间的接近程度和其总体平均值对真值的接近程度。它包括了精密度和正确度两方面的含义。它反映随机误差和系统误差对测量的综合影响程度。只有随机误差和系统误差都非常小，才能说测量的准确度高。若实验的相对误差为 0.01%且误差由系统误差和随机误差共同引起，则可以认为精确度为10-4。七、实验数据的有效数与记数法任何测量结果或计算的量，总是表现为数字，而这些数字就代表了欲测量的近似值。究竟对这些近似值应该取多少位数合适呢？应根据测量仪表的精度来确定，一般应记录到仪表最小刻度的十分之一位。例如：某液面计标尺的最小分度为1mm则读数可以到0.1ms如在测定时液位高在刻度524mm

14、与525mm的中间，则应记液面高为524.5mm,其中前三位是直接读出的，是准确的，最后一位是估计的，是欠准的，该数据为 4位有效数。如液位恰在524mr度上，该数据应记为524.0mm,若记为524mm则失去一位（末位）欠准数字。总之，有效数中应有而且只能有一位（末位）欠准数字。由上可见，当液位高度为 524.5mm时，最大误差为 0.5mm,也就是说误差为末位的一半。在科学与工程中，为了清楚地表达有效数或数据的精度，通常将有效数写出并在第一位数后加小数点，而数值的数量级由10的整数哥来确定，这种以10的整数哥来记数的方法称科学记数法。例如：0.0088应记为8.8 x 10-3, 88

15、000 （有效数3位）记为8.80 X 104。应注意科学记数法中，在10的整数哥之前的数字应全部为有效数。有效数字进行运算时，运算结果仍为有效数字。总的规则是：可靠数字与可靠数字运算后仍为可靠数字，可疑数字与可疑数字运算后仍为可疑数字，可靠数字与可疑数字运算后为可疑数字，进位数可视为可靠数字。对于已经给出了不确定度的有效数字，在运算时应先计算出运算结果的不确定度，然后根据它决定结果的有效数字位数。加减运算规则：A.如果已知参与加减运算的各有效数字的不确定度，则先算出计算结果的不确定度，并保留1-2位，然后确定计算结果的有效位数。B.如果没给出参与加减运算的各有效数字的不确定度，则先找出可疑位最高的那个有效数字，计算结果的可疑位应与该有效数字的可疑位对齐。乘除运算规则若干个有效数字相乘除时，计算结果（积或商）的有效数字位数在大多数情况下与参与运算的有效数字位数最少的那个分量的有效位数相同。乘方、开方运算规则有效数字在乘方或开方时，若乘方或开方的次数不太高，其结果的有效数字位数与

展开阅读全文