第五章 数据处理和检验

上传人:jiups****uk12 文档编号:88681403 上传时间:2019-05-06 格式:PPT 页数:86 大小:2.25MB
返回 下载 相关 举报
第五章 数据处理和检验_第1页
第1页 / 共86页
第五章 数据处理和检验_第2页
第2页 / 共86页
第五章 数据处理和检验_第3页
第3页 / 共86页
第五章 数据处理和检验_第4页
第4页 / 共86页
第五章 数据处理和检验_第5页
第5页 / 共86页
点击查看更多>>
资源描述

《第五章 数据处理和检验》由会员分享,可在线阅读,更多相关《第五章 数据处理和检验(86页珍藏版)》请在金锄头文库上搜索。

1、大学生科研论文写作入门,导入新课,科研的前期准备工作结束后,收集了一些有用的实验或调查数据,这些数据哪些是可靠的?哪些是可疑的?数据怎样进行分析处理?怎样进行统计检验?这些是制作图表的依据,是写论文之前必须完成的。 那么,有哪些方面的内容呢?,第五章 数据处理和检验,一、有效数字 二、均数和标准偏差 三、可疑值的舍去 四、常用检验方法 1. t检验 2. 方差检验,一、有效数字,在科学实验中,为了得到准确的测量结果,不仅要准确地测定各种数据,而是还要正确地记录和计算。所以,记录实验数据和计算结果应保留几位数字是一件很重要的事,不能随便增加或减少位数。例如用重量法测定硅酸盐中的SiO2时,若称取

2、试样重为0.4538克,经过一系列处理后,灼烧得到SiO2沉淀重0.1374克,则其百分含量为: SiO2 % =(0.1374/0.4538)100%30.277655354%,上述分析结果共有11位数字,从运算来讲,并无错误,但实际上用这样多位数的数字来表示上述分析结果是错误的,它没有反映客观事实,因为所用的分析方法和测量仪器不可能准确到这种程度。那么在分析实验中记录和计算时,究竟要准确到什么程度,才符合客观事实呢?这就必须了解“有效数字”的意义。,有效数字的意义及位数,有效数字是指在分析工作中实际上能测量到的数字。记录数据和计算结果时究竟应该保留几位数字,须根据测定方法和使用仪器的准确程

3、度来决定。在记录数据和计算结果时,所保留的有效数字中,只有最后一位是可疑的数字或者不定数字。,例如: 坩埚重18.5734克 六位有效数字 标准溶液体积24.41毫升 四位有效数字 由于万分之一的分析天能称准至0.0001克,滴定管的读数能读准至0.01毫升,故上述坩埚重应是18.57340.0001克,标准溶液的体积应是24.410.01毫升,因此这些数值的最后一位都是可疑的,这一位数字称为“不定数字”。在分析工作中应当使测定的数值,只有最后一位是可疑的。,例如: 1.0005 五位有效数字 0.5000;31.05% ;6.023102 四位有效数字 0.0540;1.8610-5 三位有

4、效数字 0.0054;0.40% 两位有效数字 0.5 ; 0.002% 一位有效数字 在1.0005克中的三个“0”,0.5000克中的后三个“0”,都是有效数字;在0.0054克中的“0”只起定位作用,不是有效数;在0.0540克中,前面的“0”起定位作用,最后一位“0”是有效数字。同样,这些数值的最后一位数字,都是不定数字。,数字修约规则 “四舍六入五留双”,具体的做法是,当尾数4时将其舍去;尾数6时就进一位;如果尾数为5而后面的数为0时则看前方:前方为奇数就进位,前方为偶数则舍去;当“5”后面还有不是0的任何数时,都须向前进一位,无论前方是奇还是偶数。“0”则以偶数论。,有效数字修约举

5、例,0.536640.5366 0.583460.5835 18.0650118.07 10.275010.28 16.405016.40,有效数字的运算规则,(一)加减法 当几个数据相加或相减时、它们的和或差的有效数字的保留,应以小数点后位效最少,即绝对误差最大的的数据为依据。例如0.0121、25.64及1.05782三数相加,若各数最后一位为可疑数字,则25.64中的4已是可疑数字。因此,三数相加后,第二位小数已属可疑,其余两个数据可按规则进行修约、整理到只保留到小数后2位。,因此,0.0121应写成0.01; 1.05782应写成1.06;三者之和为: 0.01+25.64+1.062

6、6.71 在大量数据的运算中。为使误差不迅速积累,对参加运算的所有数据,可以多保留一位可疑数字(多保留的这一位数字叫“安全数字”)。 如计算5.2727、0.075、3.7及2.12的总和时,根据上述规则,只应保留一位小数。但在运算中可以多保留一位,故5.2727应写成5.27;0.075应写成0.08;2.12应写成2.12。因此其和为: 5.27+0.08+3.7+2.1211.17 然后、再根据修约规则把11.17整化成11.2。,(二)乘除法 几个数据相乘除时,积或商的有效数字的保留,应以其中相对误差最大的那个数,即有效数字位数最少的那个数为依据。 例如求0.0121、25.64和1.

7、05782三数相乘之积。 第一个数是三位有效数字,其相对误差最大,以此数据为依据,确定其他数据的位数,即按规则将各数都保留三位有效数字然后相乘: 0.012125.61.06 = 0.328 若是多保留一位可疑数字时,则 0.012125.641.058 = 0.3282 然后再按“四舍六入五留双”规则,将0.3282,改写成0.328。,有效数字的运算规则小结 1根据分析仪器和分析方法的准确度正确读出和记录测定值,且只保留一位可疑数字。 2在计算结果之前,先根据运算方法确定欲保留的位数,然后按照数字修约规则对各测定值进行修约,先修约,后计算。,二、均数和标准偏差,1. 均数 2. 标准偏差,

8、基本术语,1.总 体 研究对象的全体,总体数目N。 2.样本 自总体中随机抽出一部分样品, 通过样品推断总体的性质。 3.样本容量 样本中所含个体的数目,n,均值,样本容量为n,其均值为:,偏差,偏差d=测定值均值x 均偏差=(-x)n,样本标准偏差,f = n-1, 自由度:n个测定数据能相互独立比较的是n-1个。 引入n-1是为了校正以样本均值代替总体均值引起的误差。,相对标准偏差,(relative standard deviation-RSD) 又称变异系数 (coefficient of variation-CV),例1:重铬酸钾法测得中铁的百分含 量为:20.03%, 20.04%

9、, 20.02%, 20.05%和20.06%。计算分析结果的均值,标准偏差和相对标准偏差。,举例,1.Excel(打开excel表第五章) 2.SPSS软件,SPSS结果与excel计算的一样。,三、可疑值的取舍 在实验中得到一组数据,个别数据离群 较远,这一数据称为异常值、可疑值或极端 值。若是过失造成的,则这一数据必须舍去。 否则异常值不能随意取舍,特别是当测量数 据较少时。 处理方法有4d法、格鲁布斯(Grubbs)法和Q检验法。,1. 4d法 根据正态分布规律,可疑数值的偏差 ( 即|x 可疑-x |)超过4d时,这一测定值出现在测定总体内的概率小于0.3%,故这一测量值通常可以舍去

10、。,检验步骤,用4d法判断异常值的取舍的步骤: 1.去掉异常值,计算其余数据的均值x。 2.计算各数据偏差d=-x 2.计算数据的均偏差d。d=di/n 3.异常值与均值进行比较: |x 可疑-x |大于4d,则将可疑值舍去,否则保留。 4d中的d是d。当4d法与其他检验法矛盾时,以其他法则为准。,例 测定某药物中钴的含量如(g/g), 得结果如下:1.25,1.27,1.31,1.40。试问1.40这个数据是否应保留? 解 首先不计异常值1.40,求得其余数据的均值x和均偏差d为 异常值与均值的差的绝对值为 |1.40一1.28|=0.124 d(0.092) 故1.40这一数据应舍去。,2

11、. 格鲁布斯(Grubbs)法 有一组数据,从小到大排列为: x1,x2,xn-1,xn 其中x1或xn可能是异常值。 用格鲁布斯法判断时,首先计算出该组数据的均值及标准偏差,再根据统计量T进行判断。 若TTa,n,则异常值应舍去,否则应保留。,例 前一例中的实验数据,用格鲁布斯法判断时,1.40这个数据应保留否(置信度95%)? 解 均值 x=1.31, s=0.066 查表T005,4=1.46,TT005,4,故1.40这个数据应该保留。 格鲁布斯法优点,引人了正态分布中的两个最重要的样本参数x及s,故方法的准确性较好。缺点是需要计算x和s,手续稍麻烦。,3. Q检验法 设一组数据,从小

12、到大排列为: x1,x2,xn-1,xn 设x1、xn为异常值,则统计量Q为: 式中分子为异常值与其相邻的一个数值的差值,分母为整组数据的极差。Q值越大,说明xn离群越远。Q称为“舍弃商”。当Q计算Q表时,异常值应舍去,否则应予保留。,1.25,1.27,1.31,1.40,三种方法比较,4d法在数理统计上是不够严格的,这种方法把可疑值首先排除在外,然后进行检验,容易把原来属于有效的数据也舍弃掉,所以此法有一定局限性。 Q检验法符合数理统计原理,但只适合用于一组数据中有一个可疑值的判断。 Grubbs法将正态分布中两个重要参数x及S引进,方法准确度较好。 三种方法以Grubbs法最合理而普遍适

13、用。,四、常用的检验方法,1.t-检验(T-tests ):与均值相联系,比较两个样本的均值差异性,要求服从正态分布或者t分布。 2.单因素方差分析:(One-way analysis of variance)单因素方差检验,用于多个样本均数的显著性检验。,1. t检验,由于研究中不可能把总体中所有的样本都进行测定,比如总体有1000个个体,我们可以选择50个组成样本,测定样本的均值来反映总体的均值。但是由于取样的问题,可能抽到一些数值较大或者较小的个体,从而使得样本的均值和总体参数的均值之间有所不同,那么有一个问题:这个样本参数均值是否能代表总体均值?均值不等的样本个体是否能代表总体呢?另外

14、,两组样本参数的均值是来自相同的总体还是不同的总体?它们之间是否有不同?这就需要进行t检验。,t 检验的类型,1.单一样本t检验(One-Sample T Test):检验单个变量的均值是否与给定的标准或者常数之间是否存在差异。 2.独立样本t检验(Independent Sample T Test):用于检验两组来自独立总体的样本,其独立总体的均值是否有差异。 3.配对样本t检验(Paired-Sample T Test): 用于检验两个相关或配对的样本是否来自具有相同均值的总体。,配对样本t检验,比如考查同一组人在参加一年的长跑锻炼前后的心率是否有显著差异。这里,每个人一年前的心率和一年后

15、的心率是相关的,心率较快的人锻炼后仍相对其他人较快。所以,检验这样的成对总体的均值不能使用独立样本t检验的办法,因为独立条件不再满足。要用配对样本t检验 。,配对样本t检验,又如想知道饲料中缺乏维生素E对大鼠肝中维生素A含量有无影响,实验选择8对16只大鼠,每对大鼠一只喂给正常饲料,另一只喂给维生素E缺乏饲料。考查正常饲料组和维生素E缺乏饲料组的结果有无差异时,也需要用配对样本t检验 。,t检验中的P值,t检验中的P值就是用于判断均数差异存在大小的可能性或者概率。 概率P值在0与1之间,P越接近于1,表明某事件发生的可能性越大,P越接近于0,表明某事件发生的可能性越小。习惯上将P0.05,或P

16、0.01,成为小概率事件,表示某事件发生的可能性很小。,t 检验法公式,均值与标准值的比较 进行t检验时,首先按下式计算出t值 若t计算t,f,即P值0.05时则没有显著性差异。 通常以95%的置信度为检验标准,即显著性水准为5%。,t检验的2种方法,1. 双侧检验 2. 单侧检验,双侧检验和单侧检验,双侧检验:一般不知道数据的变化趋势时,默认为双侧检验。 单侧检验:主要关心带方向性或趋势性的检验问题。分两种情况:一种是我们所考察的数值越大越好。例如某机构购买灯泡的使用寿命,轮胎的行驶里程数,等等。另一种是数值越小越好,例如废品率、生产成本等等。,双侧检验和单侧检验,若对同一资料进行双侧检验也进行单侧检验时,同一资料双侧检验与单

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号