声品质成对比较主观评价的数据检验及判据

资源描述

《声品质成对比较主观评价的数据检验及判据》由会员分享，可在线阅读，更多相关《声品质成对比较主观评价的数据检验及判据（5页珍藏版）》请在金锄头文库上搜索。

1、第卷第期年。月声学学报 , , 声品质成对比较主观评价的数据检验及判据毛东兴俞悟周王佐民同济大学声学研究所上海年月日收到年月日定稿摘要针对声品质主观评价成对比较法试验结果统计分析中 , 采用一致性系数进行数据有效性判断的不足 , 从检验成对比较试验数据中存在的相同声事件、不同回放次序以及三角循环等三种误判出发 , 分析了评价试验的三角循环误判的发生情况 , 提出了三角循环误判次数的准确计算方法。在成对比较评价试验数据有效性检验中 , 综合考虑了三种误判情形 , 提出了判断数据有效性的计权一致性系数判据。最后 , 将数据检验方法和判据应用于车内噪声

2、的声品质成对比较评价数据的分析 , 获得了分析结果与一模型拟合结果较好的相关性 , 验证了判据的可靠性。数 , 】认几从叭几云亡二亡二亡 , 。刃流 ,。,亡习 , , , 一一一 , 一叮一一 , , , , , 一, 以得到被评价量的群体取向以及分布特征。但是 , 主引言观评价试验中往往会出现误判或奇异值 , 只有在统计分析中正确地剔除掉误判的数据 , 才能得到正确地反近年来 , 声品质研究成为新兴的研究领域以及映群体特征的统计结果。在世纪四、五国际众多声学研究者的研究热点 , 声品质研究的理十年代提出的一致性系数医被广泛应用于成对比

3、论也在逐渐形成和完善一” 。声品质研究的一个重较法评价试验数据的检验一。然而 , 一致要途径是主观评价实验 , 成对比较法主观评价试验性系数仅是对成对比较法评价数据间的连贯性的一被广泛应用于人的主观感知评价试验包括听觉、味种估计方法 , 而成对比较法主观评价试验设计中通常觉、视觉等。与其它主观评价方法相比 , 成对比较包含多种数据可靠性检验设计 , 包括相同声事件比较法具有简单、易于实现的特点 , 因此成对比较法也是乞一乞比较、不同回放顺序的比较勺一户比较以及声品质主观评价试验最常用的方法之一闺。反映评价数据连贯性的循环误判检验等。

4、门认对主观评价试验得到的数据进行统计分析 , 可为评价中出现误判的可能性有以下三种评价者国家自然科学基金资助项目期毛东兴等声品质成对比较主观评价的数据检验及判据在评价过程中的注意力不够集中 , 评价者的评判标准在不断修正变动 , 声样本之间声品质特征比较接近 , 较难作出区分和判断。】的研究结果表明 , 即使针对数据连贯性的三角循环误判 , 一致性系数给出的也不是准确的判断。然而 , 给出的计算模型中仍然存在着统计错误。本文从分析成对比较法中的相同声事件比较一乞比较误判、不同回放顺序比较万一乞比较误判以及三角循环误判等三种误判着手 , 通过对三角

5、循环误判出现情况的分析 , 得到了准确计算三角循环误判次数的数学方法。同时 , 在试验数据有效性检验中 , 综合考虑了三种误判 , 提出了更全面反映数据误判情况的计权一致性系数作为判断主观成对比较法评价数据有效性的检验判据。最后 , 将所提出的方法和判据应用于轿车的车内噪声成对比较法声品质评价数据的分析中 , 通过分析结果与一模型拟合结果及声样本绩效值的相关分析 , 得到了结果间的较好的一致性 , 证明了判据的可靠性。列 , 只、的结果应为不定值 , 也就是说 , 无论只、的结果为还是。或是一 , 评价结果都不能被判定为误判。因此 ,

6、出现序列一排列的评价结果都应视为是正确的判断 , 而其余种排列的评价结果是错误的。也就是说 , 对以上排列的评价结果进行三角循环误判统计 , 误判次数应为次如果我们按照的方法 , 并不能达到这样的三角循环误判次数 , 说明七方法还是低估了三角循环误判的次数。经过了对评价结果可能排列的分析 , 在方法的基础上 , 可以得出三角循环误判的准确计算方法。一矗艺云,人, “ 三云 ,凡三亡式中矛队氏、的值只能为或乃、不为时下式计算为所评价的声事件的数量。函数或。当只十乃、 , 而且只 , 凡、其它情况下 , 氏。、根

7、据三角循环误判的准确计算为了得到准确计算三角循环误判的实际出现次数 , 首先分析乞三个声事件在成对比较时可能得出的结果排列情况。采用只 , 凡、和只分别来表示比较对一、一儿和坛一的比较结果 , 并将任两个声事件汀成对比较可能出现的结果乞卜、乞二以及乞只分别表示针对所评价的量 , 声事件乞优于、声事件乞与, 无差异、声事件优于劝分别赋值为只了二、只、二二以及只一 , 可以得到如表所示的扮三个声事件成对比较评价结果的可能排列。占、,、二只。凡、一一只、为验证以上计算方法的正确性 , 采用在计算机

8、中数据的逻辑判断的方法来验证。对乞户三个声事件的成对比较结果 , 三角循环误判的出现可归纳为以下三种情况以及凡、全时 , 却有只三 , 时 , 却有只、笋乃、 , 以及几、三。时 , 却有只、全一一只只只了少、诬、表三个声样本汀哟成对比较评价结果的可能排列序序号号只 , , 乃、只儿儿序号号只弓、只无无序号号只凡、只儿儿一一一一一一一一一一一一一一一一一一一一一一一一一一一验证的成对比较数据采用了实际试验得到的评价结果矩阵以及计算机随机产生的评价结果矩阵。从个声事件到个声事件的成对比较矩阵的检验 ,

9、由式、的计算得到的误判次数和根据式进行的逻辑判断得到的误判次数结果完全一致。根据式和的误判次数统计方法 , 在数据分析过程中构建了专门的计算函数对主观评价试验数据进行三角循环误判计数统计。函数中输入参数为评价者的评价结果矩阵、样本数量和赋值范围 , 计算结果为三角循环误判次数和三角循环误判率。按照三个声样本评价结果的可能排列 , 其中序号为一的排列可以按的统计模型得出正确判断。对于序号为一以及一的排数据有效性判据前面提到 , 完整的成对比较法主观评价实验的数据分析中应包含相同声事件误判、不同回放顺序比较误判以及三角循环误判的检验。

10、舍弃误判概率较高的评价人员的数据 , 才能得到更准确可靠地反映声品质评价参量的统计结果。为便于解释 , 以车内噪声的声品质偏好性特征的成对比较法主观评价实验误差检验数据为例 , 来说明学年价数据在数据分析中应予以剔除。表为根据式和式计算的各评价者在每组评价试验中偏好性评价的三角循环误判的误判率。同样 , 误判率较高的评价数据的评价准确性较低 , 数据分析时应予以剔除。口铃鉴沐洲锌澎买咚数据有效性的判断方法。表中给出了试验数据中不同评价者在相同声事件比较乞一葱比较中出现的误判次数。对试验中预设的检验评价者评价结果准确性的两个相同声事

11、件比较 , 个评价者在、三组独立评价试验中 , 一些评价者如、和作出两者不相等只务的判断的次数较多。这些评价者的试验数据的正确率较低 , 在数据分析中被归类于应予以剔除的数据。图中给出了在、三组独立试验中 , 相同声事件比较误判次数出现的概率的分布。在偏好性评价中 , 大多数评价者未出现误判在低沉度评价中 , 误判次数不超过次的评价者占较大比例。两个参量的评价结果中 , 误判次数在次以上的评价者占左右。误判次数的分布一方面用于分析试验的可靠性 , 另一方面用于确定数据剔除的界限。表中给出的是三组试验中不同回放顺序比较柳一户比较

12、偏好性评价的误判统计结果。在试验中预设的汀序列先回放事件乞再回放事件与户序列比较 , 个评价者在两次判断中作出不一致判断的情况存在明显差异。而且在不同试验组中 , 同一评价者出现的误判次数也有差异。误判次数较多的评表偏好性评价各组误判次数误判次数图各组一云比较误判次数出现概率艺一云比较产生的误判次数评评价者者组组组组组组评评价者者组组组组组组表偏好性评价各组勺一产比较产生的误判次数评评价者者组组组组组组评评价者者组组组组组组表偏好性评价各组三角循环误判率评评价者者组组 , 组组组组 , 评评价者者组组一 ,

13、组组组组 , 期毛东兴等声品质成对比较主观评价的数据检验及判据从对偏好性评价的三种误判的统计分析中 , 可以确定评价准确性较低的数据。但是 , 从以上结果中可以看出 , 评价者的三种误判检验结果并不一致。有的评价者的相同声事件比较的误判次数较多 , 而三角循环的误判率却较小如评价者 , 有的评价者的相同声事件比较的误判次数较少 , 而不同听音顺序比较误判次数以及三角循环误判率却较大如评价者。如果依据各种误判类型分别确定数据分析中应予以剔除的数据 , 各种判据中确定的应被剔除的评价者是不一致的。而且 , 每种误判检验设计在评价试验整体中所占

14、的比例不一样 , 因而对最终分析结果准确性的影响程度也不一样。因此 , 仅根据某一种误判的结果来确定数据的取舍是不恰当的。对多组评价数据的误判结果分析 , 在采用不同数据有效性判据分析比较后 , 我们得到 , 采用计权误判率计权一致性系数来判断数据的有效性才能更全面地反映评价中各种误判对统计结果的影响。计权误判率几根据下式计算二艺以艺尽同 , 但一般认为一致性系数在以上 , 试验结果是可接受的 , 最好在以上一。根据国外研究者的经验 , 数据的剔除一般要遵循以下两条准则评价者结果中约人员的结果应予以剔除。评价结果的一致性系数在以上 ,

15、结果的可靠性才比较高。根据以上两条准则 , 考虑到偏好性评价与低沉度评价的差异性 , 确定了在最终分析中剔除计权一致性系数低于偏好性评价和低沉度评价的评价人员的数据。的研究结果表明 , 一及模型简称模型可以较好地适用于汽车噪声主观评价结果的预测。根据计权一致性系数对评价数据进行取舍后 , 进行了评价结果的排序分析和模型拟合。偏好性与低沉度两个评价参量的主观评价矩阵与模型预测矩阵的相关系数如表所示 , 表中给出了、三组独立样本的评价与预测结果的相关系数。结果表明两者间存在较高的相关系数。表计权一致性系数式中尽为第艺种误判可能产生的次

16、数 , 认为第种误判实际产生的误判率。计权一致性系数为如二一口切判据可靠性检验为了验证采用计权一致性系数判据的可靠性 , 进行了轿车的车内噪声主观评价试验。实验中声样本为、三组车内人工头记录的双耳噪声信号 , 每组样本包含了个不同运行工况下的车内双耳噪声信号。主观评价实验前对原始记录的噪声信号进行了截取、等响调节等信号预处理以及评价人员的培训等评价前必要的准备工作。评价参量包括偏好性和低沉度两个参数。根据式计算的个评价者在各样本组和评价指标的计权一致性系数如表所示 , 最后一行为所有评价者的平均值。计权一致性系数的结果说明了整个评价实验数据是有效可信的。低沉度评价结果的一致性平均优于偏好性评价结果的一致性平均 , 说明了对评价人员来说 , 低沉度的评价要易于偏好性评价。根据计权一致性系数的结果 , 就可以将评价中误判较多的评价者的数据剔除掉。由于试验条件及情况的不同 , 各研究者提出的判断标准也不完全相评评价者者偏好性评价价低沉度评价价

展开阅读全文