声品质成对比较主观评价的数据检验及判据

上传人:小** 文档编号:88104324 上传时间:2019-04-19 格式:PDF 页数:5 大小:383.33KB
返回 下载 相关 举报
声品质成对比较主观评价的数据检验及判据_第1页
第1页 / 共5页
声品质成对比较主观评价的数据检验及判据_第2页
第2页 / 共5页
声品质成对比较主观评价的数据检验及判据_第3页
第3页 / 共5页
声品质成对比较主观评价的数据检验及判据_第4页
第4页 / 共5页
声品质成对比较主观评价的数据检验及判据_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《声品质成对比较主观评价的数据检验及判据》由会员分享,可在线阅读,更多相关《声品质成对比较主观评价的数据检验及判据(5页珍藏版)》请在金锄头文库上搜索。

1、第卷第期 年 。月 声学学报 , , 声品质成对比较主观评价的数据检验及判据 毛东兴俞悟周 王佐民 同济大学声学研究所上海 年月 日收到 年月 日定稿 摘要针对声品质主观评价成对比较法试验结果统计分析中 , 采用一致性系数进行数据有效性判断的不足 , 从检验 成对比较试验数据中存在的相 同声事件 、 不 同回放次序以及三角循环等三种误判出发 , 分析了评价试验的三角循环误判的发 生情况 , 提出了三角循环误判次数的准确计算方法 。 在成对比较评价试验数据有效性检验中 , 综合考虑了三种误判情形 , 提 出了判断数据有效性的计权 一 致性系数判据 。 最后 , 将数据检验方法和判据应用于车内噪声

2、的声品质成对比较评价数据的分 析 , 获得了分析结果与 一 模型拟合结果较好的相关性 , 验证了判据的可靠性 。 数 , 】 认几从叭 几 云亡二亡 二亡 , 。刃 流 ,。,亡习 , , , 一 一一 , 一 叮 一一 , , , , , 一, 以得到被评价量的群体取向以及分布特征 。 但是 , 主 引言 观评价试验 中往往会出现误判或奇异值 , 只有在统计 分析中正确地剔除掉误判的数据 , 才能得到正确地反 近年来 , 声 品质研究成为新兴 的研究领域以及映群体特征的统计结果 。 在世纪四 、 五 国际众多声学研究者的研究热点 , 声 品质研究的理十年代提出的一致性系数医被广泛应用于成对比

3、 论也在逐渐形成和完善 一” 。 声品质研究的一个重较法评价试验数据的检验 一 。 然而 , 一致 要途径是主观评价实验 , 成对比较法主观评价试验性 系数仅是对成对比较法评价数据间的连贯性的一 被广泛应用于人的主观感知评价试验包括听觉 、 味种估计方法 , 而成对比较法主观评价试验设计中通常 觉 、 视觉等 。 与其它主观评价方法相比 , 成对比较包含多种数据可靠性检验设计 , 包括相 同声事件比较 法具有简单 、 易于实现的特点 , 因此成对比较法也是 乞一乞比较 、 不 同回放顺序的比较勺一户 比较以及 声品质主观 评价试验最常用的方法之一 闺 。 反映评价数据连贯性的循环误判检验等 。

4、 门认 对主观 评价试验得到的数据进行统计分析 , 可为评价中出现误判的可能性有以下三种评价者 国家 自然科学基金资助项目 期毛东兴等声品质成对比较主观评价的数据检验及判据 在评价过程中的注意力不够集中 , 评价者的评判标 准在不断修正变动 , 声样本之间声品质特征比较 接近 , 较难作出区分和判断 。 】的研究结果表 明 , 即使针对数据连贯性的三角循环误判 , 一致性系数给出的也不是准确的判断 。 然而 , 给出的计算模型中仍然存在着统计错误 。 本文从分析成对比较法中的相同声事件比较 一乞比较 误判 、 不同回放顺序比较万 一 乞比较 误判以及三角循环误判等三种误判着手 , 通过对三角

5、循环误判出现情况的分析 , 得到了准确计算三角循环 误判次数的数学方法 。 同时 , 在试验数据有效性检验 中 , 综合考虑了三种误判 , 提出了更全面反映数据误 判情况 的计权一致性系数作为判断主观成对比较法 评价数据有效性的检验判据 。 最后 , 将所提出的方法 和判据应用于轿车的车 内噪声成对比较法声品质评 价数据的分析中 , 通过分析结果与 一 模 型拟合结果及 声样本绩效值的相关分 析 , 得到了结果间的较好的一致性 , 证明了判据的可 靠性 。 列 , 只 、 的结果应为不定值 , 也就是说 , 无论只 、 的 结果为还是 。或是一 , 评价结果都不能被判定为 误判 。 因此 ,

6、出现序列一排列的评价结果都应 视为是正确的判断 , 而其余种排列 的评价结果是 错误的 。 也就是说 , 对以上排列的评价结果进行三角 循环误判统计 , 误判次数应为次如果我们按照 的方法 , 并不能达到这样的三 角循环误判次 数 , 说明 七方法还是低估了三角循环误判的次 数 。 经过了对评价结果可能排列 的分析 , 在 方法的基础上 , 可 以得 出三角循环误判的准确计算 方法 。一 矗 艺 云,人, “ 三云 ,凡三亡 式中 矛 队 氏 、 的值只能为 或乃 、 不为时 下式计算 为所评价的声事件的数量 。 函数 或 。 当只 十乃、 , 而且只 , 凡 、 其它情况下 , 氏 。、 根

7、据 三角循环误判的准确计算 为 了得到准确计算三角循环误判的实际出现次 数 , 首先分析 乞 三个声事件在成对比较时可能得 出的结果排列情况 。 采用只 , 凡 、 和只分别来表 示 比较对 一 、 一儿和坛一 的比较结果 , 并将 任两个声事件汀成对比较可能出现的结果 乞卜 、 乞二 以及 乞只 分别表示针对所评价的量 , 声事件 乞 优于 、 声事件 乞与, 无差异 、 声事件优于劝分 别赋值为只 了二 、 只、 二二 以及只 一 , 可以得到如 表所示 的 扮 三个声事件成对比较评价结果 的可 能排列 。 占 、,、二 只。 凡 、 一一只、 为验证以上计算方法的正确性 , 采用在计算机

8、中 数据的逻辑判断的方法来验证 。 对 乞 户三个声事件的 成对比较结果 , 三角循环误判的出现可归纳为以下三 种情况 以及凡、全时 , 却有只 三 , 时 , 却有只 、 笋乃、 , 以及 几 、 三。时 , 却有只 、全 一一 只只只 了 少 、诬、 表三个声样本汀哟成对比较评价结果的可能排列 序序号号只 , , 乃 、 只儿 儿 序号号只 弓 、 只无 无 序号号只 凡 、 只儿 儿 一一一 一一 一一 一一一 一一一一 一一一 一一一一 一一 一一一一 验证的成对比较数据采用了实际试验得到的评 价结果矩阵以及计算机随机产生的评价结果矩阵 。 从个声事件到个声事件的成对比较矩阵的检验 ,

9、 由式 、 的计算得到的误判次数和根据式进 行的逻辑判断得到的误判次数结果完全一致 。 根据式和的误判次数统计方法 , 在数据 分析过程 中构建了专门的计算函数对主观评价试验 数据进行三角循环误判计数统计 。 函数中输入参数为 评价者的评价结果矩阵 、 样本数量和赋值范围 , 计算 结果为三角循环误判次数和三角循环误判率 。 按照三个声样本评价结果的可能排列 , 其中序 号 为一的排列可以按的统计模型得出 正确判断 。 对于序号为一以及一的排 数据有效性判据 前面提到 , 完整的成对比较法主观评价实验的 数据分析中应包含相同声事件误判 、 不 同回放顺序 比较误判以及三角循环误判 的检验 。

10、舍弃误判概率 较高的评价人员 的数据 , 才能得到更准确可靠地反 映声品质评价参量的统计结果 。 为便于解释 , 以车内噪声的声品质偏好性特征的 成对比较法主观评价实验误差检验数据为例 , 来说明 学年 价数据在数据分析中应予以剔除 。 表为根据式和式计算的各评价者在 每组评价试验中偏好性评价的三角循环误判 的误判 率 。 同样 , 误判率较高的评价数据的评价准确性较 低 , 数据分析时应予以剔除 。 口 铃鉴 沐洲 锌澎买咚 数据有效性的判断方法 。 表中给出了试验数据中不 同评价者在相 同声事件比较 乞一葱比较 中出现的误 判次数 。 对试验中预设的检验评价者评价结果准确性 的两个相同声事

11、件比较 , 个评价者 在 、 三组独立评价试验中 , 一些评价者如 、 和作出两者不相等只务的 判断的次数较多 。 这些评价者的试验数据的正确率 较低 , 在数据分析中被归类于应予以剔除的数据 。 图中给出了在 、 三组独立试验中 , 相 同声事件比较误判次数出现的概率的分布 。 在偏 好性评价中 , 大多数评价者未出现误判在低沉度评 价中 , 误判次数不超过次的评价者 占较大比例 。 两 个参量的评价结果中 , 误判次数在次以上的评价 者占左 右 。 误判次数的分布一方面用于分析试 验的可靠性 , 另一方面用 于确定数据剔除的界限 。 表中给出的是三组试验中不同回放顺序比较 柳 一 户 比较

12、偏好性评价的误判统计结果 。 在试验 中预设的汀序列先回放事件 乞再回放事件 与户 序列比较 , 个评价者在两次判断中作 出不一致判 断的情况存在明显差异 。 而且在不 同试验组中 , 同一 评价者出现的误判次数也有差异 。 误判次数较多的评 表偏好性评价各组 误判次数 误判次数 图各组 一云比较误判次数出现概率 艺一云比较产生的误判次数 评评价者者 组组 组组 组组 评评价者者 组组 组组 组组 表偏好性评价各组 勺一产比较产生的误判次数 评评价者者 组组 组组 组组 评评价者者 组组 组组 组组 表偏好性评价各组三角循环误判率 评评价者者 组组 , 组组 组组 , 评评价者者 组组 一 ,

13、 组组 组组 , 期毛东兴等声品质成对比较主观评价的数据检验及判据 从对偏好性评价的三种误判的统计分析 中 , 可 以确定评价准确性较低的数据 。 但是 , 从以上结果中 可 以看出 , 评价者的三种误判检验结果并不一致 。 有 的评价者的相同声事件比较的误判次数较多 , 而三 角循环 的误判率却较小如评价者 , 有的评价 者 的相 同声事件比较的误判次数较少 , 而不同听音 顺序比较误判次数以及三角循环误判率却较大 如评 价者 。 如果依据各种误判类型分别确定数据 分析中应予以剔除的数据 , 各种判据中确定的应被 剔除的评价者是不一致的 。 而且 , 每种误判检验设计 在评价试验整体中所 占

14、的 比例不一样 , 因而对最终 分析结果准确性的影响程度也不一样 。 因此 , 仅根据 某一种误判的结果来确定数据的取舍是不恰当的 。 对多组评价数据的误判结果分析 , 在采用不同 数据有效性判据分析比较后 , 我们得到 , 采用计权误 判率计权一致性系数来判断数据的有效性才能更 全面地反映评价中各种误判对统计结果 的影响 。 计 权误判率几根据下式计算 二 艺 以 艺尽 同 , 但一般认为一致性系数在以上 , 试验结果是 可接受的 , 最好在以上 一 。 根据国外研究者 的经验 , 数据的剔除一般要遵循以下两条准则 评价者结果中约人员 的结果应予 以剔 除 。 评价结果的一致性系数在以上 ,

15、 结果的 可靠性才比较高 。 根据以上两条准则 , 考虑到偏好性评价与低沉度 评价的差异性 , 确定了在最终分析中剔除计权一致性 系数低于偏好性评价和低沉度评价的 评价人员的数据 。 的研究结果表明 , 一及 模型 简称模型可以较好地适用于汽车噪声主观评 价结果 的预测 。 根据计权一致性系数对评价数据进 行取舍后 , 进行了评价结果 的排序分析和模型 拟合 。 偏好性与低沉度两个评价参量的主观评价矩 阵与模型预测矩阵的相关系数如表所示 , 表中 给出了 、 三组独立样本的评价与预测结果的 相关系数 。 结果表明两者间存在较高的相关系数 。 表计权一致性系数 式中尽 为第 艺种误判可能产生的次

16、数 , 认为第 种误判实际产生 的误判率 。 计权一致性系数为 如 二一口切 判据可靠性检验 为了验证采用计权一致性系数判据的可靠性 , 进行了轿车的车内噪声主观评价试验 。 实验 中声样 本为 、 三组车内人工头记录的双耳噪声信 号 , 每组样本包含了个不同运行工况下 的车内双 耳噪声信号 。 主观评价实验前对原始记录的噪声信 号进行了截取 、 等响调节等信号预处理 以及评价人 员的培训等评价前必要的准备工作 。 评价参量包括 偏好性和低沉度两个参数 。 根据式计算的个评价者在各样本组和评 价指标的计权一致性系数如表所示 , 最后一行为 所有评价者的平均值 。 计权一致性系数的结果说 明 了整个评价实验数据是有效可信的 。 低沉度评价结 果 的一致性平均优于偏好性评价结果 的一致 性平均 , 说明了对评价人员来说 , 低沉度的评 价要易于偏好性评价 。 根据计权一致性系数的结果 , 就可 以将评价中 误判较多的评价者的数据剔除掉 。 由于试验条件及 情况 的不同 , 各研究者提出的判断标准也不完全相 评评价者者偏好性评价价低沉度评价价

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号