语音助手大比拼:苹果Siri和华为小e—,引言现如今,智能设备的普及让"人工智能”这个话题变得不再陌生而遥远以前人们想订购车票一定要到车站去购买;后来有了互联网,人们可以在网站上 自行查询车票信息并购买,省去了去车站的时间,在家即可完成;再后来出现了 语音助手,人们甚至可以通过语音助手查询车票信息,省去了自己搜索查找的时 间,说出想要了解的信息即可随着科技的发展,人们的生活变得越来越便捷,而人工智能似乎一直致力于"解 放人〃 0用户与智能设备的交互不再局限于键盘、鼠标之类的硬件,触控交互、语音交互 已经成为了当代人机交互的主流方式,用户的操作也变得越来越便捷与直接在 技术欠缺的年代里,人们注重更多的是功能的实现,而在技术成熟的现在,人们 注重更多的是如何〃解放人"以及提升用户的情感体验自苹果推出语音助手"Siri〃后,各大智能企业也都相继推出了自己的语音助手, 它们不局限于这个载体,电脑、手表、家电等智能设备都可以通过语音助手 进行操作 两组测试完成后需要让实验对象填写一份问卷调查,实验对象需针对每个问题给 出相应的分数(10分制),最后进行数据分析,得出该实验对象对两款语音助 手服务质量、产品质量、内容质量,以及整体使用满意度的分析结果。
三、实验结果此次实验中的主要测试数据为实验对象使用两款语音助手执行语音指令时的操 作耗时,以及用户在测试完两组语音指令后对该两款语音助手用户满意度进行反 馈的调查问卷第1组:"给妈妈发祝她生日快乐"从实验对象说出语音指令时开始计时,直至达到预期效果,语音助手给出最后反 馈结束计时,得出两款语音助手在面对本指令时的操作耗时,数据如下图所示:指令1两语音助手的耗时比较图3 Siri与小e在执行指令1时的耗时比较从上图所示的图表中我们可知:Siri的平均操作耗时为11.758秒,华为的平均 操作耗时为30.302秒,在操作耗时方面Siri要明显优于小eo Siri的标准误差 为0.555 ,小e的标准误差为2.075 ,相较于小e , Siri显然要更稳定一些,对 不同用户的语音都能进行准确转译与反馈,因此操作耗时相差无几;而小e的操 作耗时受不同用户的影响更大,数据起伏大将该组实验数据进行单因素方差分析,可得p值为6.01E-06 ,因为p<0.05 ,可知本次实验中,不同的语音助手在操作耗时方面有极大的区别,数据如下表所 示:方差分析差异源SSdfMSFP-valueF crit组间1031.56563311031.56674.516376.01163E-064.964602744组内138.43476671013.84348图4 Siri与小e在执行指令1时的单因素分析表第2组:"发短信给妈妈说记得提醒我明天下午两点去小剧场彩排节目“从实验对象说出语音指令时开始计时,直至达到预期效果,语音助手给出最后反馈结束计时,得出两款语音助手在面对本指令时的操作耗时,数据如下图所示:耗时(秒)454035302520151050指令2两语音助手的耗时比较iliriili用户1 用户2 用户3 用户4 用户5 用户6■苹果Siri ■华为小e图5 Siri与小e在执行指令2时的耗时比较从上图所示的图表中我们可知:Siri的平均操作耗时为17.862秒,华为的平均 操作耗时为20.055秒,在操作耗时方面两者相近。
Siri的标准误差为1.253 , 小e的标准误差为0.686 ,相较于Siri ,小e要略稳定一些两者的操作数据在 此次试验中受用户的影响都较小,数据平稳将该组实验数据进行单因素方差分析,可得p值为0.156 ,因为p>0.05 ,可知 本次实验中,不同的语音助手在操作耗时方面的区别不是很大,数据如下表所示:方差分析差异源SSdfMSFP-valueF entwwvs组间14.43213114.43213332.358437070.155619194.964603组内61.19363106.11936333图6 Siri与小e在执行指令2时的单因素分析表用户满意度:在实验对象结束两组实验后,对其进行问卷调查,调查问卷中的问题设置如前文 所示调查问卷主要研究三个方面:产品质量、内容质量、服务质量产品质量指该语 音助手在运行时是否卡顿、界面设计是否舒适;内容质量指该语音助手在语音转 译时是否正确,能否准确识别方言等;服务质量指该语音助手是否对用户进行适 当引导,在用户提问出错时对其进行类似"你可以试试对我说…”的引导性提问最终数据结果如下图所示:两语音助手的用户满意度比较苹果Sin —华为小e 内容质量产品房品图7 Siri与小e在执行指令2时的单因素分析表由上图可知,Siri与小e在用户满意度上的区别并不是很大,在内容质量上两者 几乎没有差别,即Siri和小e的文字转译正确率都接近100%。
在产品质量上小e略高于Siri ,而在服务质量上小e以较明显的优势压过Siri 大部分测试对象都反馈小e在用户引导上有更好的设置处理,使得从未使用过语 音助手的小白也能轻松上手,从而真正达到语音助手便捷用户这个目的且小e 的操作可修改性较高,对于用户的实际操作会根据需要拆分成几个步骤,而Siri 则是一步到位,若要修改必须从头再来四,结论通过此次"苹果智能语音助手Siri与华为语音助手小e的实用性比较评估"实验, 我们可以得出以下结论: Siri执行语音指令的操作总耗时平均14.81秒,小e执行语音指令的操作总耗时 平均25.18秒Siri在操作耗时上整体比小e短,即能更快的对语音进行转译并 给出反馈而通过实验测试后的调查问卷,我们可以发现Siri与小e的用户满意度相近但 小e在服务质量方面更胜一筹,相较于Siri它能给用户更多的引导提示,这对不 了解语音助手功能的用户而言更加友好只依靠操作耗时、用户满意度这两个实验数据我们无法断言Siri与小e哪个在性 能上更好,但这可以作为评估语音助手实用性的一种参考单从操作耗时的角度 上看,Siri明显优于小e ;单从用户满意度的角度上看,小e尤其在服务质量上 要优于Siri0预期的实验结果是Siri无论在操作耗时还是用户满意度方面都应领先于小e,而 这与实验的实际结果是不符的。
操作耗时上确实是苹果更胜一筹,但用户满意度 两者并没有明显差别,且小e在服务质量方面甚至要优于Siri因此我们看出, Siri与小e在实际应用中各有千秋正因如此,语音助手的泛滥给用户带来了许多困惑,这也是我想做这个课题的起 因希望通过此次实验,能够以苹果智能语音助手Siri和华为语音助手小e为例, 对这两个语音助手进行操作E匕较评估,从而进行区分此次实验主要针对平台,观察不同语音助手对同一用户指令的完成情况实 验选取了 iPhone X及华为P20作为实验体,并寻找了 6名实验对象实验对 象需做两组重复试验,每次实验都将对Siri、小e说出同样的语音指令,观察其 反馈情况若未能达到指令预期效果,则根据自身需要继续补充,与语音助手进 行交流,直到达到预期目的为止记录语音助手完成此任务的耗时,以及用户满 nrhr rr^r启、度通过此次试验,可以直观地看出Siri和小e在处理同一指令时的反馈语音交互 的功能覆盖面虽然依旧不是很广,但用户体验却是其中至关重要的考量因素交 互时的任务完成度、耗时等都将影响用户体验在测试结束后,让每位测试用户 做问卷调查,希望能通过数据分析,对Siri及小e有初步的实用性比较评估。
图]语音助手通过实验数据可知,Siri执行语音指令时的操作总耗时平均14.81秒,小e执行 语音指令时的操作总耗时平均25.18秒Siri在操作耗时上整体比小e短,即能 更快的对语音进行转译并给出反馈而通过实验测试后的调查问卷,我们可以发现Siri与小e的用户满意度相近但 小e在服务质量方面更胜一筹,相较于Siri它能给用户更多的引导提示,这对不 了解语音助手功能的用户而言更加友好只依靠操作耗时、用户满意度这两个实验数据我们无法断言Siri与小e哪个在性 能上更好,但这可以作为评估语音助手实用性的一种参考单从操作耗时的角度 上看,Siri明显优于小e ;单从用户满意度的角度上看,小e尤其在服务质量上 要优于Siri二、实验设计2.1实验假设苹果智能语音助手Siri发布于2016年6月13日,开辟了端中语音交互的 先河,因此在技术层面上可能较华为语音助手小e更为成熟对于同一语音指令, 两者应该都能做到准确无误的文字转译,但在操作耗时上Siri可能还是要领先于 小e同时,苹果公司一直致力于用户体验研究,因此在用户满意度方面,Siri 可能也会优于小e02.2实验内容现在的语音助手对于涉及基本功能的常规问题都能做到完美应答,因此在设计实 验时更应该考虑到日常生活的需要。
此次实验内容旨在通过考查Siri与小e对同一语音指令的完成情况来评估两者的 实用性实验对象需分别对Siri和小e说出同一指令,并与其进行后续的人机交 流,直至完成指令任务,记录耗时在用户试验测试完后让其填写调查问卷,用 户满意度可根据实验对象的调查问卷结果分析得出2.3实验的设备及环境本实验对环境没有要求,为防止不同对实验结果的影响,选取一部iPhoneX与一部华为P20作为固定的实验设备1639“A ■ ■你可以这样问我:.“打培妈闻..FaceTimeiS 话 ■*FaceTimed'®~App “打开照片.信息“告诉张■我马上利•■日历 “安排9点忡升会"翻课“我建你用法语忠么说?"廉体甯 "rRA(raiiiua7iR?-,1639』*请问需要什么帮助?图2苹果智能语音助手Siri与华为小e产品界面比较2.4用户实验对象一:年龄:21性别:女专业背景:大学工科在读选择理由:该实验对象有5年苹果产品的使用经验,现正在使用iPhoneX,对 苹果iOS操作系统十分熟悉,而对安卓系统并不熟悉,并且从未使用过华为手 机由于平时所学专业的原因,对电子产品及其语音助手功能十分了解,因此, 对Siri有基本认识,但对小e不曾了解。
实验对象二:年龄:20性别:女专业背景:大专在读选择理由:该实验对象有6年安卓产品的使用经验,现正在使用华为P20 ,对 安卓操作系统十分熟悉,而对苹果iOS系统并不熟悉由于平时所学专业的原 因,对电子产品及其语音助手功能十分了解,因此,对小e有基本认识,但未曾 使用过Siri实验对象三:年龄:25性别:男专业背景:互联网从业者选择理由:该实验对象有6年安卓产品的使用经验,现正在使用华为P20 pro , 对安卓操作系统十分熟悉虽在此前该实验对象对华为的语音助手功能并不了 解,也从未使用过小e ,但由于个人爱好的原因,对电子产品及其他语音助手有 一定了解基础实验对象四:年龄:23性别:女专业背景:普通从业者 选择理由:该实验对象有5年安卓产品的使用经验,现正在使用华为因为自身 原因,平时对电子产品使用不多,属于智能设备小白,因此从未使用过任何智能 设备中的语音助手功能实验对象五:年龄:55性别:女专业背景:家庭主妇选择理由:该实验对象有多年安卓产品的使用经验,现正在使用华为对智能电 子设备的使用频率较低,且对语音助手没有任何了解因此对其的实验调查更能 体现出语音助手是否真的便捷了用户的操作。