自动音源评分方法及装置的制作方法

资源描述

《自动音源评分方法及装置的制作方法》由会员分享，可在线阅读，更多相关《自动音源评分方法及装置的制作方法（4页珍藏版）》请在金锄头文库上搜索。

1、自动音源评分方法及装置的制作方法专利名称：自动音源评分方法及装置的制作方法技术领域：本发明是关于一种评分方法及装置，尤指一种自动音源评分方法及装置，其适用范围包括应用于语音评分系统、或影音伴唱系统等技术领域中。背景技术：于一般音源评分系统中，例如影音歌唱评分系统，主要是将撷取到的音源与预存的音源相比较，以计算出前者的音源分数。已知通常是使用音高(pitch)以根据音源的频率变化来比对计算出音源分数。然而，以音高为基础来计算音源分数的运算过程较复杂、且计算量较高；此外，由于音高是由音源的波形所估算出来，因此虽然母音可稳定呈现，但子音部分却极易受到摩擦音、或气音的影响而呈现不稳定波形，致使音高被

2、误判，并非十分理想。已知亦提出利用语音能量(energy)来计算音源分数的方法，以由判断音源能量的起伏，来比对其与预设音源(或基准音源)能量的能量变化趋势，进而计算出音源分数。例如已知是利用滤波器组(filter bank)来过滤音源，并分别输出代表不同频率的能量，再将每一个频带的频率一一与预设能量进行比较而计算出分数；又如美国专利公告第6326536号专利文献是提出将音源先利用低通滤波器(low pass filter，LPS)将高频能量滤除、留下低频能量，再使用等级侦测器(level detector)判断各频带的低频能量是否超过一预设等级，若超过则将此频带定义为“1”、否则将此频带定义为

3、“0”，因而形成一串脉冲序列(impulsesequence)，据以与预设音源的脉冲序列比对。由于每人音色不同，且一般人所发出的音源无法与机器比拟，以歌唱评分为例，即使演唱者的唱腔、音色、节拍皆与原唱神似，却仍旧无法百分的百符合预设音源的能量波形。然而，已知的音源评分装置皆不具备容忍时间差的设计，亦即演唱者的音源频带仅能与固定对应的频带相比来计算出分数，倘若演唱者唱得和原唱极为相似，但确有些微时间差，则最后计算出的分数将大打折扣，此评分方法过于严格且不甚合理。由此可知，已知音源评分装置并不具备时间差容忍特性，而有予以改进的必要。发明内容本发明的主要目的是在提供一种自动音源评分方法及装置，是允许

4、待测音源频带与基准音源频带的前后邻近时间轴上的频带相比较，以便将待测音源与基准音源问的时间差并入考量的目的，以提高音源评分的合理性。本发明的另一目的是在提供一种自动音源评分方法及装置，是使用以对数能量(log energy)为基础所衍生的参数作为特征参数，以便能降低计算量，并具有高可靠度。依据本发明的一特色，是提出一种自动音源评分方法，用以评量一段待测音源所具有的音源分数，该待测音源是根据一预设音框长度划分为K个待测频带，其特征在于，该方法包括下列步骤(A)自该待测音源中撷取出第n个待测频带Yn；(B)将该待测频带Yn逐一与一段基准音源中的第n-a个至第n+b个基准频带X比对，并计算出该待测频

5、带Yn对应于该等基准频带所具有的音源分数；以及(C)将具有最佳音源分数的基准频带X所具有的音源分数评定为该待测频带Yn的音源分数。其中，于步骤(B)前，尚包括一步骤(D)，用以找出第n-1个待测频带Yn-1所对应具有最佳音源分数的基准频带Xm。其中，若n-m大于等于a，则步骤(B)是将该待测频带Yn逐一与一段基准音源中的第n-a个至第n+b个基准频带X比对，并计算出该待测频带Yn对应于该等基准频带所具有的音源分数。其中，若n-m小于a，则步骤(B)是将该待测频带Yn逐一与一段基准音源中的第m个至第n+b个基准频带X比对，并计算出该待测频带Yn对应于该等基准频带所具有的音源分数。其中，于步骤(C

6、)后，尚包括一步骤(E)，是用以判断是否具有后续待测频带，若是则继续执行步骤(A)，直到全部待测频带皆已计算出音源分数为止。其中，该待测音源是为脉冲码调变信号。其是由比对该待测频带Yn与该等基准频带X的能量值所形成的特征参数以计算出该音源分数。其中，该能量值所形成的特征参数是选自下列至少其中之一一对数能量值、一一阶微分对数能量值、及一二阶微分对数能量值。其中，该待测频带Yn的音源分数为音源分数ABS(x0-y0)+ABS(X1-y1)+ABS(x2-y2)当中，ABS为绝对值函数，x0及y0为对数能量值，x1及y1为一阶微分对数能量值，x2及y2为二阶微分对数能量值，、及是分别为一权重值。其是

7、即时自音源撷取装置中持续撷取出该待测音源及其待测频带，以便即时对该等待测频带评分。其中，若n-a小于或等于零，则自第1个基准频带X1起比对。其中，若n+b大于K，则最多比对至第K个基准频带XK。依据本发明的另一特色，所提出的一种自动音源评分装置，用以评量一段待测音源所具有的音源分数，该待测音源是根据一预设音框长度划分为K个待测频带，其特征在于，该装置包括一接收单元，是接收一段待测音源；一模拟数字转换单元，用以将该待测音源由模拟信号转换为数字信号；一存储器，是储存至少一段基准音源，并用以暂存所接收的该待测音源；一特征参数抽取单元，是撷取出该待测音源的待测频带的特征参数、及该基准音源的基准频带的特

8、征参数；一评分单元，是自该待测音源中撷取出第n个待测频带Yn，并将该待测频带Yn逐一与一段基准音源中的第n-a个至第n+b个基准频带X比对，以计算出该待测频带Yn对应于该等基准频带所具有的音源分数；以及一显示单元，用以显示该音源分数。其中，该评分装置是用以找出第n-1个待测频带Yn-1所对应具有最佳音源分数的基准频带Xm。其中，该评分装置若比对出n-m大于等于a，则是将该待测频带Yn逐一与一段基准音源中的第n-a个至第n+b个基准频带X比对，并计算出该待测频带Yn对应于该等基准频带所具有的音源分数。其中，该评分装置若n-m小于a，则是将该待测频带Yn逐一与一段基准音源中的第m个至第n+b个基准

9、频带X比对，并计算出该待测频带Yn对应于该等基准频带所具有的音源分数。其中，该显示单元是于每间隔一预设期间后、显示该预设期间内的平均音源分数，并于该待测音源结束后，显示一累计平均音源分数。其中，该显示单元是于每间隔一预设期间后、显示一累计平均音源分数。其中，该模拟数字转换单元是将该待测音源由模拟信号转换为脉冲码调变数字信号。其中，若n-a小于或等于零，则自第1个基准频带X1起比对。其中，若n+b大于K，则最多比对至第K个基准频带XK。为能让审查员能更了解本发明的技术内容，特举二较佳具体实施例说明如下，其中图1是本发明一较佳实施例的功能方块图。图2是本发明一较佳实施例的流程图。图3是本发明另一较

10、佳实施例的流程图。具体实施例方式请先参阅图1本实施例自动音源评分装置1的功能方块图，其是为一歌唱评分装置，以对使用者所演唱的曲目评分，例如卡拉OK(karaoke)评分装置，当然亦可以是语音评分装置、或其他等效的音源评分装置。如图1所示，评分装置1包括有一接收单元11、一模拟数字转换单元12(analog to digital converter)、一存储器13、一特征参数抽取单元14、一评分单元15、以及一显示单元16。接收单元11较佳为一麦克风，用以接收使用者(或演唱者)演唱歌曲所传来的待测音源；存储器13是储存至少一段基准音源，例如为伴唱带或碟片中主唱的音调、或歌曲原唱者的旋律等，且本实

11、施例的存储器13并具有暂存功能；显示单元16主要用以显示演唱者演唱的曲目所具有的音源分数，例如为一计分板、或一LED显示屏。请一并参阅图2的流程图，当演唱者于歌唱评分装置中选定一曲目(即基准音源)后(步骤S201)，歌唱评分装置随即播放前奏，并透过接收单元11接收由演唱者传来的待测音源(步骤S202)。通常于每一首歌曲开始前，会有一小段留白，因此歌唱评分装置将等接收单元11接收到声音后、才会开始评分。由于接收单元11所接收到的待测音源为模拟信号(analog signal)，故需经由模拟数字转换单元12将模拟信号转换为数字信号(digital signal)(步骤S203)，其较佳是为脉冲码调

12、变(pulse code modulation，PCM)数字信号。本实施例定义0.09秒为预设音框(frame)长度，亦即每间隔0.09秒计算一次待测音源的音源分数，当然预设音框长度并不以本实施例为限，其亦可视需求而定义不同的音框长度。据此，特征参数抽取单元14是以0.09秒的音框长度逐一划分出待测音源中的各个待测频带、并抽取出每一待测频带的特征参数。若待测音源为一段固定长度的音源，则将可划分出K个待测频带；而若待测音源为一持续产生的音源，则本实施例的特征参数抽取单元14将每间隔0.09秒、划分出一待测频带，总计将划分出K个待测频带。需注意的是，本实施例的特征参数抽取单元14是使用以对数能量(

13、log energy)为基础所衍生的参数作为特征参数，包括此待测频带的对数能量值、一阶微分对数能量值(delta log energy)、及二阶微分对数能量值(delta delta log energy)，以形成一语音能量样型(energy contour)。当然，特征参数抽取单元14亦将根据上述基础以抽取出对应基准频带的特征参数，并形成另一语音能量样型以利进行比对。之后，评分单元15即可逐一对各音框所划分出的K个待测频带评分。评分单元15将先自待测音源中撷取出第n个待测频带Yn(步骤S204)，由于本实施例的歌唱评分装置是将待测音源与基准音源间所具有的些微时间差并入考量，因此评分单元15将

14、逐一比对待测频带Yn与基准音源中第(n-a)个至第(n+b)个基准频带(即Xn-a-Xn-b)的特征参数，以分别计算出待测频带Yn相对于上述基准频带所具有的音源分数(步骤S205)音源分数ABS(x0-y0)+ABS(x1-y1)+ABS(x2-y2)其中，ABS为绝对值函数，x0及y0为对数能量值，x1及y1为一阶微分对数能量值(斜率)，x2及y2为二阶微分对数能量值(斜率变化)，且每一种特征参数是对应有不同的权重值、及，以根据加权的绝对值差累计来计算出音源分数。根据上述公式所计算出的音源分数越低表示越相近，当然亦可依照一般使用习惯而转换为以高分表示演唱者与伴唱声音相近。此外，需注意的是，K

15、为一正整数，且若(n-a)小于或等于零，则将自第1个基准频带X1起比对；若(n+b)大于K，则最多比对至第K个基准频带XK。而具有最佳音源分数的基准频带X及其所具有的音源分数，即被评定为待测频带Yn的音源分数(步骤S206)。之后评分单元15将持续计算后续待测频带的音源分数，直到结束演唱为止(步骤S207)。显示单元16则每间隔或累计一预设期间(例如五秒)后，显示出在该时间区段内所获得的音源分数(步骤S208)，同时累计总分，以在演唱结束时，将累计总分除以累计音框次数以得到平均总分；当然显示单元16亦可设计为每间隔一预设期间后，直接显示出累计平均音源分数。此外，本实施例的歌唱评分装置可即时接收

16、由麦克风传来的演唱旋律以现场计算出演唱歌曲的音源分数，亦可评量一段已录制好的待测音源所具有的音源分数。请参阅图3，其是为本发明另一实施例的流程图，图3中的步骤S301至S308皆与图2的步骤S201至步骤S208相同，惟前述实施例是将待测频带Yn对应的最佳基准频带X的搜寻范围定义为第(n-a)个至第(n+b)个基准频带之间，而本实施例则将待测频带Yn对应的最佳基准频带X的搜寻范围定义为介于前一待测频带Yn-1对应的最佳基准频带Xm至第(n+b)个基准频带之间。如图3所示，本实施例于步骤S309中找出前一待测频带Yn-1对应的最佳基准频带Xm，并于步骤S310比对(n-m)是否大于等于a，因为演唱者照常理是根据伴唱带、原唱者、或歌曲本身的旋律来循序演唱歌曲，而不会回头重唱已演奏过的旋律，因此若于前一待测频带Yn-1(例如前一个歌词)中已比对出一最佳基准频带Xm(符合前

展开阅读全文

自动音源评分方法及装置的制作方法

最新文档