类别生成程序、类别生成装置以及类别生成方法

上传人:ting****789 文档编号:310045868 上传时间:2022-06-14 格式:DOCX 页数:6 大小:24.03KB
返回 下载 相关 举报
类别生成程序、类别生成装置以及类别生成方法_第1页
第1页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《类别生成程序、类别生成装置以及类别生成方法》由会员分享,可在线阅读,更多相关《类别生成程序、类别生成装置以及类别生成方法(6页珍藏版)》请在金锄头文库上搜索。

1、类别生成程序、类别生成装置以及类别生成方法专利名称:类别生成程序、类别生成装置以及类别生成方法技术领域:本发明涉及类别生成程序、类别生成装置以及类别生成方法。背景技术:作为将乐曲在列表等中进行分类的手法,以往所利用的分类手法使用了对乐曲自身付加的乐曲标题、作曲人、演唱艺人等文字信息。例如已公开了这样的手法将包含多个乐曲的模拟声音转换为数字声音,对每段乐曲确定曲首和曲尾。接下来,对与确定了曲首和曲尾的乐曲相关的文字信息(元信息)进行文字识别。然后,将确定了曲首和曲尾的乐曲与文字识别结果关联起来,由此对乐曲进行分类。此外还公开了这样的手法从乐曲的元信息中提取标题、演唱艺人名、类型、评论文字、速度、

2、节拍、节奏等各个项目。然后,将提取出的各项目和提取源的乐曲关联起来,由此将乐曲分为多个类别。在先技术文献专利文献专利文献I :日本特表2006 - 515099号公报专利文献2 日本特开2007 - 26425号公报发明内容发明要解决的问题但是,在以往的技术中,由于使用对乐曲付加的文字信息来对乐曲分类,因而在乐曲所付加的文字信息的信息量较少的情况下,存在无法准确地对乐曲进行分类的课题。此外,在不利用对乐曲附加的信息而利用速度和/或曲调等音乐特征来分类的情况下,变成了专业性分类,而不是一般用户能够利用的通用性分类。此外,也考虑过对乐曲附加文字信息来分类的手法,但是对每个乐曲生成并附加文字信息的作

3、业非常麻烦,因而并不现实。本申请所公开的技术是鉴于上述问题而提出的,目的是提供一种类别生成程序、类别生成装置以及类别生成方法,即使在对乐曲附加的文字信息较少的情况下,也能够对乐曲准确地分类。用于解决课题的手段在本申请所公开的类别生成程序、类别生成装置以及类别生成方法的一个方式中,使计算机上执行乐曲接收步骤,其接收乐曲;视频分解步骤,其提取通过所述乐曲接收步骤接收到的乐曲中所具有的视频信息,并将提取出的视频信息按照每个特征进行分解;类别生成步骤,其对通过所述视频分解步骤分解的各个视频信息,生成表示该视频信息的特征的类别。发明效果根据本申请所公开的类别生成程序、类别生成装置以及类别生成方法的一个方

4、式,即使在乐曲所附加的文字信息较少的情况下,也能获得对乐曲准确分类的效果。图I是示出实施例I涉及的类别生成装置的结构的框图。图2是示出实施例2涉及的类别生成装置的结构的框图。图3是示出场景DB (数据库)中存储的信息的示例的图。图4是示出单词DB中存储的信息的示例的图。图5是示出计数用DB中存储的信息的示例的图。图6是示出乐曲信息DB中存储的信息的示例的图。图7是示出曲目列表画面的示例的图。图8是示出曲目列表的画面细节的示例的图。图9是示出曲目列表的菜单画面的示例的图。图10是示出各类别的曲目列表画面的示例的图。图11是示出实施例2涉及的类别生成装置的处理流程的流程图。图12是示出单词解析处理

5、的流程的流程图。图13是示出视频解析处理的流程的流程图。图14是示出执行类别生成程序的计算机系统的示例的图。具体实施例方式下面,基于附图,对本申请所公开的类别生成程序、类别生成装置以及类别生成方法的实施例进行详细说明。另外,本发明并不限定于本实施例。实施例I图I是示出实施例I涉及的类别生成装置的结构的框图。该类别生成装置I可应用于计算机等信息处理装置,也可应用于录制电视节目的录像机或便携播放机等视频处理设备或便携型音乐播放机等各种装置。如图I所示,类别生成装置I具有乐曲接收部la、视频分解部Ib和类别生成部lc。乐曲接收部Ia接收乐曲。另外,乐曲接收部Ia可以经由网络或播放线路等来进行接收,也

6、可从存储介质中读取录制的信息。视频分解部Ib提取由乐曲接收部Ia接收到的乐曲所具有的视频信息,并将提取出的视频信息按照每个特征进行分解。然后,类别生成部Ic对由视频分解部Ib分解的各像信息,生成表示该视频信息的特征的类别。其结果是,即使在对乐曲附加的文字信息较少的情况下,也能对乐曲准确地进行分类。实施例2另外,本申请的所公开的类别生成装置也可具有图I所示的控制部以外的各种控制部。另外,在实施例2中说明了实施例I所说明的类别生成装置以外的具有控制部等的类别生成装置的一个示例。类别生成装置的结构首先,使用图2对实施例2涉及的类别生成装置的结构进行说明。图2是示出实施例2涉及的类别生成装置的结构的框

7、图。如图2所示,类别生成装置10具有通信控制I/F部11、输入部12、显示部13、存储部14和控制部20。通信控制I/F部11是与其他装置连接的接口,具有例如调谐器或机顶盒等,接收播放的电视节目并输出至后述的乐曲检测部21。此外,通信控制I/F部11经由互联网等网络接收电视节目等并输出至乐曲检测部21。输入部12是键盘和鼠标等,接收来自用户的例如类别处理开始或结束等各种操作指示,并将接收到的信息输出至控制部20等。此外,输入部12也能够接收CD或DVD等存储介质。输入部12从接收的存储介质中读取信息并输出至乐曲检测部21。下述的显示部13还与鼠标联动从而实现定点设备功能。显示部13是输出各种信

8、息的输出单元,例如是显示下述曲目列表显示部27输出的乐曲信息等的监视器或扬声器。存储部14是保存控制部20的各种处理所需的数据以及程序的半导体存储元件或者是硬盘等存储装置。该存储部14具有场景DB14a、单词DB 14b、计数用DB 1 4c和乐曲信息 DB 14d。场景DB 14a相关联地存储了表示视频特征的场景和被认为是该场景所表示的类另O。例如,如图3所示那样,场景DB 14a以编号、场景特征、类别I、类别2、类别3的方式存储着I、雪多、雪、冬天、白色或2、有彩灯、夜间、圣诞节、一等。此处所存储的编号是区分场景DB 14a中存储的记录的识别符。场景特征是表示分解视频时的场景特征的信息,类

9、别I、类别2、类别3表示场景的类别。例如,I、雪多、雪、冬天、白色表示雪多的场景具有雪、冬天、白色的类别。此外,2、有彩灯、夜间、圣诞节、-J表示存在彩灯的场景具有夜间、圣诞节的类别。另外,图3是示出场景DB中存储的信息的示例的图。单词DB 14b相关联地存储了单词和能够联想到是该单词所表示的类别。例如,如图4所示那样,单词DB 14b以编号、单词、类另Ij I、类别2、类别3的方式存储了I、雪、雪、冬天、白色或2、圣诞老人、圣诞节、冬天、一等。在此处,所存储的编号是区分单词DB 14b中存储的记录的识别符。单词是已得到的单词,类别I、类别2、类别3是表示单词的类别。例如,I、雪、雪、冬天、白

10、色表示单词雪具有雪、冬天、白色的类别。此外,2、圣诞老人、圣诞节、冬天、一表示单词圣诞老人具有圣诞节、冬天的类别。另外,图4是示出单词DB中存储的信息的示例的图。计数用DB 14c临时保存为了对提取出的乐曲进行类别的加权而由控制部20生成的各种信息。例如,图5所示那样,计数用DB 14c以编号、类别、出场次数、出场时间(分钟)、出现率的方式存储了I、冬天、12、10、80%或2、圣诞节、11、0、40%等。在此处,存储的编号是区分计数用DB 14c中存储的记录的识别符。类别是由单词解析部24或视频解析部22分类的类别。出场次数是由单词解析部24计数的类别的总出场次数,出场时间是由视频解析部22

11、计数的类别的总出场时间。出现率是由出现率计算部26计算出的类别的出现率。作为一个示例,I、冬天、12、10、80%表示类别=冬天在乐曲中作为单词出场了12次,作为视频出场了 10分钟,其出现率是80%。此外,2、圣诞节、11、0、40%表示类别=圣诞节在乐曲中作为单词出场了 11次,作为视频未出场,其出现率是40%。另外,图5是示出计数用DB中存储的信息的示例的图。乐曲信息DB 14d存储由乐曲检测部21检测出的乐曲的类别分类结果。例如,如图6所示那样,乐曲信息DB 14d存储了编号、文件名、乐曲开始位置、乐曲结束位置、节目标题、节目播放日期时间、乐曲标题、乐曲演唱者名、乐曲作词家名、乐曲作曲

12、家名、乐曲歌词、类别。作为一个示例,对I、A、0:11:15、0:16:30、AAA,2009.01. 02、圣诞节之歌、aaa、aaa、aaa、ABE、冬天80% /圣诞节40%进行说明。在该情况下,在表示在“节目播放日期时间=2009. 01. 02”时播放的“节目标题=AAA”的节目的文件名=A中,在该节目的0:11:15 0:16:30之间演奏了乐曲。此外,该乐曲的标题是“圣诞节之歌”,乐曲演唱者名、乐曲作词家名以及乐曲的作曲家是aaa。此外,关于该“圣诞节之歌”,生成了 歌词=ABCDE,类别为冬天(80%)和圣诞节(40 % )。作为一个示例,对2、A,0:32:48,0:35:1

13、1,AAA,2009. 01. 02、生日歌、bbb、abc、 aaa、FGHIJ、生日25%进行说明。在该情况下,在表示在“节目播放日期时间=2009. 01. 02”时播放的“节目标题=AAA”的节目的文件名=A中,在该节目的0:32:48 0:35:11之间演奏了乐曲。并且,该乐曲的标题是“生日歌”,乐曲的演唱者名是bbb,乐曲的作词家姓名是abc,乐曲的作曲家是aaa。此外,该“生日歌”生成了 歌词=FGHIJ,类别生日(25%)。另外,图6是示出乐曲信息DB中存储的信息的示例的图。控制部20是例如CPU (Central Processing Unit)等的电子电路,该CPU具有用于

14、保存OS (Operating System)等控制程序、规定各种处理步骤等的程序以及所需数据的内部存储器。该控制部20具有乐曲检测部21、视频解析部22、文字信息提取部23、单词解析部24、节目信息提取部25、出现率计算部26和曲目列表显示部27。乐曲检测部21从由通信控制I/F部11或输入部12接收的节目等视频数据中检测乐曲部分。例如,乐曲检测部21从视频数据中检测乐曲的开始位置和乐曲的结束位置,并将其与表示该视频数据的文件名相关联地保存在乐曲信息DB 14d中。此外,乐曲检测部21将接收到的视频数据或从视频数据中提取出的乐曲部分分别输出至视频解析部22、文字信息提取部23、节目信息提取部

15、25和出现率计算部26。视频解析部22提取并解析由乐曲检测部21提取出的乐曲部分的视频部分,并根据视频特征生成类别(元信息)。然后,视频解析部22在类别的生成结束时,将结束通知输出至出现率计算部26。例如,假设视频解析部22解析文件名为A的节目的乐曲部分X的视频,得到了雪多的场景。在该情况下,视频解析部22参照场景DB 14a,取得作为雪多场景的类别的雪、冬天、白色。接下来,视频解析部22计算乐曲部分X中的雪多场景的出场时间(例如10分钟)。然后,视频解析部22将类别雪、冬天、白色的各自的出场时间设为10分钟,并将它们保存于计数用DB 14c。此外,在视频解析部22解析乐曲部分X的视频而未能取

16、得有彩灯场景的情况下,将与有彩灯场景对应的类别夜间、圣诞节的各自的出场时间设为O分钟并保存于计数用DB 14c。该视频解析部22对从乐曲部分得到的全部场景执行上述处理,并计量各类别在全部乐曲中的出场总时间。也就是说,视频解析部22在上述示例之外,在从乐曲部分得到的其他场景的类别是雪的情况下,计量该其他场景的出场时间(例如5分钟)。然后,视频解析部22对上述示例所取得的雪、10分钟加上新计量的5分钟,并将所得到的雪、15分钟保存于计数用DB 14c。文字信息提取部23提取并解析由乐曲检测部21提取出的乐曲部分的文字部分,从而取得乐曲信息。然后,文字信息提取部23将取得的乐曲信息与乐曲检测部21在乐曲信息DB 14d中保存的文件名、乐曲开始位置和乐曲结束位置相关联进行保存。此外,文字信息提取部23将从乐曲部分提取出的文字部分输出至单词解析部24

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号