天河区科技项目可行性实施计划书

上传人:l**** 文档编号:145806509 上传时间:2020-09-23 格式:DOC 页数:39 大小:1.37MB
返回 下载 相关 举报
天河区科技项目可行性实施计划书_第1页
第1页 / 共39页
天河区科技项目可行性实施计划书_第2页
第2页 / 共39页
天河区科技项目可行性实施计划书_第3页
第3页 / 共39页
天河区科技项目可行性实施计划书_第4页
第4页 / 共39页
天河区科技项目可行性实施计划书_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《天河区科技项目可行性实施计划书》由会员分享,可在线阅读,更多相关《天河区科技项目可行性实施计划书(39页珍藏版)》请在金锄头文库上搜索。

1、2012年天河区科技计划项目可行性报告项目名称: 智能化视频检索与处理系统主要技术领域: 计算机图形图像处理 计算机视觉及应用 语音处理 模式识别关键字: 语义视频检索 多模式视频信息处理 视频加密 自动场景切割 台标定位 语音DNA 特写镜头慢速播放 水印技术申请单位:XXX目录一. 项目申请的必要性 21. 项目的重要意义22. 项目与天河区重点发展技术领域的符合程度33. 技术的先进性与创新性34. 技术在本领域的关键程度45. 项目所研究技术的行业推动作用4二. 承担单位情况51. 承担单位基本情况52. 研究开发能力53. 财务、经济状况64. 承担单位的科研及生产经营管理状况7三.

2、 项目实施方案71 项目的目标、研究围和主要容72 项目的技术方案83 项目的阶段与进度134 资金筹措及使用13四. 经济及社会效益分析161 市场分析162 经济及社会效益分析19五. 风险分析241 技术人员风险242 资金风险24六. 附表26七. 附件 一项目申请的必要性1. 项目的重要意义随着信息技术和网络技术的发展,引发社会对信息化服务更高的要求和服务需求,随着通讯带宽技术的不断发展,视频技术以其信息容量大、事物表达形象化的特点,越来越受到人们的重视。今后,社会的发展将会以多媒体为中心,通过将图像、语音及文字信息有机整合,产生更直观生动、更容易使用户接受的信息存在形式。在具备了大

3、量的视频多媒体信息之后,多媒体数据库的有效管理,按需进行视频容检索和处理,就成为了急需解决的关键问题。智能化视频检索与处理系统运用在计算机图形图像学计算机视觉语音处理及人工智能方面先进的学术研究成果,通过开发具有自主知识产权的多模式视频信息处理核心技术, 对包含在视频信息中的图像语音及文字等信息进行综合分析判断,提供基于容的智能视频检索手段,并对索引出的视频段按需进行加工处理,从而推动数字化多媒体技术应用到更多领域,使他们效率更高,工作更智能。声像信息以数字形式存储和传播,为人们更灵活使用这些信息提供了可能性。但随之而来的问题是,随着网络上信息爆炸性的增长,获取到我们感兴趣的信息的难度越来越大

4、。传统的基于关键词或文件名的检索方法显然不适用于数据量庞大又不具备天然结构的声像信息,比如“在这段新闻片中找出有主席讲话和有主席出现的镜头片段”,这种形式的检索是传统检索方法难以胜任的工作。基于视频容的智能化检索技术是解决这一难题的有效方法。1993年12月,英国计算机学会在英国Leeds大学举行了多媒体系统和应用(Multimedia System and Application)国际会议。英国Michael DVislon(Rutherford Appleton Laboratory)在会上作了关于建立多智能多媒体系统的报告,明确提出了研究智能多媒体技术问题。近年来,美国,日本等国在该领域

5、投入了大量的人力和物力,取得了一些卓有成效的成果和专利。我国在该领域的起步较早,许多大专院校和研究所以及许多从事媒体方面研究的公司在多媒体研究方面都倾注了大量的心血,取得了丰硕的理论研究成果,但限于经费和体制,自主开发的主流产品较少。本项目所自主研发的智能化视频检索和处理系统正是要解决这一问题。基于容的视频资料数字智能化管理系统是一个当前快速发展的多学科交叉研究领域。通过对视频容的智能分析,能够产生出不断增加的,涉及到社会生活各个领域的应用前景,包括电视媒体应用互联网智能检索音像资料库管理反恐监控系统司法领域展馆多媒体运营系统体育训练和赛事辅助系统远程教学电子商务视频游戏以及有线和无线通信服务

6、等等。同时,视频容智能分析上的技术进步,可以促使很多相关领域例如信号处理计算机视觉模式识别和多媒体数据库管理等方面的技术进步。我们所自主研发的智能化视频检索和处理系统涉及到图像识别处理语音识别处理文字识别处理机器学习以及模式识别等方面的容,其中场景的自动切割台标定位语音DNA处理特写镜头慢速播放及视频加密等核心技术又成为项目容的关键。一些核心技术本身的研发也有着重要意义和广泛的应用前景。语音DNA识别可应用于新闻节目自动标注,基于特定人的语音文档的检索,说话者的验证和自动跟踪,以及语音数据库的自动生成和索引。随着信息时代的发展,用于标志各人身份的代码使用非常广泛,比如各种购物卡、信用卡、长途卡

7、和证券委托服务等。这类卡或服务均具有数字、字符串形式的电子与电子密码。若电子及密码失密,将会造成用户不可估量的经济损失。以提取说话人声音特征为手段的语音DNA识别技术,则可以将密码失密造成的损失降到最低。一方面,语音识别可识别用户说出的数字代码,向用户提供自然便利的接口界面,另一方面,说话人识别将用户本人固有的发音特性运用于身份核查,提供了更安全的保护,即使他人窃取了密码,也会因为其发音的特征不同而被拒绝。目前,语音DNA技术被应用到说话人核对、声控电子密码锁、罪犯确认、医学中患者确认以及军事等领域。随着现代企业自动化和安全化要求的提高,语音DNA识别系统也逐步应用到到工厂中。为了工厂运行的安

8、全,防止无权限人员进入控制系统现场,必须要进行身份确认。同时,夜间无人值守的自动化工厂系统在响应用户进行的远程操作前,也必须要进行身份确认。数字水印技术是上世纪90年代中后期发展起来的新兴学科。随着多媒体技术和网络技术的迅速发展与广泛应用,大量的数据可以方便、高效地进行传输,与此同时,对于防止网上侵权行为、资源所有人的身份确认等问题提出了更高的要求。传统的加密技术已经不足以解决新出现的问题,数字水印技术的产生,在这方面显示出了巨大的潜力,并且在的认定与保护加指纹标题与注释篡改提示及使用控制等方面展现了良好的应用前景。国在这方面的研究相对滞后些,而作为我们智能化视频检索和处理系统的核心组成部分,

9、水印加密技术的研发有着其重要的意义。2. 项目与天河区重点发展技术领域的符合程度智能化视频检索和处理系统以场景自动切割台标定位语音DNA识别特写镜头慢速播放及视频加密等技术为核心,以计算机图形图像学计算机视觉语音处理数据库技术及信息安全技术为主要研究领域,这些都完全符合天河区在计算机图形与图像技术、计算机软件与网络技术方面的重点发展方向,具有重要的发展意义和良好的应用前景。3. 技术的先进性与创新性智能化的视频信息检索与处理是一个全新的研究领域,是对传统多媒体信息管理的全面挑战。我们的系统在原理上和应用上都有很大的创新之处。相对于以文件存贮目录为主要存在形式的传统方式,以视频容语义概念进行检索

10、的工作模式,使容提取更直接,更符合用户要求。传统的多媒体信息管理需要借助人力的辅助,才能完成相对个性化的,以用户需求为概念的视频信息查询,而智能化容检索全部由系统自动完成,而且查询结果与需求直接匹配,简洁高效。基于查询结果按容分类的视频流的特性,智能化检索与处理系统还可以进而进行方便的特殊功能处理,例如场景缩放,特写镜头的慢速播放等等。考虑到搜索结果安全发布的问题,我们的系统还可以对索引视频段进行水印加密,有效防止盗版篡改等行为的发生。而所有这些功能都是传统多媒体管理方式没有实现,技术上也无法实现的。我们智能视频检索与处理系统的核心技术也有其本身的先进创新性。在原理上,我们在国工业界首次提出了

11、综合图象语音和文字识别技术的多模式综合信息处理方式,用于智能化的视频检索标引。在图象放大问题上,通过自主开发的超线性算法,有效的解决了模糊化和纹理方向改变的问题。在慢速回放问题上,通过研发新型的运动补偿插算法,在充分利用图像信号的帧间相关性的同时,还充分利用其帧相关性,将运动估值与图像分割有机地结合起来,既刻画出它们之间的相互依赖性,又采用了恰当的解藕处理,从而改进了图像质量。在语音DNA识别技术方面,我们系统有效解决了对不同语种不同方言的语音识别问题,在水印加密方面,通过采用基于离散余弦变换和小波变换的一组高效的水印嵌入和盲检测方法,在不完全解码的情况下快速实现水印的嵌入和检测,同时实现了鲁

12、棒性好和不可见性的特点。系统的主要创新点如下:l 多种特征参数作为判决依据,可以提高系统判决的可靠性、鲁棒性和分辨能力,克服由于语音信号变异性所导致的话者特征空间移动而带来的判决的不确定性;l 针对语音检索和标引系统的特点,对背景噪声中的有用信息进行分析和利用;l 采用改进的径向基函数(RBF)网络,如椭圆基函数(EBF)网络,对话者特征的描述性更好,识别率高;l 基于支持向量机的人脸模式分类方法在小样本训练的前提下具有较强的非线性分类能力和学习能力。4. 技术在本领域的关键程度在网络和数字化进程不断深入的过程中,多媒体数字资产的拥有者对有效管理和充分利用这些资源提出了全新的要求。只有当多媒体

13、视频信息以容为基础,以事件为中心进行管理和检索,数字化多媒体资产智能化管理的实现才能够成为可能,也才能够进一步推动相关产业和应用领域在此基础上进一步发展,而智能化视频检索与处理系统是实现这一目标的技术关键,在此基础上将可以发展出广阔的应用前景。XXX公司作为专门从事数字视频应用和信息安全的软件开发及技术咨询服务企业,通过多年与探索和实践,深刻认识到了开发此项目的必要性和迫切性。5. 项目所研究技术的行业推动作用通过开发具有自主知识产权的智能化视频检索和处理系统,可以带动多媒体信息管理,电视媒体资产管理等行业技术革新,促进劳动生产率的提高,进一步提高行业本身的竞争力,满足用户数字时代个性化的需求

14、。开发所涉及到的技术创新又可以促使很多相关领域例如信号处理计算机视觉模式识别和多媒体应用等方面的技术进步。二承担单位情况1.承担单位基本情况XXX成立于2000年3月,是由美国XXX公司与市政府共同投资兴办的留学生企业,注册资金1928万元人民币。其中,DISTINCTIVE TECHNOLGY LIMITED 占78%。市科技风险投资公司占22%。专门从事数字视频技术应用和电视台媒体资产管理软件开发。公司拥有一批充满朝气的经营管理者和富有才华的高技术人才,追求“创建一流企业、造就一流人才、开发一流产品、提供一流服务”的企业目标,倡导开拓创新、追求卓越、优质服务、规管理的企业理念。2.研究开发能力毕业于美国、新加坡和中国的 6 位博士和 19 硕士,构成了公司研究开发的核心力量。与大学和华中理工大学等

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号