软件工程毕业设计(论文)-图像检索系统的设计与实现

上传人:aa****6 文档编号:30011619 上传时间:2018-01-26 格式:DOC 页数:49 大小:1.26MB
返回 下载 相关 举报
软件工程毕业设计(论文)-图像检索系统的设计与实现_第1页
第1页 / 共49页
软件工程毕业设计(论文)-图像检索系统的设计与实现_第2页
第2页 / 共49页
软件工程毕业设计(论文)-图像检索系统的设计与实现_第3页
第3页 / 共49页
软件工程毕业设计(论文)-图像检索系统的设计与实现_第4页
第4页 / 共49页
软件工程毕业设计(论文)-图像检索系统的设计与实现_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《软件工程毕业设计(论文)-图像检索系统的设计与实现》由会员分享,可在线阅读,更多相关《软件工程毕业设计(论文)-图像检索系统的设计与实现(49页珍藏版)》请在金锄头文库上搜索。

1、毕业设计(论文)说明书学 院 专 业 年 级 姓 名 指导教师 年 月 日毕业设计(论文)任务书题目:图像检索系统的设计与实现学生姓名 王超 学院名称 软件学院 专 业 软件工程 学 号 指导教师 职 称 讲师 1、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目的等。 )随着互联网的飞速发展,网络上的图片信息呈爆炸式增长,这使得人们在网上找到所需的图片越来越困难,图片检索技术成为当今非常热门的研究话题。图像检索一直是信息检索领域的一个主流问题,涉及到图像处理、图像分割、模式识别及机器学习等多个方面。检索的智能化和自动化是图像检索的目标。目前主流的图像检索方法大致可以分为两大类,

2、即基于文本的图像检索(TBIR)和基于内容的图像检索(CBIR)。在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;最后一方面是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。而搜集图片和建立索引又是实现图像检索技术的非常重要的一个环节。网络爬虫程序就是用来搜集网页和图片的程序。本文的研究重点在于使用网络爬虫框架 Heritrix 进行扩展,从网络上下载所需网页及

3、图片并利用 HTMLParser 进行网页分析和图片相关信息提取。完成上述工作后,再将图片的目录位置和提取的信息存入数据库。并建立一个图片检索系统的 Web 工程,实现检索功能。开发语言为 Java, 开发工具为 MyEclipse和 MySQL 及 Tomcat.2、参考文献1 Ritendra Datta, Dhiraj Joshi, Jia Li et al. Image Retrieval: Ideas, Influences, and Trends of the New AgeJ.ACM Comput. Surv. 40, 2, Article 5 .April 2008.2 李晓明

4、,闫宏飞,王继民. 搜索引擎-原理,技术与系统M.北京:科学出版社,2004.3 马自萍.形状和颜色特征的混合图像检索D.银川:北方民族大学,2010.7.4 陈剑雄,张蓓简析图像检索中的CBIR技术J.情报探索(第7期),2010.7.5 Rafael C.Gonzalez and Richard E.WoodsDigital Image Processing Second Edition MPrentice Hall, 2003-36 沈兰荪,张箐,李晓光。图像检索与压缩域处理技术的研究M.北京:人名邮电出版社,2008.12.7 周明全,耿国华,韦娜.基于内容图像检索技术M.北京:清华大

5、学出版社,2007.7.8 李向阳, 庄越挺, 潘云鹤. 基于内容的图像检索技术与系统J. 计算机研究与发展 2001年第3期. 9 安志勇.基于内容的图像检索关键技术的研究D.西安:西安电子科技大学,2008.10李伟,黄颖。基于HTMLParser的网页信息提取J .兵工自动化(第7期),2007,7.3、设计(研究)内容和要求(包括设计或研究内容、主要指标与技术参数,并根据课题性质对学生提出具体要求。 )1. 系统学习 Java 编程语言,熟练掌握 Java 语言的基本思想和相关的编程技术。2. 学习并掌握机器学习、数据库常用技术,JSP,图像处理等相关技术。3. 学习并掌握项目开发用到

6、的相关工具及软件的使用。4. 了解图像检索的原理,发展,意义及用途,及图像检索系统的设计思路。5. 了解网络爬虫的原理及工作流程,充分阅读 Heritrix 的开放源代码,会利用 Heritrix 从网上爬图片存入数据库。6. 掌握正则表达式及 HTMLParser 等网页分析方法,了解网页信息提取策略、7. 完成图像检索系统的设计和代码开发8. 对该系统进行充分的测试,并完善开发9. 总结开发过程中所遇到的问题和心得体会指导教师(签字)年 月 日审题小组组长(签字)年 月 日天津大学本科生毕业设计(论文)开题报告课题名称 图像检索系统的设计与实现学院名称 软件学院 专业名称 软件工程学生姓名

7、 指导教师1、课题的来源及意义随着互联网的飞速发展,图像信息应用越来越广泛,人们对图形、图像等多媒体数据的需求也越来越强烈。网络上的图片信息呈爆炸式增长,这使得人们在网上找到所需的图片越来越困难,图片检索技术成为当今非常热门的研究话题。2、国内外发展状况从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称 TBIR) ,利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检

8、索(Content-based Image Retrieval,简称 CBIR)技术。基于内容的图像检索根据图像特征、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。因为图像的规模一般要大于纯粹的文本信息,因此,基于内容的图像检索在检索的速度和效率上要求更高。目前已有不少应用于实践环境的基于内容图像检索系统,如由 IBM 公司开 发的最早商业化 QBIC 系统,以及由哥伦比亚大学研发的 WebSeek 系统、麻省理工学院研发的 Photobook 系统等。基于文本和基于内容是图像检索发展的两个分支,不过从目前图像检索研究的趋势而言,尤其结合网

9、络环境下图像的特征嵌入在具有文本内容的Web 文档中,出现了三个不同的研究着眼点。立足于文本,对图像进行检索。试图将传统的文本检索技术移植于对多媒体信息的检索上,因为基于文本的检索技术发展已经成熟。如 Page-Rank 方法、概率方法、位置方法、摘要方法、分类或聚类方法、词性标注法等,不仅技术发展较为成熟,同时分析 和实现的难度略小。但是因为受控词汇本身的局限,易歧义,更新慢,所以不太容易应对网络上日新月异的各类图像。立足于图像内容,对图像进行分析和检索。相比而言,尽管图像检索已经出现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法,但是要突破对低层次特征的分析,实现更高语义上的检索,实

10、现难度大,进展慢。不过,基于内容的图像检索建立在多媒体信息的内容语义上,能够更为客观地反映媒体本质的特征。结合文本和内容,进行融合性研究。发挥各自的优势促进图像的高效、简单检索方式的实现,尤其是网络环境下,结合图像所在 Web 文档的特征分析,推断图像的特征,同时结合对图像的内容分析,共同标引达到对图像的分析和检索。可以说,三个方向都是相互影响和促进的,任何一个方向的进展都会促进图像检索技术向前更进一步。下一代搜索技术:20072009 年:具有联想技术和分析功能的搜索服务逐渐兴起。在这一时期,语义搜索还没有广泛普及, 带有分析功能的搜索服务开始崭露头角,尤其是商业智能厂商提供的面向企业的信息

11、搜索解决方案引起人们的广泛关注。通过对博客及 SNS 等媒体公布的有关公司产品或宣传活动的评测进行即时分析,可以为企业的市场运营提供更多有益的参考。20102012 年:语义搜索和感性搜索技术将逐渐兴起。将语义搜索用于特定领域或对象时,可以达到高度适合率和再现率,这一结论已 经得到实际验证。由于有生物学验证这一技术作基础,对于感性搜索来说,提高图像、语音、动画数据的特征提取准确度以及加快检索速度不会花很长时间。2013 年以后:阶梯式搜索方法将投入使用。帮助用户追加搜索条件、询问搜索内容的阶梯型检索将被搜索服务商广泛采用。技术趋势:在互联网时代,包括文件、图像、语音、动画、视频、虚拟世界等在内

12、的数据呈指数级增长,搜索技术显得越来越重要。以往,搜索服务都是依据输入的关键字,列出符合关键字的信息。未来,全新的搜索服务模式将出现。3、研究目标,内容研究目标:1. 了解图像检索,网络爬虫等相关技术及发展潮流。2. 综合运用机器学习,JSP,数据库,图像处理,网络爬虫等相关技术完成一个BS架构的的图像检索系统的实现。研究的内容主要有:1. 利用网络爬虫 Heritrix 进行网页图片爬取,2. 利用正则表达式和 HTMLParser 进行网页分析和信息提取3. 运用 JSP,数据库,strust2,Hibernate 等技术实现图像检索系统。4、研究方法,手段1. 基础知识和开发工具的学习:

13、掌握 Java,JSP,数据库,图像处理等相关知识。掌握 MyEclipse 和 MySQL 的使用.2. 理解开源爬虫 Heritrix 的架构和运行机制,学会扩展和定制自己的Heritrix.3. 掌握 HTMLParser 和正则表达式等网页信息提取方法4. 运用开发工具完成界面设计和系统的架构设计,并实现具体的框架结构代码。5. 对系统进行测试并改进完善。5、实验方案的可行性分析和已具备的实验条件随着图像检索技术的发展,目前已有不少应用于实践环境的图像检索系统。在实践上具有参考性。Heritrix 网络爬虫框架在经过多年的丰富更新后更加稳定和有效。网页分析和信息提取技术也是热门的研究话

14、题,为实验原理提供基础为算法的编写提供可行性证明。掌握相关技术知识后运用 MyEclipse 和 MySQL 工具即可进行开发。开发平台稳定且功能强大,工具的开发与设计均是可行的。6、进度安排2011 年 1 月 20 日-2011 年 2 月 10 日 阅读图像检索相关资料,初步了解图像检索的原理意义和用途;2011 年 2 月 11 日-2011 年 3 月 5 日 完成开题报告,并深入学习实现一 个图像检索系统的知识;2011 年 3 月 6 日-2011 年 4 月 20 日 完成网页的爬取及信息提取和检索系统的初步开发;2011 年 4 月 21 日-2011 年 5 月 25 日

15、完善该系统并测设改进,完成毕业设计论文初稿;2011 年 5 月 26 日-2011 年 6 月 15 日 跟据导师意见认真修改,校对论文初稿,最后完成论文;2011 年 6 月 16 日-2011 年 6 月 21 日 准备毕业论文答辩;7、参考文献1 Ritendra Datta, Dhiraj Joshi, Jia Li et al. Image Retrieval: Ideas, Influences, and Trends of the New AgeJ.ACM Comput. Surv. 40, 2, Article 5 .April 2008.2 李晓明,闫宏飞,王继民. 搜索引擎-原理,技术与系统M.北京:科学出版社,2004.3 马自萍.形状和颜色特征的混合图像检索D.银川:北方民族大学,2010.7.4 陈剑雄,张蓓简析图像检索中的CBIR技术J.情报探索(第7期),2010.7.5 邱哲,符滔滔,王学松开发自己的搜索引擎Lucene + HeritrixM.北京:人民邮电出版社,2010-016 李刚.轻量级J2EE企业应用实战M.北京:电子工业出版社,2008.11.7 周明全,耿国华,韦娜.基于内容图像检索技术M.北京:清华

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号