天津大学本科生毕业设计(论文)

上传人:第*** 文档编号:61619615 上传时间:2018-12-07 格式:PDF 页数:49 大小:1.16MB
返回 下载 相关 举报
天津大学本科生毕业设计(论文)_第1页
第1页 / 共49页
天津大学本科生毕业设计(论文)_第2页
第2页 / 共49页
天津大学本科生毕业设计(论文)_第3页
第3页 / 共49页
天津大学本科生毕业设计(论文)_第4页
第4页 / 共49页
天津大学本科生毕业设计(论文)_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《天津大学本科生毕业设计(论文)》由会员分享,可在线阅读,更多相关《天津大学本科生毕业设计(论文)(49页珍藏版)》请在金锄头文库上搜索。

1、毕业设计(论文)说明书毕业设计(论文)说明书 学学院院 专专业业 年年级级 姓姓名名 指导教师指导教师 年年月月日日 毕业设计(论文)任务书毕业设计(论文)任务书 题目:图像检索系统的设计与实现 学生姓名学生姓名王超王超 学院名称学院名称软件学院软件学院 专专业业软件工程软件工程 学学号号3007218015 指导教师指导教师于永新于永新 职职称称讲师讲师 一、原始依据(包括设计或论文的工作基础、研究条件、应用环 境、工作目的等。 ) 随着互联网的飞速发展,网络上的图片信息呈爆炸式增长,这使得人们在网上找 到所需的图片越来越困难,图片检索技术成为当今非常热门的研究话题。 图像检索一直是信息检索

2、领域的一个主流问题, 涉及到图像处理、 图像分割、 模式识别及机器学习等多个方面。检索的智能化和自动化是图像检索的目标。 目前主流的图像检索方法大致可以分为两大类,即基于文本的图像检索 (TBIR)和基于内容的图像检索(CBIR)。在检索原理上,无论是基于文本的图像检 索还是基于内容的图像检索, 主要包括三方面: 一方面对用户需求的分析和转化, 形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征, 分析并进行标引,建立图像的索引数据库;最后一方面是根据相似度算法,计算 用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果, 按照相似度降序的方式输出。 而搜集图

3、片和建立索引又是实现图像检索技术的非常重要的一个环节。 网络爬虫 程序就是用来搜集网页和图片的程序。 本文的研究重点在于使用网络爬虫框架 Heritrix 进行扩展,从网络上下载 所需网页及图片并利用 HTMLParser 进行网页分析和图片相关信息提取。完成上 述工作后,再将图片的目录位置和提取的信息存入数据库。并建立一个图片检索 系统的 Web 工程,实现检索功能。开发语言为 Java, 开发工具为 MyEclipse 和 MySQL 及 Tomcat. 二、参考文献 1 Ritendra Datta, Dhiraj Joshi, Jia Li et al. Image Retrieval

4、: Ideas, Influences, and Trends of the NewAgeJ.ACM Comput. Surv. 40, 2,Article 5 .April 2008. 2 李晓明,闫宏飞,王继民. 搜索引擎-原理,技术与系统M.北京:科学出版社,2004. 3 马自萍.形状和颜色特征的混合图像检索D.银川:北方民族大学,2010.7. 4 陈剑雄,张蓓简析图像检索中的CBIR技术J.情报探索(第7期),2010.7. 5 Rafael C.Gonzalez and Richard E.Woods Digital Image Processing Second Edition

5、 MPrentice Hall, 2003-3 6 沈兰荪,张箐,李晓光。图像检索与压缩域处理技术的研究M.北京:人名邮电出版 社,2008.12. 7 周明全,耿国华,韦娜.基于内容图像检索技术M.北京:清华大学出版社,2007.7. 8 李向阳, 庄越挺, 潘云鹤. 基于内容的图像检索技术与系统J. 计算机研究与发展 2001年第3期. 9 安志勇.基于内容的图像检索关键技术的研究D.西安:西安电子科技大学,2008. 10李伟,黄颖。基于HTMLParser的网页信息提取J .兵工自动化(第7期),2007,7. 三、设计(研究)内容和要求(包括设计或研究内容、主要指标 与技术参数,并根

6、据课题性质对学生提出具体要求。 ) 1. 系统学习 Java 编程语言,熟练掌握 Java 语言的基本思想和相关的编程技 术。 2. 学习并掌握机器学习、数据库常用技术,JSP,图像处理等相关技术。 3. 学习并掌握项目开发用到的相关工具及软件的使用。 4. 了解图像检索的原理,发展,意义及用途,及图像检索系统的设计思路。 5. 了解网络爬虫的原理及工作流程,充分阅读 Heritrix 的开放源代码,会利 用 Heritrix 从网上爬图片存入数据库。 6. 掌握正则表达式及 HTMLParser 等网页分析方法,了解网页信息提取策略、 7. 完成图像检索系统的设计和代码开发 8. 对该系统进

7、行充分的测试,并完善开发 9. 总结开发过程中所遇到的问题和心得体会 指导教师(签字) 年月日 审题小组组长(签字) 年月日 天津大学本科生毕业设计(论文)开题报告 课题名称图像检索系统的设计与实现 学院名称软件学院专业名称软件工程 学生姓名王超指导教师于永新 一、课题的来源及意义 随着互联网的飞速发展,图像信息应用越来越广泛,人们对图形、图像等多 媒体数据的需求也越来越强烈。 网络上的图片信息呈爆炸式增长, 这使得人们在 网上找到所需的图片越来越困难,图片检索技术成为当今非常热门的研究话题。 二、国内外发展状况 从20世纪70年代开始, 有关图像检索的研究就已开始, 当时主要是基于文本 的图

8、像检索技术(Text-based Image Retrieval,简称 TBIR) ,利用文本描述的 方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后, 出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像 检索技术, 即基于内容的图像检索(Content-based Image Retrieval, 简称 CBIR) 技术。 基于内容的图像检索根据图像特征、 图像的内容语义以及上下文联系进行查 找, 以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。 因为 图像的规模一般要大于纯粹的文本信息, 因此, 基于内容的图像检索在检索的速 度和效

9、率上要求更高。目前已有不少应用于实践环境的基于内容图像检索系统, 如由 IBM 公司开 发的最早商业化 QBIC 系统,以及由哥伦比亚大学研发的 WebSeek 系统、麻省理工学院研发的 Photobook 系统等。 基于文本和基于内容是图像检索发展的两个分支, 不过从目前图像检索研究 的趋势而言,尤其结合网络环境下图像的特征嵌入在具有文本内容的 Web 文档中,出现了三个不同的研究着眼点。 立足于文本, 对图像进行检索。 试图将传统的文本检索技术移植于对多媒体 信息的检索上,因为基于文本的检索技术发展已经成熟。如 Page-Rank 方法、概 率方法、位置方法、摘要方法、分类或聚类方法、词性

10、标注法等,不仅技术发展 较为成熟,同时分析 和实现的难度略小。但是因为受控词汇本身的局限,易歧 义,更新慢,所以不太容易应对网络上日新月异的各类图像。 立足于图像内容,对图像进行分析和检索。相比而言,尽管图像检索已经出 现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法,但是要突破对低 层次特征的分析,实现更高语义上的检索,实现难度大,进展慢。不过,基于内 容的图像检索建立在多媒体信息的内容语义上, 能够更为客观地反映媒体本质的 特征。 结合文本和内容,进行融合性研究。发挥各自的优势促进图像的高效、简单 检索方式的实现,尤其是网络环境下,结合图像所在 Web 文档的特征分析,推断 图像的特

11、征,同时结合对图像的内容分析,共同标引达到对图像的分析和检索。 可以说, 三个方向都是相互影响和促进的, 任何一个方向的进展都会促进图 像检索技术向前更进一步。 下一代搜索技术: 20072009 年:具有联想技术和分析功能的搜索服务逐渐兴起。在这一时 期,语义搜索还没有广泛普及, 带有分析功能的搜索服务开始崭露头角,尤其 是商业智能厂商提供的面向企业的信息搜索解决方案引起人们的广泛关注。 通过 对博客及 SNS 等媒体公布的有关公司产品或宣传活动的评测进行即时分析, 可以 为企业的市场运营提供更多有益的参考。 20102012 年:语义搜索和感性搜索技术将逐渐兴起。 将语义搜索用于特定 领域

12、或对象时,可以达到高度适合率和再现率,这一结论已 经得到实际验证。 由于有生物学验证这一技术作基础,对于感性搜索来说,提高图像、语音、动画 数据的特征提取准确度以及加快检索速度不会花很长时间。 2013 年以后:阶梯式搜索方法将投入使用。帮助用户追加搜索条件、询问搜 索内容的阶梯型检索将被搜索服务商广泛采用。 技术趋势:在互联网时代,包括文件、图像、语音、动画、视频、虚拟世界等在 内的数据呈指数级增长,搜索技术显得越来越重要。以往,搜索服务都是依据输 入的关键字,列出符合关键字的信息。未来,全新的搜索服务模式将出现。 三、研究目标,内容 研究目标: 1. 了解图像检索,网络爬虫等相关技术及发展

13、潮流。 2. 综合运用机器学习,JSP,数据库,图像处理,网络爬虫等相关技术完成一 个BS架构的的图像检索系统的实现。 研究的内容主要有: 1. 利用网络爬虫 Heritrix 进行网页图片爬取, 2. 利用正则表达式和 HTMLParser 进行网页分析和信息提取 3. 运用 JSP,数据库,strust2,Hibernate 等技术实现图像检索系统。 四、研究方法,手段 1. 基础知识和开发工具的学习:掌握 Java,JSP,数据库,图像处理等相关知 识。掌握 MyEclipse 和 MySQL 的使用. 2. 理解开源爬虫 Heritrix 的架构和运行机制,学会扩展和定制自己的 Her

14、itrix. 3. 掌握 HTMLParser 和正则表达式等网页信息提取方法 4. 运用开发工具完成界面设计和系统的架构设计,并实现具体的框架结构代 码。 5. 对系统进行测试并改进完善。 五、实验方案的可行性分析和已具备的实验条件 随着图像检索技术的发展,目前已有不少应用于实践环境的图像检索系统。 在实践上具有参考性。Heritrix 网络爬虫框架在经过多年的丰富更新后更加稳 定和有效。 网页分析和信息提取技术也是热门的研究话题, 为实验原理提供基础 为算法的编写提供可行性证明。 掌握相关技术知识后运用 MyEclipse 和 MySQL 工具即可进行开发。 开发平台 稳定且功能强大,工具

15、的开发与设计均是可行的。 六、进度安排 2011 年 1 月 20 日-2011 年 2 月 10 日阅读图像检索相关资料,初步了解 图像检索的原理意义和用途; 2011 年 2 月 11 日-2011 年 3 月 5 日完成开题报告,并深入学习实现一 个图像检索系统的知识; 2011 年 3 月 6 日-2011 年 4 月 20 日完成网页的爬取及信息提取和检索 系统的初步开发; 2011 年 4 月 21 日-2011 年 5 月 25 日完善该系统并测设改进,完 成毕业设计论文初稿; 2011 年 5 月 26 日-2011 年 6 月 15 日跟据导师意见认真修改, 校对论文 初稿,

16、最后完成论文; 2011 年 6 月 16 日-2011 年 6 月 21 日准备毕业论文答辩; 七、参考文献 1 Ritendra Datta, Dhiraj Joshi, Jia Li et al. Image Retrieval: Ideas, Influences, and Trends of the NewAgeJ.ACM Comput. Surv. 40, 2,Article 5 .April 2008. 2 李晓明,闫宏飞,王继民. 搜索引擎-原理,技术与系统M.北京:科学出版社,2004. 3 马自萍.形状和颜色特征的混合图像检索D.银川:北方民族大学,2010.7. 4 陈剑雄,张蓓简析图像检索中的CBIR技术J.情报探索(第7期),2010.7. 5 邱哲,符滔滔,王学松开发自己的搜索引擎Lucene + HeritrixM.北京:人民邮 电出版社,2010-01 6 李刚.轻量级J2EE企业应用实战M.北京:电子工

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 事务文书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号