基于本体和Lucene的网络教育资源检索系统设计与实现

上传人:re****.1 文档编号:431911202 上传时间:2022-10-16 格式:DOC 页数:53 大小:1.81MB
返回 下载 相关 举报
基于本体和Lucene的网络教育资源检索系统设计与实现_第1页
第1页 / 共53页
基于本体和Lucene的网络教育资源检索系统设计与实现_第2页
第2页 / 共53页
基于本体和Lucene的网络教育资源检索系统设计与实现_第3页
第3页 / 共53页
基于本体和Lucene的网络教育资源检索系统设计与实现_第4页
第4页 / 共53页
基于本体和Lucene的网络教育资源检索系统设计与实现_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《基于本体和Lucene的网络教育资源检索系统设计与实现》由会员分享,可在线阅读,更多相关《基于本体和Lucene的网络教育资源检索系统设计与实现(53页珍藏版)》请在金锄头文库上搜索。

1、学科分类号: 520.6070 湖南人文科技学院本科生毕业设计论文题目:基于本体和Lucene的网络教育资源检索系统设计与实现Design and Implementation of Network Education Resources Retrieval System Based on Ontology and Lucene学生姓名:周显光学号07408119系 部:计算机科学技术系专业年级:2007级计算机科学与技术指导教师:郭 广 军职 称:教 授湖南人文科技学院教务处2009年制湖南人文科技学院本科毕业设计诚信声明本人郑重声明:所呈交的本科毕业设计,是本人在指导老师的指导下,独立进行

2、研究工作所取得的成果,成果不存在知识产权争议,除文中已经注明引用的内容外,本设计不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 作者签名: 2011年 月 日版权声明版权所有 2010-2011 周显光,保留所有权利。本文档受著作权法和国际公约的保护,未经授权擅自复制或传播本文档的部分或全部,可能受到严厉的民事和刑事制裁,并在法律许可的范围内受到最大可能的起诉。湖南人文科技学院毕业设计目 录摘要IABSTRACTI第一章 绪 论11.1 引言11.2 研究背景11.3 本文主要工作21.

3、4 本文的组织安排2第二章 开发环境和开发技术42.1系统介绍42.2系统开发环境42.3系统开发技术42.3.1 Eclipse简介42.3.2 Java简介52.3.3 JSF简介52.3.4 JPA简介52.3.5 MySQL简介5第三章 可行性与需求分析63.1可行性分析63.1.1 技术可行性63.1.2 社会可行性63.1.3 经济可行性63.2系统目标63.3功能需求63.4性能需求7第四章 系统概要设计94.1模块设计94.1.1系统功能层次图94.1.2系统UML包图104.1.3 数据库模块104.1.4 Web模块124.1.3 Lucene模块184.1.4 本体模块2

4、04.2系统数据库设计214.2.1 EER图214.2.2 数据表设计214.2.3 创建数据表23第五章 系统实现265.1本体模块265.2 Lucene模块315.2.1 索引更新模块325.2.2 索引搜索模块365.3数据模块385.3.1 实体模块385.3.1 实体操作模块385.4 web模块385.4.1 Servlet模块385.4.2 ManagedBean模块385.4.3 有关网页的Facelets实现41第六章 系统测试436.1系统搜索模块的测试436.2资源模块的测试446.3用户模块的测试45结束语47致 谢48参考文献48湖南人文科技学院毕业设计基于本体和

5、Lucene的网络教育资源检索系统设计与实现摘要:随着Internet/Intranet的迅速发展和广泛普及,越来越多的web2.0网站的出现,Internet上的信息量呈指数级增长,人们需要从浩如烟海的网络中快速、准确地找到自己需要的信息,这是信息时代的必然要求,所以对网站内容的索引和搜索将会变得越来越重要。本设计在对网络教育资源检索系统的需求分析的基础上,以Eclipse 3.6为集成开发环境,MySQL为后台数据库,使用JSF、JPA框架和Lucene、OWL API设计实现了基于本体和Lucene的网络教育资源检索系统。该系统主要实现了用户登录与注册、网络教育资源的管理与搜索。系统测试

6、表明,该系统运行稳定,可访问性、可靠性很好,操作简单方便。 关键词:教育资源检索;本体;JSF;JPA;Lucene;OWLDesign and Implementation of Network Education Resources Retrieval System Based on Ontology and LuceneAbstract: With the rapid development and wide spreading of Internet/Intranet, the appearance of more and more web2.0 web site, the expon

7、entially increasing of the information amount in Internet, People need to find the information they need, This is the inevitable request of information age, so the index and search of web site content will be more and more important.In the design based on the need analysis of the network education r

8、esources retrieval system based on ontology and Lucene, using Eclipse 3.6 as development environment, MySQL as background database, using JSF, JPA framework design and implement the network education resources retrieval system based on ontology and Lucene. The system mainly implements the user login

9、 and register, the management and search of network education resources. System testing showed that the system run stability, has good accessibility and reliability, simple operation.Key words: Education Resource Search; Ontology; JSF; JPA; Lucene; OWLI 湖南人文科技学院毕业设计第一章 绪 论1.1 引言由于Internet的迅猛发展,信息迅速膨

10、胀,人们对信息查询的准确率的要求也越来越高,而全文检索系统因为检索功能强大、效率高而越来越流行。Lucene是一个基于Java的开放源代码的全文检索引擎工具包,能够方便地嵌入到各种应用中实现索引和搜索功能。本系统用此技术来实现对网络教育资源的全文检索,通过对索引的查询可以快速、可靠的得到相关信息,并在查询过程中应用中文分词技术,以使得查询结果更加准确和全面。传统的数据库检索方式大都采用传统的关键词匹配算法进行查询,并不能很准确地返回相关信息,无法理解语义。而用来对特定领域的概念及术语给予明确的形式化描述的本体论不仅为规范化资源描述及用户查询提供了基础,也为更准确地搜索信息提供了保证。本人在此项

11、目中使用Protg建立了知识本体,并使用OWL API 解析本体,实现了一个能使用本体中已有的概念进行的单词补全,并查找特定概念的子概念,实现了推理补全,这两者组成了搜索框的自动完成功能,能在用户搜索时提供相关的关键字智能提示,还可以对搜索词进行语义扩展后搜索。1.2 研究背景Lucene是apache软件基金会jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系

12、统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。在计算机科学与信息科学领域,理论上,本体是指一种“形式化的,对于共享概念体系的明确而又详细的说明”。本体提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系;或者说,本体就是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机系统之中使用;或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达(formal representation)。本体是人们以自己兴趣领域的知识为素材,运用信息科学的本体论原理而编写出来的作品(artifacts)。本体一般可以用来针对该领域的属性

13、进行推理,亦可用于定义该领域(也就是对该领域进行建模)。1.3 本文主要工作本系统从建立之初就注重良好的设计、效率和可移植性,系统先使用MySQL Workbench建立数据库模型,然后将EER模型生成建表的SQL脚本并放在MySQL中运行,以此来创建数据表。本项目使用的集成开发环境是Eclipse 3.6,持久层使用JPA2.0(EclipseLink的实现)框架完成对象-关系映射,Web层使用JSF2.0(使用sun的实现和Primefaces的扩展)框架,Web和Servlet容器是Apache Tomcat 7.0。系统整体架构为B/S模式,遵循MVC模式开发,代码符合JavaEE 6

14、标准,使用JPA完成ORM映射,使用JSF 的Facelets模板技术,将用户界面设计与业务逻辑分离,利用POJO做实现,在Facelets模板中使用JSF的标准标签、Primefaces扩展标签、JSTL标签和EL表达式实现可维护,可重用的视图,具体实现操作利用JSF的ManagedBean的方法作为Action或AcitionListener,在faces-config.xml中定义页面导航规则作为控制器,通过对JPA实体类及其Facade类的操作实现对数据库的操作,使用实体类和POJO作为模型,使用ManagedBean和POJO实现业务逻辑。对基于本体和Lucene的网络教育资源检索系

15、统的功能进行分析,主要是分析对网络教育资源的管理、索引和搜索,以及解析本体中的特定类的子类的功能实现。其次进行概要设计,将系统分为4个模块:数据库模块(实体模块,facade模块),Lucene模块(索引模块,搜索模块),本体模块,Web模块(模型模块、Servlet模块、ManagedBean模块)。再次进行数据库设计,基于本体和Lucene的网络教育资源检索系统拥有多个数据表,为了实现相应的功能模块,需要对数据库进行相应的设计。然后进行详细设计,最后系统测试。开发一个基于本体和Lucene的网络教育资源检索系统必须经过以下阶段:l 可行性研究阶段l 需求分析阶段l 总体设计阶段l 详细设计阶段l 系统实现阶段l 测试阶段1.4 本文的组织安排文章绪论部分对本系

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号