学位论文—基于lucene的桌面全文搜索引擎研究-.doc

上传人:公**** 文档编号:563883895 上传时间:2024-03-01 格式:DOC 页数:37 大小:355.50KB
返回 下载 相关 举报
学位论文—基于lucene的桌面全文搜索引擎研究-.doc_第1页
第1页 / 共37页
学位论文—基于lucene的桌面全文搜索引擎研究-.doc_第2页
第2页 / 共37页
学位论文—基于lucene的桌面全文搜索引擎研究-.doc_第3页
第3页 / 共37页
学位论文—基于lucene的桌面全文搜索引擎研究-.doc_第4页
第4页 / 共37页
学位论文—基于lucene的桌面全文搜索引擎研究-.doc_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《学位论文—基于lucene的桌面全文搜索引擎研究-.doc》由会员分享,可在线阅读,更多相关《学位论文—基于lucene的桌面全文搜索引擎研究-.doc(37页珍藏版)》请在金锄头文库上搜索。

1、*学院毕业设计(论文)开题报告 * 系 * 专业 200* 级 01班课题名称: 基于Lucene的桌面全文搜索引擎研究 学生姓名: * 学号:*指导教师: * 报告日期: 200*年3月 26 日 1 本课题所涉及的问题及应用现状综述本课题来源于科研项目,主要是研究中文搜索中的关键算法和基于luence的搜索引擎,设计一个桌面搜索系统。本课题要求熟悉c/c+/java编程和人工智能。Luence是一个用java写的全文搜索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎及部分文本分析引擎,支持多用户访问,访问索引速度快,可以跨平台使用。L

2、ucene的目的是为软件开发人员提供一个简单易用的工具包,以方便地在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎. Lucene可以对任何的数据做索引和搜索.Lucene不管数据源是什么格式,只要它能被转化为文字的形式,就可以被Lucene所分析利用.也就是说不管是Word,Html,PDF还是其他什么形式的文件只要你可以从中抽取出文字形式的内容就可以被Lucene所用,就可以用Lucene对它们进行索引以及搜索.应用它可以快速的开发一个搜索引擎。本课题就是要研究利用基于java的全文检索工具包Luence开发一个桌面搜索系统。经过多年的发展,Lucene在全文检索领

3、域已经有了很多的成功案例,并积累了良好的声誉.基于Lucene的全文检索产品和应用Lucene的项目在世界各地已经非常之多, 例如,众所周知的Apache软件基金会的网站使用了Lucene作为全文检索的引擎,IBM公司开源软件Eclipse的2.1版本中也采用了Lucene作为帮助子系统的全文索引引擎,相应的IBM公司的商业软件Web Sphere中也采用了Lucene.Lucene正以其开放源代码的特性,优异的索引结构,良好的系统架构获得了越来越多的应用.2本课题需要重点研究的关键问题、解决的思路及实现预期目标的可行性分析本课题需要重点研究的关键问题:1.中文搜索引擎中的关键算法。2. 建立

4、索引和搜索。建立索引和搜索是搜索引擎最重要的也是最基本的两部分.3.如何利用Lucene来建立自己的桌面搜索引擎系统。解决思路:在开始做本课题之前,先要学习中文搜索引擎的算法,学习如何建立索引和搜索,学习并了解Lucene以及如何应用Lucene。并认真学习c/c+/java和人工智能等方面的知识。这些都需要通过阅读和学习大量的书籍和资料来完成。虽然这些东西以前接触的比较少,对这方面知识了解还不是很多,但是我想通过一段时间的学习和老师的指导,这些问题都可以解决。先要对这方面的知识要有一个初步的了解。可行性分析:要做好本课题,首先要了解算法方面的知识,其次要对c/c+/java和人工智能等方面的

5、知识要有充分的掌握来作为基础。这些现在对我来说都有一定的困难,但是我可以通过不断的学习和老师的指导来逐渐的克服这些困难。 3完成本课题的工作方案 要完成本课题首先要认真学习并掌握一定的算法方面的知识,认真学习c/c+/java和人工智能等方面的知识,提高自己的编程能力,还有就是要认真学习和了解Lucene,然后才能应用Lucene来建立搜索引擎,完成本课题。为此制定的具体的工作时间安排如下: 2007.3.20-2007.4.30 熟悉java语言,lucence库以及相关的搜索算法 2007.5.1-2007.5.31 软件的实现 2007.6.1-2007.6.25 论文撰写、准备答辩4指

6、导教师审阅意见指导教师(签字): 年 月 日说明:本报告必须由承担毕业论文(设计)课题任务的学生在毕业论文(设计) 正式开始的第1周周五之前独立撰写完成,并交指导教师审阅。*学院毕业设计 (论文)成绩评定表学生姓名*性别男学号*专 业班 级*1课题名称基于Lucene的桌面全文搜索引擎研究课题类型实际应用难度难毕业设计(论文)时间200 年3月19日200 年6月 24日 共14周 指导教师* (职称:讲师)课题任务完成情况论 文 20 (千字); 设计、计算说 明书 2 (千字); 图纸 3 (张);其它(含附 件):程序指导教师意见 分项得分:开题调研论证 分; 课题质量(论文内容) 分;

7、 创新 分;论文撰写(规范) 分; 学习态度 分; 外文翻译 分指导教师审阅成绩: 指导教师(签字): 年 月 日评阅教师意见 分项得分:选题 分; 开题调研论证 分; 课题质量(论文内容 分; 创新 分;论文撰写(规范) 分; 外文翻译 分评阅成绩: 评阅教师(签字): 年 月 日验收小组意见 分项得分:准备情况 分; 毕业设计(论文)质量 分; (操作)回答问题 分验收成绩: 验收教师(组长)(签字): 年 月 日答辩小组意见 分项得分:准备情况 分; 陈述情况 分; 回答问题 分; 仪表 分答辩成绩: 答辩小组组长(签字): 年 月 日成绩计算方法(填写本系实用比例)指导教师成绩 ()

8、评阅成绩 () 验收成绩 () 答辩成绩 ()学生实得成绩(百分制)指导教师成绩 评阅成绩 验收成绩 答辩成绩 总评 答辩委员会意见 毕业论文(设计)总评成绩(等级): 系答辩委员会主任(签字): 系(签章) 年 月 日备注*学院毕业论文(设计)成绩评定表(续表)基于Lucene的桌面全文搜索引擎研究目 录摘要IAbstractII1 绪论12 Lucene基础12.1 信息获取与搜索引擎12.2 Lucnen的历史32.3 索引和搜索63 搜索引擎的中文问题83.1 中文分词问题84 用Lucene来建立索引和搜索94.1 Lucene分析器Analyzer104.2 索引建立的过程114.

9、3 Lucene的文档格式124.4 索引的添加IndexWriter类154.5 Lucene的索引文件格式简述164.6 搜索的流程184.7 搜索与结果184.8 Lucene的评分机制205 构建自己的“搜索引擎”215.1 认识Lucene225.2 为本机的文件创建索引235.3 搜索的效果245.4 总结26致谢27参考资料28附录29 基于Lucene的桌面全文搜索引擎研究摘要Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用.全文检索技术是信息检索领域广泛使用的基本技术.它是一个优秀的开源全文本搜索技术框架.按照Lucene的框

10、架规范,扩展Lucene的功能,可以将Lucene很好地嵌入到自己的搜索引擎中.本文研究了Lucene的中文切分词技术,Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构, 描述了利用Lucene开发定制的中文全文搜索引擎的方法,实现了一个基于Lucene的全文搜索应用实例.关键词: Lucene 全文检索技术 搜索引擎 索引 切分词AbstractLucene is a full text using Java to write search engine toolkit , which supports multiaccess , visit

11、s index speed quickly ,and can stride over platform usage. The full text search technology is the fundamental technology that the information retrieval field uses broadly. It is that one is excellent hold source full text searching for the technology frame originally. According to the Lucene frame n

12、orm , the function expanding Lucenes, in the search engine being able to Lucene be implanted very good to self。Unwieldy culture has studied the Lucene Chinese segments the word technology , the Lucene index principle , the system structure according to Lucene has analysed the Lucene analyzer , index

13、 structure such as bag , document detailedly , has described search engine method making use of Lucene to develop custom-built Chinese full text , has realized a example applying owing to that the Lucene full text searches for.Key words: Lucene,Full text Search technology, Search engine, Index, Segment word

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号