基于贝叶斯算法分类的反垃圾邮件系统的改进硕士学位论文 长春工业大学

上传人:小** 文档编号:39227546 上传时间:2018-05-13 格式:DOC 页数:45 大小:351.05KB
返回 下载 相关 举报
基于贝叶斯算法分类的反垃圾邮件系统的改进硕士学位论文 长春工业大学_第1页
第1页 / 共45页
基于贝叶斯算法分类的反垃圾邮件系统的改进硕士学位论文 长春工业大学_第2页
第2页 / 共45页
基于贝叶斯算法分类的反垃圾邮件系统的改进硕士学位论文 长春工业大学_第3页
第3页 / 共45页
基于贝叶斯算法分类的反垃圾邮件系统的改进硕士学位论文 长春工业大学_第4页
第4页 / 共45页
基于贝叶斯算法分类的反垃圾邮件系统的改进硕士学位论文 长春工业大学_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《基于贝叶斯算法分类的反垃圾邮件系统的改进硕士学位论文 长春工业大学》由会员分享,可在线阅读,更多相关《基于贝叶斯算法分类的反垃圾邮件系统的改进硕士学位论文 长春工业大学(45页珍藏版)》请在金锄头文库上搜索。

1、长春工业大学硕士学位论文1学位论文题目:学位论文题目:基于贝叶斯算法分类的反垃圾邮件系统的改进基于贝叶斯算法分类的反垃圾邮件系统的改进 摘摘 要要电子邮件成为一种快捷、经济的现代通信技术手段,极大地方便了人们的通信与交流。然而,垃圾邮件的产生,影响了正常的电子邮件通信,占用了传输带宽,对系统安全造成了严重的威胁。因此,研究反垃圾邮件问题已经成为全球性的具有重大现实意义的课题。目前,应对垃圾邮件的主要方法和手段是通过反垃圾邮件立法和使用邮件过滤技术进行处理,现已相继出现了多种邮件过滤技术。常用的包括黑/白名单技术、基于内容的分析方法以及基于规则的方法等。基于内容分析的技术正逐步进入邮件过滤技术当

2、中,并成为当前研究热点,其中,基于内容分析的邮件过滤方法中的典型方法是基于贝叶斯算法的垃圾邮件过滤模型。本论文对中文垃圾邮件的特点进行了比较系统的分析和研究,结合贝叶斯(Bayes)理论,构造基于贝叶斯分类的垃圾邮件过滤模型,在特征提取方面,采用互信息值的方法,在分类方法上,引入了适合本文的分类方法,并采用了一种更加适合于贝叶斯计算的表示方法;本文作者采用中国教育科研网(CERNET)收集并维护的大量中文垃圾邮件和正常邮件样本的标准数据集,对本文研究的方法进行了大量测试,准确率和误判率分别达到了 95.8%和 5.3%。结果表明基于贝叶斯算法的垃圾邮件过滤系统对拦截垃圾邮件有很好的作用。关键词

3、:电子邮件,垃圾邮件,邮件过滤,贝叶斯理论AbstractThe e-mail has become a quick and economical means of modern communication technology, which enormously facilitates peoples communication and exchanges. However, the emergence of spam has affected the normal email correspondence, and taken the transmission band width, ev

4、en posed the serious threat to the system safety. Therefore, the study of anti-spam has become a global problem of great practical significance of the topic.At present, the main ways and means of the response to spam are the anti-spam legislation and the use of mail filtering technology. But now a v

5、ariety of mail filtering technologies have appeared in succession, which are usually used including black / white list 2technologies, content-based analysis methods, and rule-based methods. Content-based analysis techniques are gradually entering the mail filtering technology which has become hot sp

6、ots of current research. The typical method of content-based analysis mail filtering methods is based on Bayesian algorithm for spam filtering model.In this paper, the Chinese characteristics of spam has been studied and analyzed systematically. Combining with Bayesian (Bayes) theory, this paper con

7、structs the spam filtering model which is based on Bayesian classification. In feature extraction, mutual information values are used. In the classification method, a classification method is introduced which is suitable in this article, and a more suitable expression in the Bayesian calculation met

8、hod is adopted; the standard sample data sets of a large number of Chinese spam and regular mail are collected and maintained by the Chinese Education and Research Net (CERNET). The author conducted a lot of testing towards the methods which are studied by this paper. The accuracy and misjudgment ra

9、te reached 95.8% and 5.3% respectively. The results show that the spam filtering system based on algorithm Bayesian plays a very good role to block spam.Key Words: e-mail, spam, mail filtering, Bayesian theory3学位学位论论文原文原创创性声明性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体

10、已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位学位论论文版文版权权使用授使用授权书权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权 大学可以将本学位论文的全部或 部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手 段保存和汇编本学位论文。 涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日4目目 录录第一章第一章 绪论绪论.31.1 引言.3 1.2 垃圾邮件的定义及其危害.4 1.2.1 垃圾邮件定义.4 1.2.2 垃圾邮件危害5.4 1.3 国内外反垃圾邮件现状.6 1.4 研究目标与内容.7第二章第二章 垃圾邮件技术垃圾邮件技术.72.1 电子邮件工作原理简介.7 2.1.1 电子邮件的概述.7 2.1.2 电子邮件的格式.8 2.1.3 邮件传送过程.9 2.1.4 相关协议.10 2.2 非技术手段反垃圾邮件.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号