网页邮箱识别分类方法及系统的制作方法

上传人:ting****789 文档编号:310043650 上传时间:2022-06-14 格式:DOCX 页数:4 大小:19.08KB
返回 下载 相关 举报
网页邮箱识别分类方法及系统的制作方法_第1页
第1页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《网页邮箱识别分类方法及系统的制作方法》由会员分享,可在线阅读,更多相关《网页邮箱识别分类方法及系统的制作方法(4页珍藏版)》请在金锄头文库上搜索。

1、网页邮箱识别分类方法及系统的制作方法专利名称:网页邮箱识别分类方法及系统的制作方法技术领域:本发明涉及网络安全以及网络内容提取技术,更具体地说,涉及一种提取网页邮 箱内容时,识别分类网页邮箱内容的方法及系统背景技术:随着互联网应用的增多,电子邮件已经成为用户通过网络进行沟通的重要手段, 随着网页技术的发展,网页邮箱作为一种客户端具有免安装就可以运行的特点。当使用网 页邮箱进行收发邮件时,由于邮件数据直接经过网络而不存储于本地计算机;因此,传统的 从本地计算机的邮件客户端程序读取邮件内容的方法就无法获取网页邮件的内容,更无法 根据网页邮件的内容进行网页邮件的分类展示。发明内容本发明要解决的技术问

2、题在于,针对现有的本地计算机的邮件客户端程序无法获 取网页邮件内容,更无法根据网页邮件的内容进行网页邮件的分类展示的缺陷,提供一种 通过对邮件内容中特征字符串的分析,根据网页邮箱的网页地址来建立分类,并从根据不 同的分类建立特征字符串分析引擎,在用户收发邮件的时候通过识别网页地址链接来完成 区分和对内容的提取的网页邮箱识别分类方法及系统。本发明解决其技术问题所采用的技术方案是构造一种网页邮箱识别分类方法, 其中包括步骤S1、用户收发邮件时,调用识别引擎识别当前访问的网页邮箱的类别;S2、 根据所述网页邮箱的类别调用相应的分析引擎提取与特征字符串相应的邮件内容;S3、对 所述邮件内容进行分类展示

3、。在本发明所述的网页邮箱识别分类方法中,在步骤Sl之前包括步骤S0、读取网 页邮箱的网页地址和所述网页邮箱的邮件内容的特征字符串,根据所述网页地址和所述特 征字符串建立所述识别引擎和所述分析引擎。在本发明所述的网页邮箱识别分类方法中,步骤Sl包括用户收发邮件时,调用 识别引擎根据所述网页邮箱的网页地址和超文本传输协议的动作类型识别当前访问的网 页邮箱的类别。在本发明所述的网页邮箱识别分类方法中,步骤S2包括S21、根据所述网页邮箱 的类别选取相应的分析引擎;S22、调用所述相应的分析引擎对所述特征字符串进行分割扫 描,得到分割扫描结果;S23、根据所述分割扫描结果确定所述特征字符串相应的邮件内

4、容 的位置和长度;S24、根据所述特征字符串相应的邮件内容的位置和长度提取所述特征字符 串相应的邮件内容。在本发明所述的网页邮箱识别分类方法中,所述特征字符串为网页邮件的邮件主 题、发件人、收件人、抄送人、邮件内容以及附件。本发明还构造一种网页邮箱识别分类系统,其中包括识别模块用于用户收发 邮件时,调用识别引擎识别当前访问的网页邮箱的类别;提取模块用于根据所述网页邮箱的类别调用相应的分析引擎提取与特征字符串相应的邮件内容;展示模块用于对所述 邮件内容进行分类展示。在本发明所述的网页邮箱识别分类系统中,所述网页邮箱识别分类系统还包括 创建模块用于读取网页邮箱的网页地址和所述网页邮箱的邮件内容的特

5、征字符串,根据 所述网页地址和所述特征字符串建立所述识别引擎和所述分析引擎。在本发明所述的网页邮箱识别分类系统中,所述识别模块包括读取单元用于 读取网页邮箱的网页地址和超文本传输协议的动作类型;识别单元用于用户收发邮件 时,调用所述识别引擎根据所述网页邮箱的网页地址和超文本传输协议的动作类型识别当 前访问的网页邮箱的类别。在本发明所述的网页邮箱识别分类系统中,所述提取模块包括选取单元用于 根据所述网页邮箱的类别选取相应的分析引擎;分割扫描单元用于调用所述相应的分析 引擎对所述特征字符串进行分割扫描,得到分割扫描结果;确定单元用于根据所述分割 扫描结果确定所述特征字符串相应的邮件内容的位置和长度

6、;提取单元用于根据所述特 征字符串相应的邮件内容的位置和长度提取所述特征字符串相应的邮件内容。在本发明所述的网页邮箱识别分类系统中,所述特征字符串为网页邮件的邮件主 题、发件人、收件人、抄送人、邮件内容以及附件。实施本发明的网页邮箱识别分类方法和系统,具有以下有益效果通过对邮件内 容中特征字符串的分析,根据网页邮箱的网页地址来建立分类,并根据不同的分类建立特 征字符串分析引擎,在用户收发邮件的时候通过识别网页地址链接来完成区分和对内容的 提取,避免了本地计算机的邮件客户端程序无法获取网页邮件内容、更无法根据网页邮件 的内容进行网页邮件的分类展示的缺陷。根据网页地址和特征字符串建立的分析引擎和识

7、别引擎进行分析识别更加准确。 采用网页邮箱的网页地址和超文本传输协议的动作类型进行识别可以很好的区分不同的 网站的邮箱以及用户的动作状态(发邮件或收邮件)。通过对特征字符串分割扫描的方法 获得邮件内容再进行提取,方法方便简单,便于实现。特征字符串可为网页邮件的邮件主 题、发件人、收件人、抄送人、邮件内容以及附件等多种邮件内容中的特征。下面将结合附图及实施例对本发明作进一步说明,附图中图1为本发明的网页邮箱识别分类方法的第一优选实施例的流程示意图;图2为本发明的网页邮箱识别分类方法的第二优选实施例的流程示意图;图3为本发明的网页邮箱识别分类方法的第三优选实施例的流程示意图;图4为本发明的网页邮箱

8、识别分类方法的第四优选实施例的流程示意图;图5为本发明的网页邮箱识别分类系统的第一优选实施例的结构示意图;图6为本发明的网页邮箱识别分类系统的第二优选实施例的结构示意图;图7为本发明的网页邮箱识别分类系统的第三优选实施例的结构示意图;图8为本发明的网页邮箱识别分类系统的第三优选实施例的结构示意图。具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并 不用于限定本发明。如图1所示,在本发明的网页邮箱识别分类方法的第一优选实施例的流程示意图 中,所述网页邮箱识别分类方法开始于步骤10

9、0 ;步骤100之后进行到步骤101,用户收发邮 件时,调用识别引擎识别当前访问的网页邮箱的类别;随后,到下一步骤102,根据所述网 页邮箱的类别调用相应的分析引擎提取与特征字符串相应的邮件内容;随后,到下一步骤 103,对所述邮件内容进行分类展示;最后该方法结束于步骤104。采用本发明的网页邮箱 识别分类方法,在用户收发邮件时,识别当前网页邮箱的类别(如不同网站的网页邮箱), 然后根据不同的网页邮箱的类别调用相应的分析引擎分析邮箱内邮件的特征字符串,通过 对特征字符串的分析提取与特征字符串相应的邮件内容(即对邮件内容进行了分类),最 后对分类后的邮件内容进行分类展示,达到对网页邮件按照邮件内

10、容进行分类的目的。通 过对邮件内容中特征字符串的分析,根据网页邮箱的网页地址来建立分类,并根据不同的 分类建立特征字符串分析引擎,在用户收发邮件的时候通过识别网页地址链接来完成区分 和对内容的提取,避免了本地计算机的邮件客户端程序无法获取网页邮件内容、更无法根 据网页邮件的内容进行网页邮件的分类展示的缺陷。如图2所示,在本发明的网页邮箱识别分类方法的第二优选实施例的流程示意图 中,所述网页邮箱识别分类方法开始于步骤200 ;步骤200之后进行到步骤201,读取网页邮 箱的网页地址和所述网页邮箱的邮件内容的特征字符串,根据所述网页地址和所述特征字 符串建立所述分析引擎和所述识别引擎;随后,到下一

11、步骤202,用户收发邮件时,调用识 别引擎识别当前访问的网页邮箱的类别;随后,到下一步骤203,根据所述网页邮箱的类别 调用相应的分析引擎提取与特征字符串相应的邮件内容;随后,到下一步骤204,对所述邮 件内容进行分类展示;最后该方法结束于步骤205。本方法采用读取的网页邮箱的网页地 址和所述网页邮箱的邮件内容的特征字符串来建立识别引擎和分析引擎,通过对网页地址 和特征字符串的读取统计建立的识别引擎和分析引擎可以很好的识别出不同的网站的网 页邮箱以及可以通过分析特征字符串很好的分类提取出网页邮件的内容。如图3所示,在本发明的网页邮箱识别分类方法的第三优选实施例的流程示意图 中,所述网页邮箱识别

12、分类方法开始于步骤300 ;步骤300之后进行到步骤301,用户收发 邮件时,调用识别引擎根据所述网页邮箱的网页地址和超文本传输协议的动作类型识别当 前访问的网页邮箱的类别;随后,到下一步骤302,根据所述网页邮箱的类别调用相应的分 析引擎提取与特征字符串相应的邮件内容;随后,到下一步骤303,对所述邮件内容进行分 类展示;最后该方法结束于步骤304。调用识别引擎根据所述网页邮箱的网页地址和超文 本传输协议的动作类型识别当前访问的网页邮箱的类别,网页地址用来区分不同网站的邮 箱,超文本传输协议的动作用来区分用户在该网站的当前动作是发送邮件还是接收邮件, 例如邮箱进行HTTP POST动作时是发

13、送邮件,进行HTTP GET时,是接收邮件。这样区分不 同的网页邮箱的类别以及邮箱内邮件的类别时可以更加清楚。如图4所示,在本发明的网页邮箱识别分类方法的第四优选实施例的流程示意图 中,所述网页邮箱识别分类方法开始于步骤400 ;步骤400之后进行到步骤401,用户收发邮件时,调用识别引擎识别当前访问的网页邮箱的类别;随后,到下一步骤402,根据所述网 页邮箱的类别选取相应的分析引擎;随后,到下一步骤403,调用所述相应的分析引擎对所 述特征字符串进行分割扫描,得到分割扫描结果;随后,到下一步骤404,根据所述分割扫 描结果确定所述特征字符串相应的邮件内容的位置和长度;随后,到下一步骤405,

14、根据所 述特征字符串相应的邮件内容的位置和长度提取所述特征字符串相应的邮件内容;随后, 到下一步骤406,对所述邮件内容进行分类展示;最后该方法结束于步骤407。调用识别 引擎对网页邮箱的类别进行识别后,使用相应的分析引擎分析邮箱内邮件内容的特征字符 串,即进行分割扫描,例如POST般的格式是固定的,有URL Encoding(网页地址编码)等 方式,GET方式一般是以HTML(超文本连接标示语言)来进行展示的;依靠这些固定的格式 来进行邮件内容中的多个特征字符串分割,分割出单独的特征字符串后再对这个单独的特 征字符串进行扫描,来确定该特征字符串表示的类型(得出该特征字符串附近的数据是邮 件的

15、主题还是邮件的发件人),即分割扫描结果。通过上面的分割扫描得出的特征字符串的 类型确定单独的特征字符串相应的邮件内容位置和长度,最后提取这些邮件内容位置和长 度用于邮件的分类和展示。通过对特征字符串分割扫描的方法获得邮件内容再进行提取, 方法方便简单,便于实现。作为本发明的网页邮箱识别分类方法的优选实施例,特征字符串可为网页邮件的 邮件主题、发件人、收件人、抄送人、邮件内容以及附件等多种邮件内容中的特征。特征字符 串是用来表示邮件是哪一部分是主题,哪一部分是收件人之类的字符串,邮件中也用这样 的字符串来区分哪些数据是什么,可以说这些字符串是邮件或发送邮件过程中的一部分。 比如邮箱在发送邮件的时

16、候,会用“主题”来表示邮件主题。特征字符串可以是由开发人 员对数据分析后给出对应的特征,也可以是熟悉这种规则格式的用户自己规定的特征。本发明还构造一种网页邮箱识别分类系统,如图5所示,在本发明的网页邮箱识 别分类系统的第一优选实施例的结构示意图中,所述网页邮箱识别分类系统包括识别模块 1、提取模块2以及展示模块3。识别模块1用于用户收发邮件时,调用识别引擎识别当前访 问的网页邮箱的类别;提取模块2用于根据所述网页邮箱的类别调用相应的分析引擎提取 与特征字符串相应的邮件内容;展示模块3用于对所述邮件内容进行分类展示。采用本发 明的网页邮箱识别分类系统,在用户收发邮件时,识别模块1识别当前网页邮箱的类别(如 不同网站的网页邮箱),然后提取模块2根据不同的网页邮箱的类别调用相应的分析引擎 分析邮箱内邮件的特征字符串,通过对特征字符串的分析提取与特征字符串相应的邮件内 容(即对邮件内容进行了分类),最后展示模块3对分类后的邮件内容进行分类展示,达到 对网页邮件按照邮件内容进行分类的目的。通过对邮件内容中特征字符串的分析,根据网 页邮箱的网页地址来建立分类,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号