网络涉恐行为的特征分析与判定标准研究

上传人:第*** 文档编号:49594532 上传时间:2018-07-31 格式:PPT 页数:18 大小:1.40MB
返回 下载 相关 举报
网络涉恐行为的特征分析与判定标准研究_第1页
第1页 / 共18页
网络涉恐行为的特征分析与判定标准研究_第2页
第2页 / 共18页
网络涉恐行为的特征分析与判定标准研究_第3页
第3页 / 共18页
网络涉恐行为的特征分析与判定标准研究_第4页
第4页 / 共18页
网络涉恐行为的特征分析与判定标准研究_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《网络涉恐行为的特征分析与判定标准研究》由会员分享,可在线阅读,更多相关《网络涉恐行为的特征分析与判定标准研究(18页珍藏版)》请在金锄头文库上搜索。

1、网络涉恐行为的特征分析与判定标准研究内容简要背景 文本特征提取 中文分词 单词归类 判定方法 系统设计背景国内恐怖势力活动猖獗网络环境错综复杂恐怖分子利用网络传播 涉恐信息,达到扩大影 响和策划活动等目的。一种基于词频的文本特征提取算法一套使用该算法和神经网络的文本判定系统文本特征提取1)建立零向量,维数与词类数相同 2)取出文本下一个单词 3)查询该单词类别,若该单词无分类,回到 2),若有分类继续 4) 4)向量对应该类的坐标增加1 5)若还有下一个单词,返回2),若已经没有下一个单词,向量的每一维坐 标除以总词数转化为频率,得到最终特征向量。特征提取需要解决的问题如何识别文中的每一个单词

2、?如何给单词分类?如何确定分多少类?中文分词算法分词算法的选择1) 词典匹配的方法2) 字符标注的方法(CRF、HMM、MEMM) MMSEG算法(词典匹配)词串(chunk)& 消岐规则MMSEG算法的改进匹配方向消岐规则自学习的方法MMSEG算法的改进匹配方向的改进假设最大匹配长度为5。原匹配方向:改进后的匹配方向:单词分类的方法对正常、涉恐文本样本分别统计单词使用频率两类文本单词的使用频率的差别作为分类依据单词分类的方法(2)词频取对数 缩小结果的数量级范围 更准确地表现出单词使用差异第一类文本: 第二类文本: 相减结果: 对数相减结果:类数取决于每条文本单词数L,不宜多于L/10, 也

3、可根据对数绝对值动态决定。 得到结果后,先按结果符号(正负)分为2类, 每一大类中,再将结果区间等长划分。我们0.001500邪恶0.000501我 们0.001000邪 恶0.000001我们0.005000邪恶0.005000我们0.17邪恶2.70特征判定标准如何根据特征来区分正常文本和涉恐文本?1)单词统计的是所有样本的词频,对于单条文本,词频波动很大2)样本较多,人力总结两类文本的特征费时费力3)网络更新速度非常快;为了逃避审查,涉恐语言经常改变句式、 用词。静态的标准随着网络语言的发展逐渐不再适用神经网络: 非线性逼近 自学习 高效神经网络的选择BP网络RBF网络网络类型网络结构学习效率逼近误差BP网络事先决定:试凑 、实验速度难以控制,存在陷入 局部极小值、震荡等问题任意精度,非最 佳逼近RBF网络训练过程中动态 变更速度容易掌控,不存在以 上问题任意精度,最佳 逼近系统流程学习:生成标准判定:使用生成的标准进行判定系统展示(1)基本分词系统展示(2)单词分类系统展示(3)训练网络系统展示(4)系统测试谢 谢!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号