基于pca融合神经网络的移动设备威胁研究

上传人:小** 文档编号:34140979 上传时间:2018-02-21 格式:DOC 页数:7 大小:122.50KB
返回 下载 相关 举报
基于pca融合神经网络的移动设备威胁研究_第1页
第1页 / 共7页
基于pca融合神经网络的移动设备威胁研究_第2页
第2页 / 共7页
基于pca融合神经网络的移动设备威胁研究_第3页
第3页 / 共7页
基于pca融合神经网络的移动设备威胁研究_第4页
第4页 / 共7页
基于pca融合神经网络的移动设备威胁研究_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《基于pca融合神经网络的移动设备威胁研究》由会员分享,可在线阅读,更多相关《基于pca融合神经网络的移动设备威胁研究(7页珍藏版)》请在金锄头文库上搜索。

1、基于 PCA 融合神经网络的移动设备威胁研究 孔繁盛 蒋周良 胡斌 张欢 中移互联网有限公司 摘 要: 为了提高移动设备存在威胁风险分析的准确率和抗干扰能力, 进而降低投诉率, 提出一种基于 PCA 融合 BP 神经网络风险分析模型。通过核主成分分析将设备威胁类型从 10 个特征量降低到 3 个主特征量, 提取了原始数据的主信息, 并以降维后的特征量作为 BP 神经网络的输入特征量, 建立设备威胁风险分析模型。最后通过实验对比了多种模型算法, 结果表明采用 PCA 结合 BP 神经网络的风险分析模型具有更好的风险识别准确率。关键词: 主成分分析法; BP 神经网络; 风险分析模型; 收稿日期:

2、2017-10-11Study of mobile device risk base on PCA and neural networkKONG Fan-sheng JIANG Zhou-liang HU Bin ZHANG Huan China Mobile Internet Co., Ltd.; Abstract: To improve the accuracy and anti-interference ability for risk analysis of mobile device, and reduce the complaint rate, this paper propose

3、d a model of risk analysis base on PCA and BP neural network.The feature vectors of device risk types are reduces from 10 to 3 and main information of raw data can be got by PCA.And then built a device risk analysis model using BP neural network which the input data is the low dimension feature vect

4、ors got from PCA.Experiments compared performances of our model and some other models, the results show the model combine PCA and BP neural network can identify risks accurately.Keyword: PCA; BP neural network; risk analysis model; Received: 2017-10-111 引言随着电子商务技术的发展, 电商促使用户对移动支付的便捷性更为认可, 传统的支付工具正逐步

5、被电子化的支付方式取代1。在我国, 电子支付也进入快速增长期, 据 CNNIC 发布的中国互联网络发展状况统计报告显示, 截至 2015年, 我国电子支付用户规模达到 3.59 亿2。但是随着电子支付的发展, 交易安全显得尤为重要3。根据2006 电子支付产业调查报告显示, 在选择电子支付考虑的诸多因素中, 64.5%的用户首选安全。可见, 安全性成为制约电子支付发展的主要原因。随着移动支付的快速普及, 话费收入作为移动支付的一种重要形式, 收入不容小觑。据统计仅 2016 年中国移动话费支付收入已达 24 亿元。然而巨额收入下, 交易投诉率也在攀升, 2016 年全年投诉量达 90 万次,

6、面对海量用户投诉, 传统的人工分析方式无法为网络建设维护提供准确有效的分析支撑4。本文通过对用户使用的移动设备威胁数据进行采集, 并构建分析模型, 预测用户设备的威胁程度。2 基于主成分融合神经网络的移动设备威胁识别2.1 基于主成分模型基础理论主成分分析方法 (PCA) 5是通过降维技术把多个变量化为少数几个主成分的统计方法, 该模型的基本原理及主要步骤如下:假设原始分析指标数据构成的矩阵为:其中:n 为评价对象个数;m 为所要分析的指标个数;x ij为第 i 个评价对象第 j 个指标的数值。步骤 1:原始数据的标准化处理。由于所采集得到的各指标数值的量纲表现形式不一, 因此首先将原始数据进

7、行归一化处理, 消除量纲影响。其中本文采用标准差归一化方法, 如式 2 所示:其中: 为第 j 项指标的平均值, S j为第 j 项指标的标准差。步骤 2:建立相关系数矩阵, 求相关系数矩阵的特征值, 确定主成分个数即新指标个数 k。计算相关矩阵 R 的特征值和方差贡献率, 且 R 的特征值按照从大到小的排列方式为 1 2 p0。然后选择合适的主成分个数来代替原始变量, 并计算各主成分的贡献率, 如式 3 所示。其中: j为第 j 个特征值;CPV (j) 为 j对应的主成分的贡献率;步骤 3:求取各特征值所对应的特征向量 P, 其中特征矩阵可以通过计算矩阵 X的协方差矩阵得到, 且得到的特征

8、向量间相互正交, 如式 4 所示。其中:p i为第 i 个主成份所对应的特征向量。步骤 4:计算各特征向量 pi所对应的主成分系数 qj, 并将主成份的方差贡献率CPV (j) 为权重, 对各指标所对应的各主成份系数进行线性加权, 并将其归一化得到各指标的最终权重值, 如式 5 所示。2.2 基于 BP 神经网络模型的识别预测BP 神经网络是神经网络中采用误差反传算法作为其学习算法的前馈网络, 该网络的具体结构如图 1 所示。图 1 BP 神经网络模型结构 下载原图其中:x j表示输入层第 j 个节点的输入信息, j=1, M;w ij表示隐含层第 i 个节点到输入层第 j 个节点之间的权值;

9、 i表示隐含层第 i 个节点的阈值; (x) 表示隐含层的激励函数;w ki表示输出层第 k 个节点到隐含层第 i 个节点之间的权值, i=1, q;a k表示输出层第 k 个节点的阈值, k=1, L; (x) 表示输出层的激励函数;o k表示输出层第 k 个节点的输出。通过以上的 BP 网络结构图可知, 如果在一个简单的三层 BP 网络中, 假设输入向量为 X (x1, x2, , xn) , 输出层输出向量为 O (o1, o2, , on) , 隐含层输出向量为 Y (y1, y2, , yn) , 目标输出向量为 D (d1, d2, , dn) , 输入层到隐含层的连接权值为 V

10、(v1, v2, , vn) , 隐含层到输出层的连接权值为W (w1, w2, , wn) , 其对应的网络迭代步骤分别如下。步骤 1:以随机的方式初始化网络的权值矩阵 W 与 V, 并设定相应的学习率 , 及目标误差值 Emin, 同时还将样本模式计数器 p 与训练次数计数器 q 置为 1。步骤 2:通过依次输入训练样本 X 与 D, 并分别计算隐含层输出向量 Y 与目标输出向量 O。计算表达式如式 6 所示:其中:net j, netk分别表示隐含层与输出层使用的传递函数。步骤 3:若共有 P 对训练样本, 针对每一个不同的学习样本 p, 其网络均对应不同的误差 E, 并以其均方根作为网

11、络的总误差。计算表达式如式 7 所示:步骤 4:计算各层的误差信号, 其中计算表达式如式 8 所示:步骤 5:调整网络各层的权重值, 其中计算表达式如式 9 所示:步骤 6:当完成针对所有样本的一次训练时, 检查网络训练是否满足终止条件。若 ERME95%。故可以将所有的样本原始数据指标压缩成前 3 个主成分。将各主成分系数对所有样本进行加权计算, 并将得到的 3 个主成分指标值作为BP 神经网络模型的输入信息。其中, 不存在风险的样本编码为1;0, 存在风险的样本编码为0;1。其中所建立的神经网络框架参数如表 2 所示, 并将所有样本以 70%为训练样本、15%为控制样本、15%为测试样本的

12、分配对所建立好的网络模型进行训练。表 2 BP 网络的相关参数 下载原表 表 3 各模型预警识别准确率对比 下载原表 将全部样本对所建立好的神经网络模型进行训练, 其中, 当模型训练结束时, 得到的各类型样本的识别准确率和模型的整体 ROC 曲线变化如图 3 所示。由图 3 得到的模型 ROC 曲线可以看出, 模型具有较高的识别精度, 在控制不错误识别无风险移动设备的情况下, 模型对存在风险的移动设备的识别准确率达到了 79.6%, 而整体模型的综合识别准确率达到了 91.0%。由此可知, 经由 PCA特征提取后的指标训练出来的 BP 神经网络模型具有较高的识别精度。但为了对比本文模型的优越性

13、, 表 3 中分别给出了将原始数据直接使用主成分、Logistic 模型、与 SVM 等模型的识别准确率对比结果。图 3 模型整体识别准确率和模型的 ROC 曲线变化 下载原图从表 3 的结果可知, 本文使用了 PCA 模型对指标进行了特征提取, 将多余干扰信息进行了剔除, 发现提出的模型算法对于移动设备是否存在风险情况的识别准确率均优于其它模型算法, 同时, 通过将原始数据在不同角度下进行特征提取挖掘, 最后作为新的特征信息训练识别模型, 得到的准确率比单一模型识别率高, 更适用于实际的移动设备威胁识别监控。4 总结通过主成分分析法能有效地降低设备威胁维度, 提取主要的设备威胁特征。因此用主

14、要特征量作为分析模型特征量, 建立 BP 神经网络诊断模型, 能够充分利用风险样本自身特性。实验结果说明结合 PCA 的 BP 神经网络分析模型具有更高的准确率。参考文献1黄力.电子支付现状与发展趋势综述J.时代经贸, 2012 (20) :17-17. 2刘罡, 杨坚争.我国电子支付发展现状、面临问题与对策研究J.电子商务, 2015 (11) :47-48. 3计晨晓, 霍旺, 包森成.基于多维度数据分析的移动威胁感知平台建设J.中国新通信, 2016 (24) :39-43. 4章蕾, 陈婷.基于客户感知的移动数据业务分析平台建设探讨J.移动通信, 2011, 35 (9) :71-74. 5征容, 严潇然.PCA 在智能感知解决方案中的应用J.通信与信息技术, 2014 (06) :59-61.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号