分类不平衡数据集BP算法Bagging算法阈值评价标准硕士论文

上传人:pu****.1 文档编号:544200198 上传时间:2023-03-28 格式:DOC 页数:5 大小:26.50KB
返回 下载 相关 举报
分类不平衡数据集BP算法Bagging算法阈值评价标准硕士论文_第1页
第1页 / 共5页
分类不平衡数据集BP算法Bagging算法阈值评价标准硕士论文_第2页
第2页 / 共5页
分类不平衡数据集BP算法Bagging算法阈值评价标准硕士论文_第3页
第3页 / 共5页
分类不平衡数据集BP算法Bagging算法阈值评价标准硕士论文_第4页
第4页 / 共5页
分类不平衡数据集BP算法Bagging算法阈值评价标准硕士论文_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《分类不平衡数据集BP算法Bagging算法阈值评价标准硕士论文》由会员分享,可在线阅读,更多相关《分类不平衡数据集BP算法Bagging算法阈值评价标准硕士论文(5页珍藏版)》请在金锄头文库上搜索。

1、如黠嫦縣蠶即惘发:138113721 139938848少数类数据识别方法及性能评价计算机软件与理论,2011 ,硕士【摘要】分类算法是当今机器学习领域中重要的研究方向之一,很多经典算法在实际问题中得到广泛的应用并取得了良好的效果。传统的分类算法假设数据分布均衡,并且以提高分类算法对数据集的整体分 类正确率为主要目标。但现实中很多数据集中的不同类别包含的数据 数量是高度倾斜、非平衡的,一个或几个类别中数据数量远远大于其 他类别中数据数量,这样的数据集称为类别不平衡数据。其中数量上 占优的一类或者几类称为多数类,其他称为少数类。传统分类算法分 类不平衡数据时,以提高数据集的整体分类正确率为目标,

2、由于少数 类样例数量较少,因而预测倾向数量上占优的多数类,对少数类分类 识别率不利;然而在很多实际问题中,提高少数类数据识别率往往比 提高多数类数据识别率更有价值。然而在某些极端情况下,分类算法 把少数类样例全部错分仍能保证较高的整体准确率。因此,如何提高分类算法对类别不平衡数据的分类性能,尤其提高分类算法对少数类 的识别率,成为机器学习中研究热点之一。目前对不平衡数据分类问 题的研究主要以下几个方面:首先是数据层面,即数据预处理算法,通 常通过改变原有数据的分布,缩减其不平衡程度,达到平衡数据的目 的,常用方法包括采样技术、特征提取技术等;其次更多还原如财文请联系魏即惆发:*:1381137

3、21 139938848 33 Abstract Classification problem is one of the most important fields of machine learning; many classicalalgorithms have bee n used in practical problems and achieved good results. The traditional classification algorithms are based on the assumption that the data distribution is balan

4、ee, and the main purpose of these algorithms is to improve the overall accuracy of the datasets. However, many datasets have highly skewed, imbala need classes, in which the nu mber of samples belong to one or more classes is m.更多还原 CO关键词分类;不平衡数据集;BP算法;Bagging算法;阈 值评价标准;【Key words】 classify ; imbala

5、need datasets ; BP algorithm ; Bagg ing algorithm ; threshold selecti on criteri on;摘要6-8ABSTRACT 8-9第1章绪论10-131.1课题研究背景及意义 10-111.2本文主要研究工作 11-121.3本文章节组织12-13第2章 不平衡数据研究综述13-192.1不平衡数据分类困难的原因13-14如卿文请縣客骷即蚀快:138113721 1399388482.1.1数据提取困难132.1.2评估标准选择困难132.1.3噪声数据的影响13-142.1.4分类算法的选择142.2研究现状14-192

6、.2.1数据层面14-162.2.2算法层面16-172.2.3评价标准17-19第3章 针对不平衡数据集的Bagging改进算法37 19-243.1 Bagging 算法概述193.2 BASM 基于SMOTE 的Bagging改进算法19-213.3实验结果分析21-233.4本章小结23-24第4章 不平衡数据集的神经网络阈值优化方法42 24-324.1人工神经网络概述24-254.2遗传算法概述25-264.3神经网络阈值优化算法描述26-274.4 ORI阈值判定标准 27-294.5实验结果分析29-304.6本章小结30-32第5章 针对不平衡数据集的随机漫步过采样方法32-465.1 RWO-Sampling 理论模型 32-34

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 商业计划书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号