分类器的评估－金锄头文库

资源描述

《分类器的评估》由会员分享，可在线阅读，更多相关《分类器的评估（22页珍藏版）》请在金锄头文库上搜索。

1、分类器的评估张英混淆矩阵与分类准确率多分类问题的混淆矩阵预测结果类 c1c2ck总实际类 c1 c2 ck 总n 准确率误分类率分类模型的评价指标 1. 准确率与误分类率准确率 =(tp+tn) )/(tp+fn+fp+tn) 误分类率=(fn+fp)/(tp+fn+fp+tn) 真正率（灵敏度） =tp/(tp+fn) 真负率（特指度） =tn/(fp+tn) 假正率 =fp/(fp+tn) 假负率 =fn/(tp+fn) 二分类问题的混淆矩阵预测结果类 +-总实际类 + tp fntp+fn - fp tnfp+tn 总tp+fpfn+tntp+fn+ fp

2、+tn 不平衡分布类二类分类问题的混淆矩阵预测结果类 +10-90 实际类 +5+ (tp)3 +- (fn)2 -95-+ (fp)7 (tn)88 误分类率：9% 真正率：60% 评估指标 2. 精度 P=tp / (tp+fp) 3. 召回率（真正率、灵敏度） R=tp/(tp+fn) 4.FSCORE 精度和召回率的调和均值：召回率和精度的权重相同： F = 2RP/(R+P) 将召回率的权重设为精度的倍：二分类问题的混淆矩阵预测结果类 +-总实际类 + tp fntp+fn - fp tnfp+tn 总tp+fpfn+tntp+fn+ fp+tn 评估指

3、标二分类问题的误分类代价预测结果类 +-总实际类 +C(+,+) C(+,-) C(+,+)*TP+C(+,-)*FN -C(-,+) C(-,-) C(-,+)*FP+C(-,-)*TN 5. 误分类代价（成本或收益）误分类代价对称 C(+,+)=C(-,-)=0 C(+,-)=C(-,+)=1 误分类代价不对称关注预测为正类成本角度收益角度二分类问题的混淆矩阵预测结果类 +-总实际类 + tp fntp+fn - fp tnfp+tn 预测性能评估指标的选择平衡分布类，对称误分类代价准确率、误分类率，精度不平衡分布类，对称误分类代价精度，召回率，F

4、SCORE 不对称误分类代价成本或收益模型评估方法 Hold方法将数据分成训练集和验证（测试）集，一般按照 2:1比例划分，以验证集指标进行评估；多次随机采样进行N次上述（1）的随机采样，然后计算N个测试精度的平均值自助法（bootstrap)（最常用的.632自助法）进行N次有放回的均匀采样，获得的数据集作为训练集，原数据集中未被抽中的其它观测形成验证集。可重复K次，计算准确率：模型评估方法交叉验证数据集小的时候，可将数据集分成K个不相交的等大数据子集，每次将K-1个数据集作为训练集，将1个数据集作为验证（测试）集，得到K 个测试精度，然后计算K个测试指标的平均

5、值。留一交叉验证：K=N；分层交叉验证：每个部分中保持目标变量的分布。不同分类器预测准确度差异的显著性检验 T检验（自由度为K-1）以交叉验证为例（k为验证集观测分折数）：相同验证集：不同验证集：分类器预测准确度置信区间分类器预测真正准确度p= 其中：N：验证集观测个数； acc：基于当前验证集分类器的准确度； ROC曲线（receiver operating characteristic) 曲线下方面积越大，模型越好，即曲线与y轴正向的夹角越小越好。真正率假正率二分类问题的混淆矩阵预测结果类 +-总实际类 + tp fntp+fn - fp tnfp+

6、tn 总tp+fpfn+tntp+fn+ fp+tn 制作ROC曲线验证集共有10个观测，其中正类（P类）5个，负类（N类）5个将验证集各观测按照预测为正类的概率降序排列，每个观测计算对应的真正率和假正率，形成一个点。提升图假定：目标变量的取值为GOOD 和BAD N 为验证集观测个数； RGOOD为验证集目标变量取值为GOOD的观测个数； p_good为验证集目标变量预测为GOOD的概率值；验证集的混淆矩阵预测结果类 goodbad总实际类 good tp fnRGOO D bad fp tnRbad 总N 绘制提升图 1.将验证集各观测按照p_good降序排列

7、,等分成10组。 2.以10个分组为横坐标以下指标分别为纵坐标： %response：每组中实际为GOOD的观测个数占本组总个数的比例; %captured response:每组中实际为GOOD的观测个数占RGOOD的比例; %cumulative response:前面各组中实际为GOOD的观测个数占前面各组总个数的比例 %cumulative captured response:前面各组中实际为 GOOD的观测个数占RGOOD的比例。 lift value=使用模型以后的% response/ 不使用任何模型进行决策的% response 提升图某公司发送了1000封广告邮件

8、，有200个客户响应了邮件（即由于收到邮件而在该公司产生了消费行为）。每个10分位（100个观测）的响应者个数根据对验证数据集的计算得到。决策阈值选择根据每个观测预测为每个目标类的概率决定该观测的目标类值。对二分类：理论阈值p=1/(1+1/B) B=C（-，+）/C（+，-）根据提升图和实际业务背景选择合适的分组比例。根据分组比例决定最终决策阈值。提高分类准确率技术组合分类组合分类方法有放回抽样产生多个样本装袋：多数表决决定最终结果提升（ada boost) 随机森林：多颗决策树，随机属性选择组合方法联合方法处理多类问题的方法不平衡分布类处理技术抽样技术过抽样技术对稀有类重复抽样欠抽样技术对多数类随机抽样混合抽样技术阈值移动技术组合技术分类器性能指标运行速度鲁棒性（对噪声和缺失值的适应性）可伸缩性（对数据规模扩大的适应性）可解释性

展开阅读全文

分类器的评估

最新文档