（消费者行为）消费者购买可能性判断的模型设计

资源描述

《（消费者行为）消费者购买可能性判断的模型设计》由会员分享，可在线阅读，更多相关《（消费者行为）消费者购买可能性判断的模型设计（10页珍藏版）》请在金锄头文库上搜索。

1、消费者购买可能性判断的模型设计分类模型就是根据以往的经验，根据每个属性内的水平与类之间的对应关系，构造出分类模型。本文旨在探讨分类模型的评价标准，并提出了两种分类方法。第一种分类方法比较简单，经济含义也比较明显，但第一种方法要求属性（指标）之间不能有强的相关性。在第二种方法中，提出并证明了两条比较实用的结论，并利用这两条结论与一些合理的假设，求解出了新的分类模型。在一对一销售、信用评价等商业活动中，经常需要判断哪些人的购买倾向更高一些，哪些人的信用更好一些的问题。这实际上是如何进行分类的问题。分类与聚类不同。聚类没有根据经验进行学习的过程。而分类模型根据以往的经验，根据每个属性内

2、的水平与类之间的对应关系，构造出分类模型。分类模型的方法有：决策树、遗传算法、贝叶斯等。在本文中，只分成两类，这两类用购买者与非购买者来代表。购买者表示购买某产品，非购买者表示不购买某产品。一、模型好坏评价的标准预测结果的好坏也就是预测准确程度。本文以销售时的情况为例，假设结果分为两类：购买者与非购买者。假设在以往数据中购买者与非购买者的个数分别是a、b。我们利用某种模型在a个购买者中预测准确a1个人，不准确a2个人（或者说a2个人被预测成非购买者）；在b个非购买者中预测准确b1个人，不准确b2个人（或者说b2个人被预测成了购买者）。很自然的想法是利用整体准确率来衡量： L1=（

3、a1+b1）/（a+b）100% 指标一指标一的缺点是，有时购买者的个数要远低于非购买者的个数，比如，假设在某个人群中非购买者的比例占98%，如果采用这样的预测方法：对于任何一个人，都认为他是非购买者，按照指标一，预测准确率可以达到98%，属于很高的预测精度。但这与商家的目标不一致：商家希望根据以往的经验，根据每个人的属性特征，利用某种评价模型，从某个人群中挑出一部分人来，与没有应用该种模型相比，挑出来的这部分人比原始人群具有很高的购买倾向。而利用指标一评价，就属于一个人都没有挑出来。指标一的根本缺点是没有注意到预测准一个购买者与预测准一个非购买者的重要程度是不一样的（在购买者与非

4、购买者数量基本相等时两者的重要程度是一致的）。而以下指标就可以有效的克服上述缺点： L2=（a1/a+b1/b）50% 指标二可以利用指标二来判别模型的预测能力，将L2称为分类模型拟合优度系数。容易证明，在一般情况下，模型拟合优度系数在0.5与1之间。当L2=0.5时，说明利用分类预测模型并没有提高预测精度；而当L2=1时，说明分类模型将购买者与非购买者完全区分开了。将指标二进行变换，可以得到： L2=（a1/a+b1/b）50% =50%+（a1/ab2/b）50% 一般来说，a1/ab2/b 显然大于0。因为根据我们的目标利用模型挑选出来的人中，购买者的比例与原始人群相比有所提

5、高，也就是： a1/（a1+b2）a/（a+b）（1）其中，模型的左边是利用模型挑选出的人群中购买者所占的比重，模型的右边是原始人群中购买者所占的比例。将式（1）两边同乘以（a1+b2）（a+b），经过整理可以得到： a1/ab2/b 同理，可以得到： b1/ba2/a0，并且容易得到： a1/ab2/b = b1/ba2/a （2）本文将a1/ab2/b或b1/ba2/a称为模型的识别能力因子，识别能力因子越大，则模型的挑选能力越高，越能够符合商家的需要。容易得到，能力识别因子在0与1之间。当能力识别因子等于0时，利用模型挑选出的人群中购买者占的比例与原始人群相等，模型没有起到应

6、有的挑选能力的作用。而当模型识别能力因子等于1时，挑选出的人群全部是购买者或非购买者，也就是说将购买者与非购买者完全分开，当然这是一种理想情形，实际上是不可能达到的。二、评价模型设有m个属性（比如性别、年龄、以往购买情况等），每个属性由一定的水平构成，通过某种规则将每个属性的各个水平赋予一定的值，设Xki表示第j个人的第k个属性对应的水平，将该水平赋予一定的数值Ukj （比如如果第k个属性是性别，如果第j个人是男，那么属性对应的水平就是男性，根据购买倾向等可以将男性赋予一定的数值）。对于第j个人，若U1j+U2j+UmjP，则判断第j个人属于购买者，否则判断为非购买者，U1j+U2j

7、+Umj称为第j个人的得分，P称为临界值。假设共有m个属性，假设第i个属性共有ki个水平，分别赋予一定的数值：U（i，1），U（i，2），，U（i，ki）。如果当每个属性的水平以及临界值取以下值时：U*（i，1），U*（i，2），U*（i， ki）；P* 使模型评价标准取最大值，即 L2=max（a1/a+b1/b）50% =50%+max（a1/ab2/b）50% 或者使模型识别能力取最大值，即max（a1/ab2/b），则称U*（i，1），U*（i，2），，U*（i，ki）；P*为模型的一个最优解。三、赋植方法利用统计的方法假设属性A中的j水平有t比例的人属于购买者，则称A属性j

8、水平对购买的隶属程度为t。将t值赋予j水平，依据同样的方法，则可以得到每个属性各个水平的赋植。利用max L2=max（a1/a+b1/b）50%或max（a1/ab2/b）求出P值。对于第i个人，若 U1i+U2i+UmiP，则判断此人为购买者，否则判断为非购买者。可以求出属性A的重要程度=da/d。其中，da=属性A中各水平赋值的标准差，d表示所有属性水平标准差之和。此种方法比较简单，经济意义也比较明显。但这种方法也有比较明显的缺陷：各个属性（指标）之间不能有强的相关性，没有考虑到属性之间的交互影响，得到的解有可能不是最优解等。利用不等式及定义对各水平进行比较精确的赋值此种

9、方法要求将每个属性的水平赋予合适的值，赋值的范围从-到+。规则是若第i个人 U1i+U2i+UmiP 则判断此人为购买者，否则判断此人为非购买者。利用以下目标求出每个属性各个水平以及P的值： max L2=max（a1/a+b1/b）50%或max（a1/ab2/b）其中max（a1/a+b1/b）与max（a1/ab2/b）是等价的。为了提高算法的可行性，本文提出并证明以下两点结论：（1）结论一在一个属性中，给各个水平赋值，有意义的不是各个水平赋值的大小，而是要看各个水平之间差距的大小。也就是说，在一个属性中，给每个水平同时加上一个常数，不改变分类结果。可以证明以下结论：假设U

10、*（i，1），U*（i，2），U*（i，ki）； P*是分类模型的最优解，其中i=1，2，m。则对每个属性各水平的以下赋值：U*（i，1） +ai，U*（i，2）+ai，U*（i，ki）+ai ；P*+a1+a2+am，i=1，2，m也是分类的一个最优解，其中 a1，a2，am是常数。可以这样来证明：对于任意第j个人根据第一种赋值方法即U*（i，1），U*（i，2）， U*（i，ki）；P*，其中i=1，2，m 来判断是购买者（如果是非购买者结论也是一样的），则 U*1j+U*2j+U*mj P* 那么采用赋值方法：U*（i，1）+ai，U*（i，2）+ai， U*（i，ki）+ai；P

11、*+a1+a2+ +am，i=1，2，m，因为不等式两边同时加上一个常数不改变不等号方向，所以同样可以得到：（U*1j+a1）+（U*2j+a2）+（ U*mj+am）P*+a1+a2+am 也就是说第二种赋值方法没有改变任何人的分类，所以若第一种赋值方法：U*（i，1）， U*（i，2），U*（i，ki）；P*，其中i=1，2，m能够使L2 达到最大，L2=max（a1/a+b1/b）50%，或使模型的识别能力达到最大：max（a1/ab2/b），则第二种赋值方法： U*（i，1）+ai，U*（i，2）+ai，U*（i， ki）+ai；P*+a1+a2+am，i=1，2， m也能够使L2或

12、模型的识别能力达到最大。所以说，若U*（i，1），U*（i，2），U*（i，ki）； P*，其中i=1，2，m是分类模型的一个最优解；则第二种分类方法：U*（i，1） +ai，U*（i，2）+ai，U*（i，ki）+ai ；P*+a1+a2+am，i=1，2，m，并且a1，a2，am是常数，也是分类模型的一个最优解，第一个最优解与第二个最优解是等价的。利用第一个结论，可以令每个属性中的其中一个水平为零，这样做并不改变模型的识别能力。在实际应用中，一般可以令每个属性中购买倾向最小的水平赋予的值为0，因为在模型中，是大于临界值为购买者，因此，认为其它所有的水平值都大于0是比较合理的。（

13、2）、结论二若U*（i，1），U*（i，2），U*（i，ki）； P*是分类模型的最优解，其中i=1，2，m；则aU*（i，1），aU*（i，2），，aU*（i，ki）；aP*也是分类模型的一个最优解，其中a是不等于0的常数。可分两种情况来证明：第一种情况，a0 对于任意第j个人，假设根据第一种赋值方法：U*（i，1），U*（i，2）， U*（i，ki）；P*，其中i=1，2，m判断为购买者，即，根据第一种赋值方法可以得到 U*1j+U*2j+U*mj P* 因为不等式两边同时乘以一个正数，不等号方向不变。因此，有 aU*1j+aU*2j+aU*mj aP* 也就是说利用第二种赋值方

14、法对任何一个人的判断与第一种方法都相同。因此，若第一种方法使模型的识别能力达到最大，则第二种方法也同样使模型的识别能力达到最大。所以说，若U*（i，1），U*（i，2 ），U*（i，ki）；P*，其中i=1，2，m是分类模型的一个最优解，则 U*（i，2），aU*（i，ki）；aP*，其中i=1，2，m也是分类模型的一个最优解。第二种情况：a0 对于a0的情况，只需改变一下判断规则（大于或等于临界值时为非购买者，小于临界值时为购买值），则利用类似的方法，同样可以证明，若U*（i，1），U*（i，2），U*（i， ki）；P*，其中i=1，2，m是分类模型的一个最优解，则U*（i，2）， aU*（i，ki）；aP*，其中i=1，2，m也是分类模型的一个最优解。一般情况下，可以限制a0，这样判别规则就不用改了。因为在结论一中，已经将各个水平限制在大于等于0的范围内，并且每个属性中购买倾向最小水平的赋值为零。因此，一般来说，临界值必然大于0。否则就会出现只要出现某种水平，就预测为购买者的情况。因此，总可以在不等式的两边同时乘以一个常数，使临界值P为常数，这样并不改变模型的识别能力。每个属性水平的取值可以限制在不超过P的范围内，否则会出现只要出现某个水平的值，就必须判断为购买者的情况。可以取P=10，令每个属性中购买倾向最小水平的赋值为

展开阅读全文