“拍照赚钱”的任务定价-)

资源描述

1“拍照赚钱拍照赚钱”的任务定价的任务定价摘要摘要近年来，“拍照赚钱”这种自助式服务模式逐步进入我们的生活，本文正是基于这种服务模式来研究其任务定价问题。为了帮助任务项目确定科学的定价方案，需要建立 K-MEANS聚类分析模型来对影响任务能否完成的因素进行分析。针对问题一，这是一个数据挖掘的相关问题，在庞大的数据下，需要对任务经纬度与会员位置等相关因素进行数据挖掘，并得到它们满足的函数关系。因此，本文采用了基于K-MEANS 聚类分析的模型，得到了任务失败的原因：并未考虑会员位置与任务位置距离结合而定价，导致会员并未对一些任务进行接取。针对问题二，本文根据会员所分配任务结合问题一的聚类分析模型，提出一个黑箱理论模型。依据问题一完成的任务进行回归拟合，得到一个函数关系式，再加上问题二继续引入未完成的任务位置，将未完成与完成的点同时展现在一个散点图中。以此为基础，做出新的任务定价方案，在与原方案的对比中新方案中未完成任务定价比之前任务定价符合了问题一未考虑的距离因素，有更高的合理性。针对问题三，基于前二问，在第三问打包处理上本文根据会员任务限额采取 K-MEANS聚类分析，将所有任务进行打包，打包任务数量范围为2,5。之后引入捆绑系数和节省时间系数，求出打包后的定价修改情况，得到修改前后定价变化，发现打包后会对用户完成任务产生积极的影响。针对问题四，用 MATLAB 绘制其散点图，通过观察发现任务集中在了 1 个大区域和 2 个小区域。再将附件二的会员位置与任务位置结合在一起，会员位置覆盖了所有的任务位置，以此为基础，找出任务的中心点，并以之前设计的定价模型为基础进行模型建立，对所有任务进行定价，与之前完成的相似位置的任务进行对比，发现该定价模型会极大改善任务完成度。关键词：关键词：K-MEANSK-MEANS 聚类分析模型；回归拟合；黑箱理论模型；捆绑系数聚类分析模型；回归拟合；黑箱理论模型；捆绑系数2一一问题背景问题背景在移动互联网席卷的同时，“拍照赚钱”这种自助服务模式也逐渐推广。用户通过下载APP 客户端，并注册成为其会员，然后从 APP 上领取需要拍照的任务项目，最后通过完成领取的任务以获得 APP 对任务所标定的酬金。这种新型的以移动互联网为核心的自助式劳务众包平台，在为许多企业提供各种各样的商业检查和信息搜集的同时，在传统的市场调查方式的基础上又降低了调查成本，并且合理有效地保证了调查数据科学性和真实性，大大的缩短了调查的周期。但在此同时，APP 中的任务定价又极大地影响着在这种模式下的商品检查能否成功。二二问题重述问题重述由于在“拍照赚钱”自助服务模式下的商品检查的成功与否受到任务定价的影响，所以为了更好的确定科学合理的任务定价方案，本文以此提出了以下问题：（1）以附件一中项目的信息为基础，研究任务定价的规律，并分析为什么部分任务未完成。（2）首先为附件一中的任务项目设计合理的任务定价方案，然后与原方案进行对比。（3）在现实生活中，很多用户可能会同时争相选择地理位置比较集中的多个任务，有种做法是将这些任务联合起来在一起打包发布，所以需要修改前面的定价模型，并研究对最终的任务完成情况所产生的影响。（4）为附件三中的新项目做出合理的任务定价方案，并对该方案实施效果作出评价。三三问题分析问题分析3.13.1 问题一的分析问题一的分析按人们习惯思维，人们总会根据自身位置与目标位置作对比，首先将离自己近的目标完成而且尽量避开存在竞争且距离较远的目标。因此，本文在未进行分析前进行任务失败原因的推测：任务失败的原因在于存在竞争的点有着提前被人完成的风险而不具备竞争的点距离却较远虽然价格比较高但显然不划算，因此会员选择稳妥且距离较近的目标。问题一本文认为是一个数据挖掘的过程，需要对附件 1 与 2 给出的任务经纬度、会员位置与任务限额等因素进行数据挖掘。其中，需要首先对附件 2 给出的所有会员进行筛选，将其中信誉低、任务限额少的去除，然后再对相关度最大的会员位置与任务位置进行挖掘，分析未完成任务、完成的任务与会员位置是否存在一定的差异，以会员位置作为中心点，建立K-MEANS 聚类分析模型。3.23.2 问题二的分析问题二的分析问题二是针对问题中未完成任务提出新的定价方案，也就是说要在完成的任务的定价基础上进行模型的设计，因此本文联想到黑箱理论模型，设计了一个基于黑箱理论的定价模型。33.33.3 问题三的分析问题三的分析问题三要求对位置较近的任务进行打包解决用户互相争抢的问题。首先涉及到的问题就是如何合并，题目有些模糊，这也是我们需要考虑的，即如何合并，怎样合并。本文按任务的经纬度分布合并，本文将经纬度距离小于 0.01 的合并在一起，因为观察发现距离在小于0.01 的时候价格极为相似，由于进行了合并，价格就要被打包之前的便宜。接下来需要考虑就是价格的问题。合并价格便宜，因为打包会节省用户的争抢时间以及提高工作效率，按照工资与时间成线性相关的关系，因此本文采集相关数据得到了用户节省时间系数，并根据之前的定价模型，引入一个打包系数，将模型进行修改。3.43.4 问题四的分析问题四的分析问题四即是要求采用之前构建的定价模型对新的一组任务进行定价并进行评价，在求定价式只需将任务位置引入模型，即可进行求解，得到所有的定价。而对求解的定价进行评价，可以引入之前完成的任务的数据，将位置相似的任务进行定价对比，求出定价相似度，如果大于一个值，那么就认为定价合理，任务完成度将会很高。四四模型假设与符号说明模型假设与符号说明4.14.1 模型假设模型假设1.假设分配任务只考虑高信誉与任务限额多者。2.假设不考虑高楼大厦等高度对距离产生的影响3.假设距离计算不因障碍物等产生影响。4.假设工作者在完成任务过程中并未出现中途停止休息的情况。4.24.2 符号说明符号说明r-以中心点为原点的圆半径Ti-第 i 位会员任务时间限制度aij-第 i 位会员分配的任务数ki-任务难度系数其余符号会在使用前说明4五五模型的建立与求解模型的建立与求解5.15.1 问题一问题一5.1.15.1.1 模型建立模型建立通过 MATLAB 把附件一所给的数据做成三维图，并适当调整其观察角度，可以得到以下几幅图：图 1 未完成任务的三维图图 2 完成任务的三维图5图 3 未完成任务的直观图图 4 完成任务的直观图通过观察这些图，并将图 3 与图 4 进行对比，可以清晰地发现，任务 gps 经、纬度对任务能否完成有着明显的作用，以此为基础对影响任务能否完成和任务定价规律展开研究。本文根据上面的发现确定了建立 K-means 聚类分析模型。K-means 算法正是基于距离的算法，有很强的典型性，该算法以距离作为评价相似性的指标，也就是认为两个对象之间的距离越近，它们的相似度也就越大。K-means 算法最终要把得到的紧凑且独立簇作为最后的目标，因为这种算法中，簇是由距离靠近的对象组成的。K-means 聚类分析算法的误差平方和准则公式：2k1ij)-x(ijSxiV在这个公式中：S 包含 k 个聚类子集 S1,S2,Sk；各个聚类子集中的样本数量分别为n1,n2,nk；各个聚类子集的均值代表点即聚类中心分别为1，2，k。在这里我们先随机的选取任意的 k 个对象作为初始聚类的中心，以它们作为一个簇。这6种算法根据在每次迭代中对数据集中剩余的对象与各个簇中心的距离将这些对象重新赋予最相近的簇。最终以任务 gps 的经纬度、任务标价、会员所处地理位置、预定任务限额和信誉值这六个因素作为初始类聚类中心点。该算法步骤如下2:(1)任选 k 个样本特征矢量作为初始聚类中心：z1(0),z2(0),z3(0),z4(0),，zk(0)(2)将待分类的样本特征矢量集xi中的样本逐个按最小距离原则分划给 k 类中心的某一类。(3)计算重新分类后的各类中心距离：zj(n+1)=1njn+1Xi WJk+1xi?(4)如果 zj(n+1)近似等于 zj(n)(j=1,2,3,，k)，则结束；否则 k=k+1，转至步骤 2继续循环。当我们将所有数据对象考察完之后，这一次的迭代运算便已完成，新的聚类中心也已被计算出来。若是在这一次迭代前后，j 的值未发生变化，则说明算法已经收敛。基于前面的处理数据，本文通过 MATLAB 分别绘制出了完成任务、未完成的任务与会员位置的散点图，并分别将前两者与第三者合并，得到了 2 副关系图，发现 2 个图之间并未存在很大的差异，会员位置基本全部覆盖了任务的位置，只存在个别未覆盖点。为了进行验证，需求解一个二元回归拟合函数。首先根据数据以及描绘的散点图观察大体趋势，确定大体函数，但从密密麻麻的散点当中，无法得到明确函数关系，可以确定的是这些散点满足的是一个非线性的函数关系：y=a1x6+a2x5+a3x4+a4x3+a5x2+a6x+a7ea8x+a95.1.25.1.2 模型求解模型求解通过拟合散点图，求解出了函数关系式为：y=0.004x6 0.736x5+46.68x4 1567x3+29424x2 2987x+6e0.34x拟合度 R=0.863。在此函数关系式下即可得到一个 K-MEANS 聚类分析模型，通过关系式以及散点图本文确定以下的点作为中心点：(24.80413,113.605786)(22.262784,112.79768)(22.92814,114.081898)(22.993463,114.28544)(22.947097,113.679983)(22.577792,113.966524)然后根据这些中心点分别映射未完成与完成的任务的所有距离，并将他们的价格作比较。距离本文所用为传统的欧几里得距离：)()(21221yyxxO。然后通过 MATLAB 将所有未完成与完成任务与中心点距离进行求解，得到了所有距离，依据此我们建立一个价格与距离函数关系，依据常识，价格应当与距离成正相关的关系。根据前文建立的函数模型，本文对任务距离与定价进行了求解，得到了一个表格如下：表 1 完成任务与未完成任务的定价表未完成任务距离定价完成任务距离定价0.009121660.004662700.012075750.006633750.009407690.006633750.008578690.009086720.009339670.009474750.009454730.009865750.004865730.0101987570.007948670.009086725.1.35.1.3 未完成任务的原因分析未完成任务的原因分析依据模型求解中表格发现，任务与距离并未呈现线性相关的关系，用户在考虑到自身与任务距离和定价之间存在不相匹配的关系，因此选择任务距离较近定价较高的任务，而放弃了其他的任务。因此未完成的任务原因即可归纳为：未完全考虑任务与会员的距离而进行了定价。完成任务的距离和定价也未呈现增长的趋势，可以大概认为任务完成难度即拍照所需时间存在差异。因为缺乏数据，无法对任务完成难度进行求解。5.25.2 问题二问题二5.2.15.2.1 模型建立模型建立本文采用基于黑箱模型的任务定价策略，本文先对第一问得到的信息进行汇总，得出完成的任务经纬度满足的关系式，与会员位置满足关系式进行对比3，之后，再引入会员任务限额，本文依旧排除信誉度低和任务限额少并将经纬度与其他会员位置差别较大的会员，因为附件 1 中任务只有 835 个，而会员有 1830 个。本文将信誉度小于 100 及任务限额小于 10的筛选掉，这是主观上根据表中数据进行判断的。将筛选后的会员分配任务，按照任务限额的关系，得到关系式(n 代表总任务数、m 代表筛选后会员数量、ai代表会员任务限额、aij代表会员接受任务数)：aij=ai1mai?n得到所有会员分配的任务数，详情见支撑材料。分配好任务就避免了出现工作者畏惧任务被抢的心理问题的出现。然后，再根据完成的任务本文依据问题一制作的散点图拟合出了任务的位置。下图为具体的得到的实际会员任务分配数：表 2 会员位置、任务限额与分配任务数

展开阅读全文

温馨提示：

金锄头文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。