众包任务定价运用于 项目定价规律摘要:随着信息技术与智能移动终端的飞速发展和普及,“互联网+”时代 飞速到来,人们开始新的生活方式同时也为软件开发模式带来了革新的机遇, 本文中提到的是一款通过拍照赚钱来完成任务赚取酬金的自助服务模式,平台的 运行核心为APP,不同于传统的市场调查方式,APP中的核心要素是任务定价 当此任务的任务定价相对较高时,会员会更倾向于进行该任务的调查,因此,我 们对定价因素与会员完成情况进行了分析,从而更加节约总任务成本,又使不同 地区会员倾向于接取发布的任务关键词:互联网+ 软件众包 聚类分析 动态规划 层次分析法 数 据挖掘一、问题重述随着信息技术与智能移动终端的飞速发展和普及,“互联网+”时代飞速到 来,人们开始新的生活方式同时软件开发模式带来了革新的机遇,通过拍照赚 钱来完成任务赚取酬金的自助服务模式的APP,其核心要素是任务定价针对问题一,我们使用BDP(商业数据平台)对附件一中的各个变量进行了绘 图,定位,进行数据预处理去除异常数据,发现未完成区域多集中在广州市的白 云区,佛山市和深圳市衡量数据点间的相似性,采用数据挖掘中最远距离函数 进行相似性度量,通过任务执行情况和任务标价的之间的关联图采用R型聚类分 析的方法,得到任务未完成是任务价格,天气原因,地理位置,人口密度,突发 状况为辅的五个因素所决定的。
针对问题二,影响定价的因素是多样的,总结了九个因素,更全面的分析问 题,据此来制定新的定价方案因此采用了层次分析法来构建数学模型,对找到 的因素进行了层次分析,得到了其在新的定价方案中的权重最后将新的方案和 原方案进行比较,虽存在着误差,可以增加会员的任务完成度针对问题三,随机抽取某段交通网络系统,并在附件二数据中随机抽取 20 名会员,根据其到任务点的实际距离建立模型,通过对模型的求解得出最优调度 据此,可以在任务打包分配的时候使用该模型,减少了任务时间,提高了效率, 增加任务完成的成功率针对问题四,采用了层次分析法数学模型得到的新定价方案,对附件三中的 部分数据进行了处理将得到的数据与附件一中提供的真实数据进行了比较,发现 该方案实施效果较好未完成任务较多的区域的价格稍高,一定程度上可以增加 任务的完成率局部灵敏度分析法对其进行分析,发现虽然经过改进,但任务复杂状况依然 影响任务的完成度,虽然灵敏度与地理位置有较大关系,但是当任务复杂度较低 时,地理位置对任务完成度的影响较大,而其他因素对任务完成度的影响不大地理信息数据,主要以大地坐标为基础,即地球经纬度经纬度数据的处理 及可视化,与常见的平面坐标数据具有较大的差异,处理起来也相对复杂。
本章 基于众包平台的任务数据和注册会员数据,介绍了基于经纬度的地理信息可视化 距离与相关特征指标的计算、模型的构建与实现等,从而为地理信息数据的处理 及建模提供一定基础下面将从案例背景、案例目标及实现思路、数据获取、数 据可视化、指标计算、模型构建与实现等方面进行详细介绍二、 案例背景“拍照赚钱”是移动互联网下的一种自助式服务模式用户下载App,注册 成为 App 会员,然后从 App 上领取需要拍照的任务(如去超市检查某种商品的上 架情况),赚取App对任务所标定的酬金这种基于移动互联网的自助式劳务众 包平台为企业提供各种商业检查和信息搜集服务,相比传统的市场调查方式可以 大大节省调查成本,而且有效地保证了调查数据的真实性,缩短了调查周期因 此App成为该种平台运行的核心,而App中的任务定价又是其核心要素如果定 价不合理,则有的任务就会无人问津,从而导致任务的失败附件一是一个已结 束项目的任务数据,包含了每个任务的位置、定价和完成情况(“1”表示完成,“0”表示未完成);附件二是会员信息数据,包含了会员的位置、信誉值、参考其信誉给出的任务开始预订时间和预订限额,原则上会员信誉越高,越优先开 始挑选任务,其配额也就越大(任务分配时实际上是根据预订限额所占比例进行 配发的)。
附件一和附件二的表结构如表 1 和表 2 所示任务 任务 GPS号码 纬度任务 GPS 任务标经度 价任务执行情况22.566142113.98083A000166256822.686205113.94052A000265.5265222.576511113.95719A000365.583822.564840114.24457A000475811122.558887113.95072A000565.5752722.558999114.24131A000675067465.522.549003 113.97225 A000771 97表1已结束项目任务数据会会员会员预订预订任务员编GPS 经度信誉值GPS 纬度任务限额开始时间号B000122.947097113.676:30:0067997.38689983114B22.57113.961636:30:0037926.0002779265245416B23.19113.341396:30:0027953.0003245872720363B23.25113.31986:30:0025085.000459658756986表2 会员信息数据三、案例目标及实现思路本案例的主要目标包括掌握地理信息数据可视化基本技能,根据实际问题提炼分析指标并编程计算,构建分析模型及实现。
基本实现思路如下图1所示J郴卄:一中11応一$仃乳-十茸三Q:;:互歹帀I; 'f •炸(空)、任务平均价格(功、会员数量N:、会员平均信誉值伍4)、 会员硕订任务数量(23)、了 T■时间段歯列、丘33-645.6:48-7:03、7:06-7:21、t 7:24-7:59. 7:42-7:5-.凶0)吠谒川砰厂F■齐弊星fZ6-Z12: 一 :1 12讣看厂 」瓯冇弃m苛日"汁耳:愉 俩-i■■刊T副「「1 一兀用汗不旺讦讯「罚「 行数量,即12于指标+原定旳(train X),执行情况(皿_幻.训练支持向 量机模型,预测未完成任务重新定价后的执彳情祝(test.X. 12个指标翎定 竹-:2总E日工加 ‘附件一祕执行的任务〒八「V)与口个 「計、〔刃.占话肝■〒宀[日約曲泠芈数据輙附件一(酹姗) 和附件二冶员数据)故宿挖药4升P主二位競险 在同个区域(绘制地图)预测附件一未完成任务的 定血进行重新定价图1基本实现思路四、 数据获取与探索主要通过Python读取附件一的任务数据和附件二的会员数据,并将任务和 会员的位置信息在地图上可视化展示出来地图可视化主要采用Python第三方 包:folium。
地理信息可视化包folium的安装,可以通过命令pip ins tall folium实现4.1数据获取通过Python读取附一的任务数据和附件二的会员数据,利用folium包,依 次将任务和会员位置绘制在地图上,其中黑色圆点表示任务,红色圆圈点表示会 员示例代码如下:import pandas as pdA二pd.read_excel('附件一:已结束项目任务数据.xls')B二pd.read_excel('附件二:会员信息数据.xlsx')#2.导入地图可视化包import folium as f#利用map函数创建地图,参数依次为地图中心位置(纬度,经度)、地图 缩放大小、地理坐标系编码M=f.Map([A.iloc[0,1],A.iloc[0,2]],zoom_start=14,crs='EPSG3857')#利用Circle函数在地图上画圆圈,参数依次为半径大小(单位:米)、圆 心位置(纬度、经度)、颜色…for t in range(len(A)):f.Circle(radius=50, location=[A.iloc[t,1],A.iloc[t,2]], color='black',fill=True, fill_color='black').add_to(M)for t in range(len(B)):f.Circle(radius=50, location=[B.iloc[t,1],B.iloc[t,2]], color='red',fill=True, fill_color='red').add_to(M)#3•保存地图,html文件,可以在浏览器打开,比如360极速浏览器M.save('f.html')执行结果如图 2 所示。
从图可以看出,任务位置及会员位置均在同一个区域 上,并且任务与会员均相对集中,即具有聚集性同时,存在部分任务及会员远 离聚集中心,这些特点对指标的定义与设计具有较好的指导意义—■图 2 执行结果4.2指标计算探究影响任务定价的主要因素,是本案例的主要任务实际上,一个任务的 定价不仅与其周围的任务数量、会员数量有关,还应与其发布时间有一定的关系 通过分析数据,我们发现任务的发布时间有一定的规律,即任务从6:30分开始 发布第一批任务,之后每隔 3 分钟发布一批,最后一批的发布时间为 8:00根据 这些特点,我们可以设计相关指标并进行计算,下面给予详细介绍为了更好地理解指标的计算方法,便于编程计算下面通过图示的方法介绍 指标的具体计算过程如图 3 所示,圆圈代表任务,三角形代表会员,分布在同 一个区域上,位置均由经度和纬度确定以某个任务为圆心, 5 公里范围为半径 作一个圆5 结论为了对原定价方案与新方案进行比较,我们设计两个评价指标:1)任务完 成增加量,即未执行任务重新定价后将被执行的增加量;2)成本增加额第一 个指标的计算,我们通过计算的 12 个指标+附件一的任务定价,共 13 个指标数 据作为自变量,附件一的任务完成情况指标数据作为因变量,训练支持向量机分 类模型,并对附件一中未被执行的任务重新定价后进行分类预测(预测的自变量 为:未被执行任务的 12 个指标+神经网络预测的定价)。
为了更合理地度量被执 行的增加量,在支持向量机预测结果的基础上再乘以支持向量机的预测准确率 第二个指标的计算则直接利用新定价之和减去旧定价之和即可如何利用地理信息可视化包 folium 进行绘图及数据探索的基本技能,并根 据实际问题分析影响因素、设计指标及具体编程计算相关诸多细节,在此基础上 构建了分析模型及具体实现本案例对地理信息数据的可视化探索、数据处理、 指标设计与计算、模型构建与实现具有一定的参考意义参考文献:[1] 区块链环境下基于细粒度授权隐私保护的空间众包任务分配模型,高丽 萍; 程添; 高丽,小型微型计算机系统,2021-04-14[2] 集成加权软投票的众包真值推理方法,张桦; 沈菲; 蒋世豪; 张灵均; 徐宏,清华大学学报(自然。