2-1京津冀地区商务服务业驱动因素及差异研究

上传人:gg****m 文档编号:217759094 上传时间:2021-12-03 格式:DOCX 页数:29 大小:464.02KB
返回 下载 相关 举报
2-1京津冀地区商务服务业驱动因素及差异研究_第1页
第1页 / 共29页
2-1京津冀地区商务服务业驱动因素及差异研究_第2页
第2页 / 共29页
2-1京津冀地区商务服务业驱动因素及差异研究_第3页
第3页 / 共29页
2-1京津冀地区商务服务业驱动因素及差异研究_第4页
第4页 / 共29页
2-1京津冀地区商务服务业驱动因素及差异研究_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《2-1京津冀地区商务服务业驱动因素及差异研究》由会员分享,可在线阅读,更多相关《2-1京津冀地区商务服务业驱动因素及差异研究(29页珍藏版)》请在金锄头文库上搜索。

1、2-1京津冀地区商务服务业驱动因素及差异研究京津冀地区商务服务业驱动因索及差异研究基于经济普查数据的随机森林与lasso探索分析北京市统计局、国家统计局北京调查总队李刚、范静、李冬浩摘要商务服务业发展是京津冀地区协同发展的重要载体。在当前京津冀一体化背景下,研究 京津冀地区商务服务业的驱动因素及差异,有助于明确本区域未來发展方向与思路。本文 利用第二次经济普查商务服务业企业微观数据,选取了人员、资产、信息技术等指标,经 过数据筛选和分箱预处理后,进行相关性分析、分布探索和可视化描述。在前期分析基础 上,利用两种分箱数据对随机森林、boosting等六种挖掘方法进行十折交义验证,经过比 较筛选,

2、选取MDLP炳分箱数据、随机森林及lasso冋归,确定两种模型的最优参数,并 对模型的预测精度和计算效率进行比较。木文的主要结论有:京津冀地区商务服务业的驳动因索重要性排序基木一致,人力资本 和资产是最主要的驱动因素;驱动因素对不同地区的影响程度差异较大,各因素对北京的 影响程度均高于天津和河北,信息技术和人员索质差异更为明显;京津冀地区协同发展程 度低于江浙沪地区,实现京津冀地区商务服务业一体化发展还有很长的一段路要走。本文 对优化资源配置,实现地区差杲化、协同化发展具有可借鉴性,并为普查资料的开发利用 提供了一种新的思路。关键词:京津冀,商务服务业,交义验证,MDLP爛分箱,随机森林,lo

3、ss。回归目录一、问题的提出及研究综述1(一)问题的提出1(二)研究综述1二、变量选取及数据预处理1(一)基础数据悄(二)变量的选取31. 因变量的选取32. 自变量的选取3(三)数据预处理3三、数据探索分析及可视化5(一)相关性探索5(二)分布探索61. 单变量的分布探索62. 双变量的分布探索8四、京津冀地区商务服务业发展的驱动因索及差异性分析9(一)北京市商务服务业驱动因素建1. 建模方法介绍92. 交叉验证评价建模方法93. 随机森林重要性分析104. lasso回归系数分析125. 随机森林与lasso回归的优劣对比13(二)京津冀地区商务服务业差异分析141. 京津冀地区驱动因素差

4、异142. 基于洛伦兹曲线的地区产业集中度差异分析14(三)模型的结果分析15(四)模型意义及下一步研究计划16五、京津冀地区商务服务业发展存在的问题及政策建议16(一)存在的问题16(二)政策建一、问题的提出及研究综述1(一)问题的提出1(二)研究综述1二、变量选取及数据预处理1(一)基础数据情况1(二)变量的选取31 因变量的选取32.自变量的选取3(三)数据预处理3三、数据探索分析及可视化5(一)相关性探(二)分布探索61 单变量的分布探索62.双变量的分布探索8四、京津冀地区商务服务业发展的驱动因素及差显性分析9(一)北京市商务服务业驷动因素建模91. 建模方法介绍92. 交义验证评价

5、建模方法93. 随机森林重要性分析104. lasso回归系数分析125. 随机森林与lasso回归的优劣对比13(二)京津冀地区商务服务业差异分析142.基于洛伦兹曲线的地区产业集中度差异分析14(三)模型的结果分析15(四)模型意义及下一步研究计划16五、京津冀地区商务服务业发展存在的问题及政策建议16(一)存在的问题16(二)政策建议17据作为数据源。数据共包含90多力个样 本,每个企业样本数据中包含56个指标。指标包含分类变量和连续变量两类。分类变量 包括行政区划代码、行业代码、登记注册类型、执行会计制度类别、机构类型、控股情 况、营业状态等。连续变量包括从业人员不同学历人数、从业人员

6、数量,资产、存货、所 有者权益、各类资本、营业利润、各项费用、工资福利等财务报表数据,以及计算机数 量、电子商务情况等。我们选取上述数据中行业代码属于商务服务业的35多万条数据进行预处理及建模。基 础数据情况如表1所示。全国商务服务业企业数占服务业总数的比重接近40%,京津冀地 区商务服务业企业数占全国商务服务业企业数的16%,其中北京商务服务业企业数量较 大,分别为天津、河北的4. 9倍和7. 5倍。农1基础数据情况地区服务业数据量商务服务或全国9069043558(京津冀地区141463563(北京市102094420;天津市2235786河北省1701260000-unoo40000一2

7、0000一0-I I行业代码从全国商务服务业企业按行业代码分类柱状图(图1)看到,企业数量排名前四的行业 为:广告业(代码:7440)、社会经济咨询(代码:7433)、其他专业咨询(代码: 7439)和资产管理(代码:7412)。图1全国商务服务业企业按行业代码分类柱状图2据作为数据源。数据共包含90多万个样本,每个企业样本数据中包含56个指标。指标 包含分类变量和连续变量两类。分类变量包括行政区划代码、行业代码、登记注册类型、 执行会计制度类别、机构类型、控股情况、营业状态等。连续变量包括从业人员不同学历人数、从业人员数量,资产、存货、所有者权益、各类资本、营业利润、各项费用、工资 福利等财

8、务报表数据,以及计算机数量、电子商务情况等。我们选取上述数据中行业代码属于商务服务业的35多力条数据进行预处理及建模。基 础数据悄况如表1所示。全国商务服务业企业数占服务业总数的比重接近40%,京津冀地 区商务服务业企业数占全国商务服务业企业数的16%,其小北京商务服务业企业数量较 大,分别为天津、河北的4.9倍和7.5倍。表1基础数据情况地区全国京津冀地区服务业数据量906904141463商务服务哑rar3558(563(北京市河北省1020942235717012420:8656图1全国商务服务业金业按行业代码分类柱状图2据作为数据源。数据共包含90多万个样本,每个企业样本数据中包含56

9、个指标。指标 包含分类变量和连续变量两类。分类变量包括彳亍政区划代码、行业代码、登记注册类型、 执行会计制度类别、机构类型、控股情况、营业状态等。连续变量包括从业人员不同学历 人数、从业人员数量,资产、存货、所有者权益、各类资本、营业利润、各项费用、工资 福利等财务报表数据,以及计算机数量、电了商务情况等。我们选取上述数据中行业代码属于商务服务业的35多万条数据进行预处理及建模。基 础数据悄况如表1所示。全国商务服务业企业数占服务业总数的比重接近40%,京津冀地 区商务服务业企业数占全国商务服务业企业数的16%,其中北京商务服务业企业数量较 大,分别为天津、河北的4. 9倍和7. 5倍。表1基

10、础数据悄况地区服务业数据量商务服务或全国9069043558(京津冀地区141463563(1 1 亠 1 , 北乐巾102094420:天津市2235786河北省1701256山时兽呂豈翌二w占席竺各苹絃芾思侶吉行业代码从全国商务服务业企业按行业代码分类柱状图(图1)看到,企业数量排名前四的行业 为:广告业(代码:7440)、社会经济咨询(代码:7433)、其他专业咨询(代码: 7439)和资产管理(代码:7412)。图1全国商务服务业金业按行业代码分类柱状图2据作为数据源。数据共包含90多万个样本,每个企业样本数据中包含56个指标。指标 包含分类变量和连续变量两类。分类变量包括彳亍政区划代

11、码、行业代码、登记注册类型、 执行会计制度类别、机构类型、控股情况、营业状态等。连续变量包括从业人员不同学历 人数、从业人员数量,资产、存货、所有者权益、各类资本、营业利润、各项费用、工资 福利等财务报表数据,以及计算机数量、电了商务情况等。我们选取上述数据中行业代码属于商务服务业的35多万条数据进行预处理及建模。基 础数据悄况如表1所示。全国商务服务业企业数占服务业总数的比重接近40%,京津冀地 区商务服务业企业数占全国商务服务业企业数的16%,其中北京商务服务业企业数量较 大,分别为天津、河北的4. 9倍和7. 5倍。表1基础数据悄况地区服务业数据量商务服务或全国9069043558(京津

12、冀地区141463563(北京市102094420;天津市2235786河北省1701260000-unoo40000一20000一0-I I行业代码从全国商务服务业企业按行业代码分类柱状图(图1)看到,企业数量排名前四的行业 为:广告业(代码:7440)、社会经济咨询(代码:7433)、其他专业咨询(代码: 7439)和资产管理(代码:7412)。图1全国商务服务业企业按行业代码分类柱状图2据作为数据源。数据共包含90多万个样本,每个企业样本数据中包含56个指标。指标 包含分类变量和连续变量两类。分类变量包括行政区划代码、行业代码、登记注册类型、 执行会计制度类别、机构类型、控股情况、营业状

13、态等。连续变量包括从业人员不同学历人数、从业人员数量,资产、存货、所有者权益、各类资本、营业利润、各项费用、工资 福利等财务报表数据,以及计算机数量、电子商务情况等。我们选取上述数据中行业代码属于商务服务业的35多力条数据进行预处理及建模。基 础数据悄况如表1所示。全国商务服务业企业数占服务业总数的比重接近40%,京津冀地 区商务服务业企业数占全国商务服务业企业数的16%,其小北京商务服务业企业数量较 大,分别为天津、河北的4.9倍和7.5倍。表1基础数据情况地区全国京津冀地区服务业数据量906904141463商务服务哑rar3558(563(北京市河北省102094223571701242

14、0:8656图1全国商务服务业金业按行业代码分类柱状图2据作为数据源。数据共包含90多万个样本,每个企业样本数据中包含56个指标。指标 包含分类变量和连续变量两类。分类变量包括彳亍政区划代码、行业代码、登记注册类型、 执行会计制度类别、机构类型、控股情况、营业状态等。连续变量包括从业人员不同学历 人数、从业人员数量,资产、存货、所有者权益、各类资本、营业利润、各项费用、工资 福利等财务报表数据,以及计算机数量、电了商务情况等。我们选取上述数据中行业代码属于商务服务业的35多万条数据进行预处理及建模。基 础数据悄况如表1所示。全国商务服务业企业数占服务业总数的比重接近40%,京津冀地 区商务服务业企业数占全国商务服务业企业数的16%,其中北京商务服务业企业数量较 大,分别为天津、河北的4. 9倍和7. 5倍。表1基础数据悄况地区服务业数据量

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号